岗位职责
1. 负责大型语言模型(LLM)和多模态大模型(MLLM)的研究与开发,包括模型预训练、理论创新、性能评估与优化;
2. 大模型训练数据构建, 训练策略迭代和调优,推动大模型涌现能力的实现与提升;
3. 参与大模型的对齐技术研究与优化,聚焦于解决模型在复杂指令遵循、推理、幻觉、工具使用等问题中的表现瓶颈,提升模型的实用性与可靠性;
4. 负责大型语言模型的微调、偏好对齐、知识增强等技术探索,积极跟进AIGC业内应用趋势,包括并不限于MoE、RLHF、Long context、RAG、Agent等方向;
5. 优化算法性能,提升系统在复杂场景下的鲁棒性与高效性;
6. 跟进前沿技术(如多模态大模型、推理模型、CoT、diffusion和flow matching等),推动技术落地;
7. 与软硬件团队协作,完成算法模块的工程化部署与测试。
任职要求 :
1. 计算机科学、人工智能、机器人学、数学等相关专业硕士及以上学历;
2.具有扎实的编程功底和 DL/ML 基础,熟悉LLM,MLLM大模型等训练和推理;
3. 精通至少一种主流深度学习框(PyTorch/TensorFlow),熟练使用C++/Python编程;
4. 具有自然语言处理、计算机视觉、 模型压缩和推理优化等领域的实际项目经验;
5. 较强的论文复现能力或算法创新能力,能快速实现并优化前沿技术方案;
6. 良好的团队协作与沟通能力,对技术落地有强烈热情。