工作职责
1.建立并优化数据处理流程,为模型开发准备所需数据。
2.将多模态大型模型的开发环境构建为 Docker 容器和/或 Python 虚拟环境,并安装所需的系统及 Python 软件包
3.调整多模态大型模型的架构、损失函数及训练策略,以满足目标应用对模型的需求。
4.训练或微调多模态大型模型,监控训练过程,并根据关键性能指标调整训练超参数。
5.利用现成的模型评估工具对模型性能进行评测,分析评估结果,并确定后续改进方案。
6.对模型进行剪枝和量化,在保证模型准确率的前提下降低内存占用并提升模型吞吐量。
7.使用主流模型部署工具在生产环境中部署模型。
岗位要求
1.拥有硕士学位及2年以上相关工作经验,或具有博士学位。
2.熟悉 Transformers、PyTorch、Python、Bash、Docker 及 Git 等工具。
3.具备开发大型语言模型及多模态大型语言模型(例如视觉语言模型)的实战经验。
4.熟悉视觉语言模型、大规模推理模型、强化学习及 AI 智能体的最新进展。
5.精通提示工程,擅长设计针对大型语言模型及多模态大型模型的提示。
6.具备优秀的问题解决能力及沟通能力。