公司名称:某科技公司
工作地点:上海
工作职责:
1.设计并开发实验评估大模型的扩展性和有效性,研究其在复杂性问题上的泛化性
2.管理大规模数据并创建可视化方法,设计基于LLM的新产品。
任职要求:
1、具备高效机器学习和深度学习的开发经验,了解AI生成模型框架,包括Transformer decoder、Diffusion等,了解RL和PEFT等。
2、理工科硕士或博士毕业,5年以上产业界经验,具备扎实的数理基础和良好的科研素养。
3、有数据流水线的设计和构建经验,有数据搜集和培育经验,以及模型性能的评估经验。
4、有复杂算法的设计、实现、分析和调优能力。
5、有在GPU集群上的训练和部署经验。
6、有在大型分布式系统上工作的经验。
7、熟悉Web开发,Python和数据库。