岗位职责
1. 负责大规模微调,包含但不限于参数更新的微调、优化器微调、数据增强的微调、正则微调等
2. 研究并实现基于RAG的知识增强技术,提升模型在特定领域的知识理解和生成能力。
3. 负责知识库的构建、维护和优化,包括知识抽取、知识融合、知识表示和知识检索等,支持模型的智能化应用。
4. 与跨部门团队紧密合作,参与项目需求分析、技术选型、模型选型等关键环节,推动项目顺利进行
5. 与产品团队紧密合作,将研发的技术成果应用于实际业务场景。
6. 负责数据的收集、清洗、预处理及特征工程,确保数据质量,提升模型的训练效果。
任职要求
1. 数学、计算机科学、人工智能、自然语言处理或相关领域硕士及以上学历,博士优先。
2. 熟练掌握Python编程语言,具备扎实的算法和数据结构基础,熟悉常见的机器学习算法(如CNN、RNN、Transformer等)及大模型架构。
3. 深入掌握至少一种深度学习框架(如TensorFlow、PyTorch等),具备大模型训练和调优经验者优先。
4. 对LLM、RAG、知识图谱、自然语言处理等技术有深入理解和实践经验,熟悉大模型的预训练、微调(SFT)、RLHF等流程。
5. 熟悉知识图谱的构建与应用,掌握知识抽取、知识融合、知识表示等技术,熟悉Neo4j、AllegroGraph等图数据库的使用。