工作职责:
对海量音频信息进行分析和信息提取。
岗位职责主要包括:
1. 方言语音识别,对视频等场景中的方言进行语音识别
2. 音频分类,音频事件检测,对音视频文件中的有效内容进行标签提取,特别是语音文字之外的信息提取;
3. 语种识别,说话人识别,提升已有系统在复杂场景(噪声,远场,混响)中的鲁棒性;
4. 说话人Anti-Spoofing,提升虚假音频攻防对抗的识别能力。
任职要求:
1. 硕士或及以上学历,计算机,信号处理、模式识别,自动化相关专业;
2. 了解声纹识别,语种识别,音频事件检测或语音识别领域的技术发展情况,掌握主流算法,有过开发实际系统或其中某一模块(前端、特征、建模、匹配)的经历;
3. 扎实的机器学习和模式分类功底;
4. 熟练掌握 C/C++或Python, 编程能力强;熟悉 Linux 环境开发;
5. 对Kaldi、Pytorch、TensorFlow(至少其一)熟练使用;
6. 参加NIST等评测比赛取的较好名次者优先;
7. 良好的沟通能力与团队协作精神;
8. 在ICASSP, INTERSPEECH, ASRU, CSL, Speech Communication等知名会议和期刊发表过论文者优先