岗位职责
1.负责多模态大模型的预训练、微调及性能优化,提升模型在文本、图像、语音等跨模态场景的融合能力;
2.设计并开发多模态生成式AI算法,实现模型在人机交互、内容理解等领域的实际应用落地;聚焦智能体流程中关键节点(如语音识别与合成、图像识别与问答、视觉文本联合推理、场景理解等),开发对应的算法模型或能力模块;
3.负责跟踪学术界与工业界前沿技术动态,开展模型结构创新及轻量化技术研究(如量化、剪枝等),减少模型幻觉问题;
4.负责构建多模态数据清洗、标注及增强标准流程,优化训练数据集质量,提升模型泛化能力;
5.负责模型框架设计与部署,负责算法模型在移动端或云端的推理优化;
6.负责算法的国产化硬件和框架迁移适配工作;
7.与产品、后端、前端、UI 等团队密切配合,将算法成果转化为用户可感知的能力服务,协助推动智能体产品整体演进;
8.完成领导交办的其他工作任务。