岗位职责
1.负责大语言模型架构设计、预训练及微调(SFT/RLHF);
2.负责通过数据清洗、模型创新(如Transformer改进)等技术优化模型性能,并优化分布式训练与推理效率;
3.负责各类NLP算法开发,包括实体抽取、文本分类、情感分类、文本比对、数据清洗等,负责集成RAG(检索增强生成)、Agent智能体等技术实现大模型场景化应用;
4.负责前沿技术探索,跟踪MoE架构、长上下文处理、强化学习训练等前沿方向;
5.负责处理海量结构化/非结构化数据,构建知识图谱或向量数据库,通过A/B测试与实验设计验证算法效果;
6.负责大模型性能优化与部署,适配昆仑、昇腾、NV芯片等硬件,应用模型压缩(量化、蒸馏)、Deepspeed框架等技术,提升训练与推理效;
7.负责跨团队协作与文档输出,与产品、解决方案团队协作推进技术落地,编写技术文档(设计/部署指南)确保成果可复现;
8.完成领导交办的其他工作任务。