岗位描述
1.参与垂直领域LLM定制与应用研发:基于主流开源基座模型开展领域语料处理(清洗/去噪/去重/切分)、指令数据构造与SFT微调,持续提升模型在典型任务上的效果、稳定性与可控性;2.参与VLM(视觉-语言模型)能力建设:围绕视觉理解、OCR/版面理解、视觉Grounding、图文对齐等方向,构建多模态指令理解与语义输出能力,支持智能体及工业/企业级应用场景;3.参与多模态推理和Agent能力构建:将视觉感知与语言指令转化为结构化语义表示与任务步骤,支持任务分解、工具调用与多步推理,提升模型在复杂指令下的执行可靠性与安全性;4.参与LLM/VLM推理服务与轻量化部署:协助完成模型量化(INT8/AWQ等)、推理加速、Batch与缓存策略优化,支持高并发、低延迟推理服务;探索云端与边缘侧的协同部署方案;5.参与构建多模态RAG系统:基于文本与图像等多模态信息,构建跨模态Embedding、检索与重排链路,结合图文知识库与业务规则,提升复杂与长尾问题覆盖能力,降低多模态场景下的模型幻觉风险,并参与评测与线上质量监控;6.参与大模型工程化与评测体系建设:搭建从数据处理、训练、评测到服务监控的基础工具链,建设数据规范、自动化评估指标与回归测试集,支持模型能力的持续迭代;7.跟踪LLM/VLM及多模态智能体方向的前沿研究进展,参与新技术验证与能力沉淀。