岗位职责
1.负责公司级人工智能工具链的整体架构规划、建设与持续治理,覆盖大模型微调/蒸馏、仿真环境、强化学习训练、自动化检验检测等核心子系统,打造端到端、高效、可复现的研发基础设施。主导大模型微调与蒸馏平台的设计开发,支持LoRA/QLoRA、Adapter、P-Tuning、MoE稀疏微调、知识蒸馏、量化感知训练等最新技术,实现千亿级参数模型在小时级内完成低成本微调与压缩。
2.构建多模态仿真与强化学习环境:对接IsaacSim、Gazebo、AirSim、CARLA、MuJoCo、Unity3D等引擎,统一场景管理、奖励设计、并行采样与回放系统,支撑机器人、电力系统仿真等业务的RL快速迭代。
3.设计并落地自动化检验检测流水线:集成模型对抗测试、鲁棒性评估、公平性检测、性能基准回归、安全扫描(PromptInjection、数据投毒)等工具。
4.打通工具链与MLOps、CI/CD、数据管线、模型仓库的接口,制定统一SDK、CLI、REST/gRPCAPI。
5.完成公司交办的其他工作任务。