岗位职责
1.代码复现与快速原型,阅读并复现实验室/社区发布的GitHub、HuggingFace项目或学术论文代码。基于业务场景进行二次开发,输出可运行的PoC或微服务。
2.大模型微调与推理,使用openai官方SDK以及LoRA/PEFT/QLoRA/bitsandbytes/DeepSpeed等库进行模型微调、量化与推理优化。
3.服务化与部署,选择并维护一个主流PythonWeb框架(Flask/FastAPI/Django任选其一)实现推理服务接口。
4.性能调优与排错,基于日志、Profiling工具定位性能瓶颈并提出优化方案。
5.技术分享与文档,用中英双语撰写技术方案、实验报告与用户文档。