任职要求
1、具备较强的工程能力,熟悉C/C++/Python,熟悉tensorflow/pytorch/onnx主流AI框架; 2、深入了解常见的LLM大模型,例如GPT、BERT、LLAMA等,理解内部模型结构原理和优化方法,具备相应的实践经验; 3、具备在CUDA/cuDNN/TensorRT/nccl等高性能库上实现和优化高性能算子的开发经验; 4、熟悉并行/异构计算体系结构,熟悉CPU/GPU/NPU/TPU等主流XPU架构和编程模型优先; 5、在AI相关顶刊顶会发表论文者更优; 6、良好的团队沟通能力、技术攻关能力,能独立思考和解决问题,责任心强,工程师素养佳。