招聘要求
1.精通Linux/Unix操作系统,具备丰富的系统管理经验,具备良好的脚本编程能力(Shell,Python);2.深入理解HPC/AI集群架构,熟悉作业调度系统(Slurm、PBS等)、MPI/OpenMP等并行编程环境;3.熟悉GPU编(CUDA/OpenCL)及主流AI框架(TensorFlow,PyTorch)的部署与优化者优先;4.了解InfiniBand等高速网络、并行文件系统(如Lustre,GPFS)者优先;5.具有大型HPC/AI平台建设或运维经验者优先;6.硕士及以上。