AI/HPC计算系统架构师-北京/上海/成都
若干
招考人数
基本信息
招录人数
若干
职业代码
报考单位
摩尔线程智能科技(北京)股份有限公司
部门代码
职位信息
职位名称
AI/HPC计算系统架构师-北京/上海/成都
单位名称
摩尔线程智能科技(北京)股份有限公司
任职要求
要求: - 经验要求 - 高潜培养:硕士+3年以上工作经验 - 初级:硕士+5年以上工作经验,或,博士+2年以上工作经验 - 中级:硕士+8年以上工作经验,或,博士+5年以上工作经验 - 技能要求: - 方向1)偏算法、多GPU系统 - 具备计算机系统结构知识,理解GPU架构及多GPU系统架构; - 理解AI或HPC算法及其在GPU、系统上的部署和运行flow; - 理解以Transformer模型为基础的LLM、以deepseek为代表的现代MoE模型的架构,及其在训练、推理集群上的运行原理; - 了解大模型向GPU系统部署的并行策略,如数据并行、流水线并行、张量并行、专家并行、上下文并行等; - 加分项:Megatron、Zero、VERL、vLLM、SGLang等方面的知识或经验 - 能针对大量性能数据进行综合分析、识别计算瓶颈、提出架构建议; - 加分项:能够分析AI模型源代码,并针对目标硬件架构作高层次性能建模; - 具有编程模型、memory model、软硬接口、ISA的知识和经验; - C++或PyThon编程能力; - 加分项:NVSHMEM、NCCL、MPI、PGAS等方面的知识或经验; - 加分项:PTX、nvcc、CUDA C++、CUTLASS、cuTile、Triton、cuBLUS、cuDNN、TensorRT、PyTorch等方面的知识或经验; - 方向2)偏硬件、SoC - 具备计算机体系结构知识,理解GPU及SoC架构、理解其编程模型、memory model; - 理解AI或HPC算法在GPU上的运行flow; - 理解算例带宽比的配平原理、roofline model等; - 能针对大量性能数据进行综合分析、识别计算瓶颈、提出架构建议; - 加分项:能够分析AI模型源代码,并针对目标硬件架构作高层次性能建模; - 加分项:能分析GPU kernel、有算子设计或分析经验,能进行性能问题分析; - 理解芯片PPA trad-off; - 加分项:RTL/DV经验、芯片流片经验; - 加分项:GPU RAS、GPU集群系统稳定性方面的知识或经验; - 加分项:PCIe、NVLink、IB/ethernet、GPU scale-up/scale-out网路、GPU服务器、GPU集群系统等方面的知识或经验; - 加分项:NVSHMEM、NCCL、MPI、PGAS等方面的知识或经验; - 加分项:PTX、nvcc、CUDA C++、CUTLASS、cuTile、Triton、cuBLUS、cuDNN、TensorRT、PyTorch等方面的知识或经验;
岗位职责
职责: - 辅助主架构师对GPU芯片及系统的顶层架构进行设计。 - 对接产品经理、客户支持⼯程师、算法⼯程师、框架⼯程师、软件栈工程师,深入理解客户底层需求、并下沉出架构优化⽅向及具体的设计需求。 - 方向1)计算负载分析及系统顶层架构设计 - 分析AI/HPC等计算workload,进行GPGPU计算系统的性能建模与分析。 - 站在计算系统的角度(包括计算单元子系统、SoC芯片、多卡、超节点、数据中心、分布式集群)对顶层架构、编程模型、指令集等进行软硬协同设计。 - 方向2)GPU芯片顶层架构设计 - 辅助主架构师对具体feature展开分析性研究及量化评估、协同design/DV/软件等跨团队推动具体架构特性落地。 - 辅助主架构师结合具体工艺,计算芯片算力、带宽等SoC级设计参数的设计平衡,计算面积、功耗、成本等与性能的trade off,制定各模块合理的V/F sign off 目标。 - 协同PM,从技术角度辅助管理一代芯片的众多架构特性的推进、及全局性取舍。
报考条件
基层工作年限
经验不限;高潜培养:硕士+3年以上工作经验;初级:硕士+5年以上工作经验,或,博士+2年以上工作经验;中级:硕士+8年以上工作经验,或,博士+5年以上工作经验
学历信息
硕士
薪资范围
40-70K·16薪