澎峰(北京)科技有限公司成立于2016年,公司致力于计算软件栈技术领域的技术研发。 已经与国内的优秀计算硬件企业(华为、燧原、海光、阿里平头哥等)和科研院所建立了深度合作关系, 共同推动建设先进计算技术的“新基建”。 另一方面,自主研发的PerfXAPI异构计算软件栈正在赋能科学研究和行业革命性创新应用。
张先轶 毕业于北京理工大学,中科院博士,曾在UT Austin和MIT进行博士后研究工作。国际知名开源矩阵计算项目OpenBLAS发起人和主要维护者。 中国计算机学会高性能计算专业委员会委员,ACM SIGHPC China执行委员。2016年获得中国计算机学会科学技术二等奖, 2017年获得中国科学院杰出科技成就奖,2020年 美国SIAM Activity Group on Supercomputing最佳论文奖。
岗位描述
计算库性能优化组主要负责高性能的深度学习/机器学习/科学计算的基础数学库的开发和维护
岗位职责
进行各项算子的指令级优化;深度学习的算法性能优化; 求解器性能优化;参与AI框架和底层计算库的开发。
岗位要求
计算机、电子工程、数学、自动化等相关专业,本科及以上学历;对并行计算、异构计算和计算性能优化有一定的经验和编程基础;
熟悉C/C++编程语言;有1年以上相关工作经验,基础功底扎实的应届毕业生亦可。
岗位描述
基于ONNX runtime和PerfXAPI对于各类计算硬件进行适配,性能调优和评估。
岗位职责
设计基于智能处理器的大规模机器学习框架; 开发面向智能处理器的深度学习模型量化、优化算法;
深入主流深度学习框架定制开发和性能调优。
岗位要求
熟练掌握C/C++/Python,编程基础扎实;熟悉机器学习基础算法,有ONNX runtime框架适配经验优先;
良好的协作沟通能力和团队协作能力;参与或负责过大型软件框架的设计和性能调优或者开源社区经验;有1年以上相关工作经验。
岗位描述
基于ONNX runtime和PerfXAPI对于各类计算硬件进行适配,性能调优和评估。
岗位职责
完成NPU芯片AI算子实现;TVM等framework后端集成;NPU工具链开发;验证和调优NPU工具链;参与NPU体系架构设计和优化设计。
岗位要求
计算机科学或电子工程学本科毕业;精通编译原理和相关算法,有LLVM,XLA等编程经验;熟练掌握C/C++,Python编程;具有深度学习框架(例如Tensorflow,Pytorch等)的经验;良好的协作沟通能力和团队协作能力。
张先轶 xianyi@perfxlab.com 13466545921
王军辉 wangjh@perfxlab.com 13510090675
北京·海淀·紫雀路55号院9号楼
长沙·岳麓区·德必 511室