行业动态

澎峰科技(PerfXLab),核心团队来自中科院,致力于计算软件栈技术的研发,聚集HPC、AI、RISC-V三大领域。 国际领先的加速计算机技术解决方案商,赋能计算芯片、科学计算和高性能计算应用软件企业。澎峰科技在高性能计算领域有着上十年的技术沉淀,致力于算力基础软件研发。即使是在计算技术体系被国际巨头所把持的时代,仍坚持进行底层和基础技术的软件研发,因为我们坚信中国必须构建自主可控的计算技术体系,计算硬件技术和算力基础软件是新一代信息技术的基础建设。今天,我们厚积薄发,正在积极与各大国产计算硬件伙伴携手迎接新一代计算技术的挑战。

从OpenBLAS(附酷炫动图)到发布PerfMPL行业领先的数学计算库(附白皮书)

全文摘要:本文介绍了张先轶博士领导的国际知名开源项目OpenBLAS的发展历程(文中有酷炫动图)和澎峰科技历时6年研发的PerfMPL数学计算库,附“白皮书”下载链接。

OpenBLAS始于2013年

OpenBLAS 是一个基于BSD许可(开源)发行的优化 BLAS 计算库,由张先轶(中科院博士)于2013年7月20日发起,并发布OpenBLAS 0.2.7第一个版本 ,作为OpenBLAS开源项目的发起人和主要维护者,张先轶获2016CCF科学技术奖二等奖 。BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法),OpenBLAS是BLAS标准的一种具体实现。

OpenBLAS被应用于科学计算、工程计算、数据分析、深度学习算法、人工智能等领域,被Caffe、MXNet、julia、Ubuntu、debian、OpenSuse、GNU Octave等国际知名项目所集成。同时,也有力地支持各类指令集处理器进入到高性能计算领域。 https://github.com/xianyi/OpenBLAS

到发布PerfMPL行业领先的数学计算库

PerfMPL(Math Performance Library)是以 OpenBLAS 为发展基础,经过多年发展逐步覆盖至 FFT(快速傅立叶变换)、SPARSE(稀疏矩阵计算库)、MATH(基础数学库)、VML (Vector Math Library 向量数学库)、DNN(Deep Neural Networks 深度神经 网络)、PerfIPP(图像处理等)等数学计算库。 PerfMPL 基于澎峰科技拥有自主知识产权的统一数学函数库技术积累,通过针对性优化、完善等方式,发展出两大分支版本: 1. PerfMPL for 通用算力,主要面向 CPU 指令集的数学计算库。其API覆盖范围对标Intel的MKL数学计算库,同时PerfMPL不仅支持x86,还支持RISC-V、ARM、MIPS等各类主流处理器指令集。 2. PerfMPL for 专用算力,主要面向 GPU、NPU、ASIC、FPGA 和各类 DSA加速硬件,提供类似CUDA的数学计算库的体系(例如:cuBLAS,cuFFT,cuDNN,cuSPARSE等)。 PerfMPL白皮书下载地址: https://pan.baidu.com/s/1h5dxNJVyjGQBBGdiaVy-8g?pwd=knv7

提取码: knv7



欢迎下载,并期待与您交流。谢谢! 备注:本文动画使用了Gource进行了OpenBLAS代码仓库的可视化呈现,2009 年,来自新西兰的工程师 Andrew Caudwell,希望能够将各种代码版本管理软件的信息可视化,于是他使用 C++ 编写了 Gource 这个程序。2011 年,项目从 Google Code 迁移至 GitHub 后,项目开启了年更模式。

澎峰科技

澎峰科技(PerfXLab),核心团队来自中科院,致力于计算软件栈技术的研发,聚集HPC、AI、RISC-V三大领域。 国际领先的加速计算机技术解决方案商,赋能计算芯片、科学计算和高性能计算应用软件企业。


地址


北京·海淀·紫雀路55号院9号楼
长沙·岳麓区·德必 511室

邮箱


info@perfxlab.com

电话


010-62600621