全文摘要:本文介绍了张先轶博士领导的国际知名开源项目OpenBLAS的发展历程(文中有酷炫动图)和澎峰科技历时6年研发的PerfMPL数学计算库,附“白皮书”下载链接。
OpenBLAS始于2013年
OpenBLAS 是一个基于BSD许可(开源)发行的优化 BLAS 计算库,由张先轶(中科院博士)于2013年7月20日发起,并发布OpenBLAS 0.2.7第一个版本 ,作为OpenBLAS开源项目的发起人和主要维护者,张先轶获2016CCF科学技术奖二等奖 。BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法),OpenBLAS是BLAS标准的一种具体实现。
OpenBLAS被应用于科学计算、工程计算、数据分析、深度学习算法、人工智能等领域,被Caffe、MXNet、julia、Ubuntu、debian、OpenSuse、GNU Octave等国际知名项目所集成。同时,也有力地支持各类指令集处理器进入到高性能计算领域。
https://github.com/xianyi/OpenBLAS
到发布PerfMPL行业领先的数学计算库
PerfMPL(Math Performance Library)是以 OpenBLAS 为发展基础,经过多年发展逐步覆盖至 FFT(快速傅立叶变换)、SPARSE(稀疏矩阵计算库)、MATH(基础数学库)、VML (Vector Math Library 向量数学库)、DNN(Deep Neural Networks 深度神经 网络)、PerfIPP(图像处理等)等数学计算库。
PerfMPL 基于澎峰科技拥有自主知识产权的统一数学函数库技术积累,通过针对性优化、完善等方式,发展出两大分支版本:
1. PerfMPL for 通用算力,主要面向 CPU 指令集的数学计算库。其API覆盖范围对标Intel的MKL数学计算库,同时PerfMPL不仅支持x86,还支持RISC-V、ARM、MIPS等各类主流处理器指令集。
2. PerfMPL for 专用算力,主要面向 GPU、NPU、ASIC、FPGA 和各类 DSA加速硬件,提供类似CUDA的数学计算库的体系(例如:cuBLAS,cuFFT,cuDNN,cuSPARSE等)。
PerfMPL白皮书下载地址:
https://pan.baidu.com/s/1h5dxNJVyjGQBBGdiaVy-8g?pwd=knv7
提取码: knv7
欢迎下载,并期待与您交流。谢谢!
备注:本文动画使用了Gource进行了OpenBLAS代码仓库的可视化呈现,2009 年,来自新西兰的工程师 Andrew Caudwell,希望能够将各种代码版本管理软件的信息可视化,于是他使用 C++ 编写了 Gource 这个程序。2011 年,项目从 Google Code 迁移至 GitHub 后,项目开启了年更模式。