本栏推荐

快讯信息

发布时间：2022年08月23日 22:59:38 好文人已围观

简介8月9日，壁仞科技正式发布了BR100系列通用计算GPU，宣称其算力在国内处于领先地位，并在多个指标上与国际顶尖产品相媲美或超越。随后在8月22日，第34届Hot Chips芯片大会的首日演讲中...

在8月9日，国内的科技创新公司壁仞科技（Birentech）推出了BR100系列通用计算GPU，声称其算力在国内处于领先地位，多项指标甚至达到或超过国际顶级产品。

8月22日，当地时间，第34届Hot Chips芯片大会的首日，NVIDIA Hopper、AMD Instinct MI200、Intel Ponte Vecchio三大巨头的通用GPU相继亮相，而壁仞科技的BR100也与它们一同展现实力。

会议上，壁仞科技的联合创始人兼CTO洪洲，以及联合创始人兼总裁徐凌杰进行了以“Biren BR100 GPGPU: 加速数据中心规模的AI计算”为题的演讲，向来自全球的专业听众讲解了BR100芯片的特性和其创新架构的细节。

据介绍，BR100是一款专门用于加速数据中心大规模通用计算的GPGPU芯片，具备极高的算力密度，单个显卡在16位浮点计算上可达到PFLOPS级别，且拥有快速的片上及片外互联带宽。

BR100采用7nm工艺、Chiplet小芯片设计，并运用了CoWoS 2.5D封装技术，可以通过OAM模组形态部署，允许在通用UBB主板上实现8卡点对点的完全互连拓扑。

为支持强大的计算能力，BR100配有超过300MB的片上高速缓存，便于存储和重用数据，并配备64GB的HBM2E高速内存。

其核心计算单元由众多通用流式处理器构成，具备通用计算能力，以及基于2.5D GEMM架构的专用张量加速算力。

在架构创新方面，壁仞科技特别考虑到深度学习等通用负载的计算特性，提供了一系列针对数据流的增强功能，包括特有的C-Warp协同并发模式、张量数据访问加速器TDA、NUMA/UMA访问模式、近存储计算等。这些功能使得BR100在算力和能效比上达到国际领先水平。

此外，壁仞科技还推出了一种新的TF32+数据类型，具备比传统TF32更高的精度。

在软件方面，壁仞科技还展示了BIRENSUPATM软件栈，其核心编程模型提供了类似于C/C++的编程接口与运行时API，风格与主流GPGPU开发语言和编程模式相近。

这使得开发者能够轻松地在BR100上进行编程，同时显著减少代码迁移的工作量，实现从主流开发环境到BIRENSUPA平台的无缝过渡。

资料显示，壁仞科技BR100集成了多达770亿个晶体管，其规模可与人类大脑的神经细胞相媲美，已经非常接近NVIDIA GH100计算核心的800亿晶体管，并且BR100系列芯片成功一次点亮！