本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 科技圈快讯 > 好文 >

AMD CDNA 计算卡架构探秘:从无到有,NVIDIA 遭遇三连击

发布时间:2020年11月17日 20:01:25 好文 人已围观

简介AMD 发布新一代 Instinct MI100 计算卡,采用全新 CDNA 架构,台积电 7nm 工艺制造,针对 HPC 和 AI 设计。...

昨晚,AMD 正式发布了新一代 Instinct MI100 计算卡,其采用了全新设计的 CDNA 架构,专为 HPC 高性能计算和 AI 人工智能打造,与面向游戏的 RDNA 架构有很大不同。

该计算卡采用台积电 7nm 工艺制造,拥有 120 个计算单元和 7680 个流处理器,核心频率最高可达 1502MHz,并特别加入了 Matrix Core(矩阵核心),用于加速 HPC 和 AI 运算。

它还整合了 32GB HBM2 显存,位宽为 4096-bit,频率1.2GHz,带宽1228.8GB/s,且支持 ECC。

此卡支持 PCIe 4.0 x16,具备三条 Infinity Fabric 互连总线,峰值带宽达 92GB/s,整卡热设计功耗为 300W,需双 8 针辅助供电。

该卡的独特之处在于顶部设有桥接金手指,可通过桥接器将四块卡绑定在一起,与双路 AMD 霄龙处理器搭配,能实现八卡并行。

与之前的计算卡甚至是 R9 Fury X、Vega 64/56 等游戏卡类似,Instinct MI110 将 GPU 芯片和 HBM 芯片整合封装在一起,不过现在的 HBM2 单颗容量已达 8GB。

对比 CDNA(上)和 RDNA(下)架构图,可以发现两者整体框架有相似之处,但各种单元模块和布局已截然不同。

Infinity Fabric 互连总线、显存控制器、PCIe 4.0 控制器、多媒体引擎、着色器引擎、ACE 异步计算引擎等依然存在(当然也不完全相同),而与图形渲染输出相关的,如图形指令处理器、几何处理器、光栅器、显示引擎、原语单元等都已消失,同时增加了 XGMI 连接控制器用于多卡互连,一二级缓存也完全不同。

作为 AMD GPU 的基本模块,计算单元(CU)也完全不同了,现在称为增强型计算单元(XCU),其组成模块包括调度器、分支与信息单元、12.8KB ECC 标量单元、512KB ECC 标量寄存器、矢量寄存器、矢量 ALU 操作单元、矩阵数据操作单元、四个矢量/矩阵 SIMD 单元、64KB ECC 本地数据共享单元、载入/存储单元、16KB ECC 一级缓存等。

Tags: AMD  显卡