您现在的位置是:主页 > 科技圈快讯 > 好文 >
AMD CDNA 计算卡架构探秘:从无到有,NVIDIA 遭遇三连击
发布时间:2020年11月17日 20:01:25 好文 人已围观
简介AMD 发布新一代 Instinct MI100 计算卡,采用全新 CDNA 架构,台积电 7nm 工艺制造,针对 HPC 和 AI 设计。...
昨晚,AMD 正式发布了新一代 Instinct MI100 计算卡,其采用了全新设计的 CDNA 架构,专为 HPC 高性能计算和 AI 人工智能打造,与面向游戏的 RDNA 架构有很大不同。
该计算卡采用台积电 7nm 工艺制造,拥有 120 个计算单元和 7680 个流处理器,核心频率最高可达 1502MHz,并特别加入了 Matrix Core(矩阵核心),用于加速 HPC 和 AI 运算。
它还整合了 32GB HBM2 显存,位宽为 4096-bit,频率1.2GHz,带宽1228.8GB/s,且支持 ECC。
此卡支持 PCIe 4.0 x16,具备三条 Infinity Fabric 互连总线,峰值带宽达 92GB/s,整卡热设计功耗为 300W,需双 8 针辅助供电。
该卡的独特之处在于顶部设有桥接金手指,可通过桥接器将四块卡绑定在一起,与双路 AMD 霄龙处理器搭配,能实现八卡并行。
与之前的计算卡甚至是 R9 Fury X、Vega 64/56 等游戏卡类似,Instinct MI110 将 GPU 芯片和 HBM 芯片整合封装在一起,不过现在的 HBM2 单颗容量已达 8GB。
对比 CDNA(上)和 RDNA(下)架构图,可以发现两者整体框架有相似之处,但各种单元模块和布局已截然不同。
Infinity Fabric 互连总线、显存控制器、PCIe 4.0 控制器、多媒体引擎、着色器引擎、ACE 异步计算引擎等依然存在(当然也不完全相同),而与图形渲染输出相关的,如图形指令处理器、几何处理器、光栅器、显示引擎、原语单元等都已消失,同时增加了 XGMI 连接控制器用于多卡互连,一二级缓存也完全不同。
作为 AMD GPU 的基本模块,计算单元(CU)也完全不同了,现在称为增强型计算单元(XCU),其组成模块包括调度器、分支与信息单元、12.8KB ECC 标量单元、512KB ECC 标量寄存器、矢量寄存器、矢量 ALU 操作单元、矩阵数据操作单元、四个矢量/矩阵 SIMD 单元、64KB ECC 本地数据共享单元、载入/存储单元、16KB ECC 一级缓存等。
相关文章
随机图文
ARM 推出 Cortex-A78:5nm 工艺,CPU 性能升
ARM 公司推出新一代 CPU 架构 Cortex-A78,适用于 5nm 工艺,性能提升 20%,功耗降低...华为 Mate 40 Pro 4G 版官宣降价,5599 元起售
华为 Mate 40 Pro 因芯片等原因缺货已久,去年 6 月推出 4G 版,该版本与 5G 版硬件...苹果 iPhone 15 或采用自研基带,信号表现
从 iPhone 7 起苹果部分机型采用 Intel 基带,iPhone XS 到 iPhone 11 基本全系 Intel 独占...IP 显示功能让“海外”网红现形,“梅西
近日,各大社交平台上线强制开启且无法关闭的 IP 属地功能,不少网红博主的...