本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 科技圈快讯 > 好文 >

7nm 安培 GPU 深度解析:400W 功率、40GB HBM2、826mm2 巨无霸诞生

发布时间:2020年05月14日 21:37:04 好文 人已围观

简介NVIDIA 正式发布 7nm 安培 GPU,号称性能飞跃最大,Anandtech 网站给出详细介绍。...

等了好久,今晚 NVIDIA 终于正式发布了 7nm 安培 GPU,号称是 8 代 GPU 史上最大的性能飞跃。不过官方并未公布安培 GPU 的技术细节,Anandtech 网站倒是给出了一份详尽的介绍。 在这次的 GTC 2020 大会演讲中,NVIDIA CEO 黄仁勋主要讲的是 HPC 计算、AI 人工智能等领域的内容,目前推出的 A100 大核心也是针对这个领域的,与 3 年前发布的 Volta 架构 V100 核心相比,很多东西都不一样,大家不用太纠结。 先从大的方面来说,V100 核心采用的是 12nm Volta 架构,有 211 亿晶体管,核心面积 815mm2,而A100 核心则是台积电 7N 工艺,应该也是定制版的 7nm 工艺,826mm2,542 亿晶体管,同样是核弹级别的。 V100 核心拥有 80 组 SM 单元,5120 个 CUDA 核心,SXM2/3 架构,而 A100 核心则是 108 组 SM 单元,SXM4 架构,6912 个 CUDA 核心。 在 AI 方面,变化最大,相比 Volta 架构的 640 个 Tensor Core,A100 核心的 Tensor Core 减少到了 432 个,但性能却大幅提升,支持全新的 TF32 运算,浮点性能达到 156TFLOPS,同时 INT8 浮点性能为 624TOPS,FP16 性能为 312TFLOPS。 常规的 FP32、FP64 性能提升则不算明显,从 V100 核心的 15.7.、7.8TFLOPS 提升到了 19.5、9.7TFLOPS。 在频率方面,A100 核心实际上还降低了,从 V100 的 1530MHz 降到了 1.41GHz 左右,毕竟核心规模太大,功耗已经飙升到了 400W,比 V100 的 300/350W 功耗高了不少。 显存方面,A100 配备的也是 HBM2 显存,频率从 1.75Gbps 提升到了 2.4Gbps,位宽 5120bit,相比 V100 的 4096bit 增加了 1024bit,容量也从 16/32GB 增加到了 40GB。 不过 HBM2 的配置有点奇怪,增加 1024bit 理论上应该多 1 组 HBM2,但从核心图上看又是 6 组 HBM2 显存,也许是 2 组 512bit 的?说不定以后还会有完整版的 A100 核心。 不过 HBM2 显存位宽和频率双双提升的结果就是,A100 核心的显存带宽达到了 1.6TB/s,远高于 V100 的 900GB/s,比 AMD 的 Radeon VII 显卡的 1TB/s 带宽还要高。 最后,NVLink 技术也升级到了 3.0 版,带宽从 300GB/s 提升到了 600GB/s,适合服务器领域多卡互联,不过未来应该还会有 PCIe 版的。

Tags: 安培  NVIDIA