您现在的位置是:主页 > 科技圈快讯 > 好文 >
NVIDIA 新 Ada GPU 内核图流出:RTX 4090 性能有望翻倍
发布时间:2022年05月15日 11:39:20 好文 人已围观
简介5 月 24 日上午 11 点 NVIDIA 将在台北电脑展举办专题演讲,虽然老黄缺席,但仍有望公布 RTX 40 系显卡消息甚至提前发布,此前爆料达人分享了相关信息。...
5 月 24 日上午 11 点,NVIDIA 会在台北电脑展进行专题演讲,虽然老黄不参加,但 GeForce 业务高级副总裁在列,所以还是有希望听到关于 RTX 40 系显卡的消息,甚至可能会提前发布。
在此之前,爆料达人 Kopte7kimi 分享了一张号称是 AD102 GPU 的内核设计图。
AD102 是 Ada Lovelace 家族的次顶配核心,也是 RTX 40 系游戏旗舰卡的配置,大概率对应 RTX 4090 Ti、RTX 4090 显卡。
从图中可以看出,AD102 内部建有多达 12 组 GPC(显示计算簇),比上一代 GA102 增加了 70%。每组 GPC 包含 6 个 TPC(2 个 SM),每个 SM 单元又包含 4 个子核心,这与安培相同。但不同的是,每个 SM 子核心包含 128 组 FP32 单元,加上 IN32 整数单元,总共达到 192 个。
完整的 AD102 包括 24 组 SM,也就是 12288 个 FP32 单元加上 6144 INT32,简单来说就是 18432 个 CUDA。
在缓存方面,AD102 核心中,每组 SM 享有 192KB L1,比安培增加了 50%,总计 4.5MB。L2 增加到 96MB,是安培的 16 倍。
相应地,ROP 和 RT 光追单元的规模也自然增加,AD102 最多有 384 个 ROP,而 RTX 3090 Ti 只有 112 个。此外,光追单元升级到第三代,Tensor 单元升级到第四代。
基于此,RTX 4090 最终实现性能翻倍似乎并非遥不可及的梦想,就 FP32 单精度浮点而言,外界预计能达到 90T,而 RTX 3090 Ti 只有 40T,代价是超过 600W 的功耗……
相关文章
随机图文
-
ARM 推出 Cortex-A78:5nm 工艺,CPU 性能升
ARM 公司推出新一代 CPU 架构 Cortex-A78,适用于 5nm 工艺,性能提升 20%,功耗降低... -
华为 Mate 40 Pro 4G 版官宣降价,5599 元起售
华为 Mate 40 Pro 因芯片等原因缺货已久,去年 6 月推出 4G 版,该版本与 5G 版硬件... -
苹果 iPhone 15 或采用自研基带,信号表现
从 iPhone 7 起苹果部分机型采用 Intel 基带,iPhone XS 到 iPhone 11 基本全系 Intel 独占... -
IP 显示功能让“海外”网红现形,“梅西
近日,各大社交平台上线强制开启且无法关闭的 IP 属地功能,不少网红博主的...