本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 硬件测评 > 最热测评 >

AMD RX 7900 XT在Linux系统下的AI性能提升,ROCm助力图形输出效率翻倍!

发布时间:2024年04月11日 18:15:23 最热测评 人已围观

简介ROCm是一个高性能、可移植的GPU计算平台,适应了AI时代的需求。随着Stable Diffusion的流行,显卡的用途已超越游戏,越来越多的用户将其视为生成式AI内容的生产力工具。此变化标志着显...

一、ROCm:一个高性能且可移植的GPU计算平台

在人工智能时代的到来下,显卡的用途已不仅限于游戏,尤其是Stable Diffusion迅速流行后,越来越多的用户开始将显卡视作生成式人工智能的工具。

然而,早期版本的Stable Diffusion对AMD显卡支持并不理想,使得很多人产生了“只有NVIDIA显卡能进行AI操作”的误解。

可能不少人还不知道,AMD的Radeon GPU同样具备深度学习能力,且其性能并不亚于竞争对手。

去年12月,AMD推出了ROCm 6.0开发平台,针对RX 7000系列显卡大幅提升了AI性能,特别是在Stable Diffusion的生成效率上更是实现了倍增的表现。

接下来,我们来了解一下什么是AMD ROCm!

ROCm(Radeon Open Compute Platform)是AMD基于开源项目构建的GPU计算生态,与NVIDIA的CUDA平台类似。

ROCm兼容多种编程语言、编译器、库和工具,旨在加速科学计算、自动驾驶、人工智能和机器学习等领域的应用。

此外,ROCm还与多家加速器厂商和架构兼容,提供了高度的可移植性和互操作性。

目前,大多数深度学习的开发工作以Python为主,而大数据平台通常部署在Linux系统上。因此,AMD ROCm目前的主要关注点在Linux环境,Windows版则还需进一步完善。

得益于双发射架构的流处理器,RX 7900 XT仅凭5376个流处理器便达到了52TFOPS的单精度浮点计算能力,而10240个流处理器的RTX 4080 Super也有55TFOPS的浮点性能。

至于RX 7900 XTX,其单精度浮点性能接近60TFOPS。

Stable Diffusion主要依赖GPU的单精度浮点性能以及显存容量和带宽,这两方面RX 7900 XT在这些指标上不逊色于RTX 4080 SUPER,甚至显存容量更为充裕。

现在借助AMD ROCm 6.0的强大支持,这款顶级显卡的AI计算能力终于得以充分发挥。

二、Stable Diffusion生成速度比较:Linux系统下的效率接近翻倍

测试平台如下:

此次比较主要针对RX 7900 XT/XTX在Ubuntu与Windows系统下的图片生成效率,旨在评估AMD ROCm能带来的效能提升。

1、RX 7900 XT性能对比测试

首先,在Windows 11系统下,运行Stable Diffusion时,我们设置了DPN++ 2M Karras采样、迭代步数50、Euler a采样、1024x768分辨率、CFG为7、总批次为10,单批次数量为1。

Tags: RX 7900 XT  显卡