您现在的位置是:主页 > 科技圈快讯 > 最新 >
Intel 新显卡备受热捧!24GB 大显存即将登场,AI 玩家蜂拥而至
发布时间:2024年12月24日 16:05:35 最新 人已围观
简介近日,一款显卡爆火,一进货就被抢光,GPU 供不应求已司空见惯,但此次引发网友热议。...
哇塞,这事儿可真是有点厉害啊!最近 GPU 领域出了件大事,有款显卡卖得超级火,火到啥程度呢?一进货就被抢光啦!
虽然 GPU 供不应求也不是啥新鲜事了,但这次之所以能引起热议,是因为这款产品背后的厂家不是 NVIDIA 或 AMD,而是……Intel!
为啥会这样呢?其实从玩家们的讨论中就能找到答案——性价比超高啊!2000 元左右的价格,就能在 2K 画质下流畅玩 3A 游戏。The Verge 也很直接地给了句评价:Intel 终于在 GPU 上打了个胜仗。
这款显卡就是 Intel 不久前发布的第二代锐炫 B580,起售价才 2049 元。要知道,NVIDIA 299 美元的 RTX 4060 和 AMD 269 美元的 RX 7600,只配备了 8GB 的 VRAM。而 Intel 的锐炫 B580 不仅价格更低,还配备了 12GB 的 VRAM 和 192bit 的显存位宽。就算是价格更低的锐炫 B570(219 美元,下个月上市)也有 10GB 的 VRAM。
除此之外,还有个更有意思的事儿。虽然锐炫是游戏显卡,但毕竟也是 GPU 啊,于是有些人就买来开始搞 AI 了。这可能会让它未来的销售更火呢。
这不,有人就在 Reddit 上分享了怎么在锐炫 B580 上搞 AI 画图 Comfy UI 啦。
不仅个人用户尝鲜,我们还听说有些企业已经开始把 Intel 的显卡塞进包括 Workstation 和服务器在内的商用计算设备中了,搭配的“食谱”就是:Intel 至强系列 CPU+锐炫显卡。不过现在用的还是 Intel 上一代的 A770,作为上一代的旗舰型号,A770 有 16G 大显存,用在 AI 推理上也是游刃有余。
据可靠消息,这种组合最吸引人的优势还是“性价比”。
这也引发了一个更值得讨论的话题:消费级显卡搞 AI,到底行不行?
首先可以看出,不管是个人还是企业,买 Intel 消费级显卡来搞 AI,基本都是用来做 AI 推理的。
实际上,推理算力需求正在飞速增长,甚至有超过训练算力需求的趋势。一方面,随着业界热议的“预训练 Scaling Law 撞墙”,像 OpenAI o1/o3 系列模型也开始依靠增加推理算力来提高模型能力。另一方面,AI 应用落地的爆发也使得推理需求大幅增长,这些需求对算力的溢出甚至极致要求不高,更注重实现够用的性能(包括并发度和时延),以及与之相匹配的易获取、易部署、易使用和成本上的实惠。
那做 AI 推理为什么选择 Intel 游戏显卡呢?
正如前面分析的,性价比肯定是个重要因素。从硬件方面来说,就算是顶级的算力卡,单卡做 AI 推理在面对高并发等场景时,显存也可能会成为瓶颈,但升级到四卡、八卡成本又会飙升。这时,像 Intel A770 这种 2000 元左右就有 16G 大显存的型号,就成了兼顾性能和成本的选择。
从应用方面来说,很多场景对每秒 token 生成速度的要求并不高,特别是有流式传输等优化手段,只要 first token latency 到位,后面生成速度满足一定要求,体验就很好了。
这是我们用 4 张 Intel 锐炫 A770 显卡跑 Qwen2.5 32B 模型的演示 Demo,感受一下这个速度,是不是够快呢?
看到这里可能有人会问,用 Intel 显卡跑 AI,CUDA 的问题怎么解决?
拿最流行的大模型推理框架之一 vLLM 来说,得益于开源软件的发展,它已经实现了高级别的抽象和封装,换用哪种硬件,用起来其实都差不多。再加上 Intel 自己提供的开源 oneAPI,就能做到很低的迁移成本。
可能还有人会问,那为什么不选专用 AI 推理加速器,比如风头正盛的 Groq、Sambanova 这些呢?
这就要说到多模态交互是现在 AI