您现在的位置是:主页 > 品牌 > 微软 >
谷歌造假揭示了AI大模型领域的严重隐患
发布时间:2023年12月18日 21:17:50 微软 人已围观
简介谷歌近日在AI大模型领域发布了新模型Gemini,发布会中6分钟的演示视频引发全球热议。许多人称其为“打爆GPT-4”和“最强AI”,并将其比作钢铁侠,显示出该模型在技术创新上的强大潜...
在经历了一整年的被ChatGPT压制后,谷歌终于在人工智能大模型领域释放了重磅消息,推出了新的AI模型Gemini,短短6分钟的演示视频迅速引发了全球的热议。
许多人对谷歌的表述反应激烈:“这将打败GPT-4”、“这是最强的人工智能”、“简直就像钢铁侠里的贾维斯!” 在演示视频中,Gemini展现了很多科技感十足的功能,让观众们纷纷感到“振奋”。
Gemini与ChatGPT的强弱之争很快成为了业界的焦点讨论。然而,尚未等到各方专业人士的深入评测,事情却发生了巨大的转折——谷歌被指责演示视频存在造假,从AI的“神话”瞬间变成了“笑料”。
根据谷歌的介绍,Gemini是“原生”多模态大模型,可以整合文本、图像、音频、视频及代码等多种信息类型,并分为三个版本——Nano(标准版)、Pro(增强版)、Ultra(旗舰版)。
此外,谷歌还引用了“跑分记录”,宣称其顶配版Gemini Ultra在多个维度上超越了GPT-4,甚至在MMLU(大规模多任务语言理解)测试中,成为全球第一个超越人类专家水平的AI模型。
当然,最引人关注的还是谷歌发布的演示视频《与Gemini一起实践:与多模式人工智能交互》。在视频中,Gemini能够根据画面内容进行游戏互动、猜谜,甚至教人讲普通话。
然而,这段演示很快就被一位名叫Parmy Olsen的记者质疑。她是首位对视频的真实性和操作透明性提出问题的记者。
Olsen仔细比对了谷歌官方发布的操作过程的博客与演示视频,发现视频中的Gemini互动并不是实时的,而是通过剪辑省略了用静态图像和提示词共同“训练”AI的过程。
例如,演示视频中显示有人在玩石头剪刀布,而Gemini立刻反应:“我知道你在做什么,你在玩石头剪刀布”。
从视频中看,人们会以为Gemini具备超强的识别和理解能力,能够立即理解人类的行为,但事实却大相径庭。
实际上,工作人员使用了一组静态图片,同时配合简单易懂的提示词——“这是一个游戏”。这才让Gemini得出了“在玩石头剪刀布”的回答。
这两种互动方式的差别极为明显,这意味着谷歌把一个靠拼音辅助理解儿童读物的AI,包装成了瞬间理解复杂数学问题的形象展示给公众。
如同那些不易察觉的“最终解释权归商家所有”的套路一样,谷歌也玩起了小手段。在视频的简介部分,点击“更多”的时候,才会显现这样一句话:“为了演示的目的,视频略去了Gemini生成内容时的延迟,并进行了内容缩短。”