本栏推荐

快讯信息

发布时间：2023年12月18日 21:17:50 微软人已围观

简介谷歌近日在AI大模型领域发布了新模型Gemini，发布会中6分钟的演示视频引发全球热议。许多人称其为“打爆GPT-4”和“最强AI”，并将其比作钢铁侠，显示出该模型在技术创新上的强大潜...

在经历了一整年的被ChatGPT压制后，谷歌终于在人工智能大模型领域释放了重磅消息，推出了新的AI模型Gemini，短短6分钟的演示视频迅速引发了全球的热议。

许多人对谷歌的表述反应激烈：“这将打败GPT-4”、“这是最强的人工智能”、“简直就像钢铁侠里的贾维斯！” 在演示视频中，Gemini展现了很多科技感十足的功能，让观众们纷纷感到“振奋”。

Gemini与ChatGPT的强弱之争很快成为了业界的焦点讨论。然而，尚未等到各方专业人士的深入评测，事情却发生了巨大的转折——谷歌被指责演示视频存在造假，从AI的“神话”瞬间变成了“笑料”。

根据谷歌的介绍，Gemini是“原生”多模态大模型，可以整合文本、图像、音频、视频及代码等多种信息类型，并分为三个版本——Nano（标准版）、Pro（增强版）、Ultra（旗舰版）。

此外，谷歌还引用了“跑分记录”，宣称其顶配版Gemini Ultra在多个维度上超越了GPT-4，甚至在MMLU（大规模多任务语言理解）测试中，成为全球第一个超越人类专家水平的AI模型。

当然，最引人关注的还是谷歌发布的演示视频《与Gemini一起实践：与多模式人工智能交互》。在视频中，Gemini能够根据画面内容进行游戏互动、猜谜，甚至教人讲普通话。

然而，这段演示很快就被一位名叫Parmy Olsen的记者质疑。她是首位对视频的真实性和操作透明性提出问题的记者。

Olsen仔细比对了谷歌官方发布的操作过程的博客与演示视频，发现视频中的Gemini互动并不是实时的，而是通过剪辑省略了用静态图像和提示词共同“训练”AI的过程。

例如，演示视频中显示有人在玩石头剪刀布，而Gemini立刻反应：“我知道你在做什么，你在玩石头剪刀布”。

从视频中看，人们会以为Gemini具备超强的识别和理解能力，能够立即理解人类的行为，但事实却大相径庭。

实际上，工作人员使用了一组静态图片，同时配合简单易懂的提示词——“这是一个游戏”。这才让Gemini得出了“在玩石头剪刀布”的回答。

这两种互动方式的差别极为明显，这意味着谷歌把一个靠拼音辅助理解儿童读物的AI，包装成了瞬间理解复杂数学问题的形象展示给公众。

如同那些不易察觉的“最终解释权归商家所有”的套路一样，谷歌也玩起了小手段。在视频的简介部分，点击“更多”的时候，才会显现这样一句话：“为了演示的目的，视频略去了Gemini生成内容时的延迟，并进行了内容缩短。”