本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 科技圈快讯 > 最新 >

如何辨别 AI 的“一本正经”与“胡说八道”

发布时间:2024年12月23日 15:57:02 最新 人已围观

简介近年来,生成式人工智能在多领域表现出色,但鉴别 AI 生成内容愈发困难。Google DeepMind 团队在《自然》发表研究,旨在解决该问题。...

以下是重写后的内容:

近年来,生成式人工智能在文本、图像、音乐等领域大放异彩。然而,随着生成式人工智能的不断发展,人们越来越难以辨别 AI 生成的内容。

近日,Google DeepMind 研究团队在《自然》杂志上发表了一篇封面文章,提出了一种文本水印方案,可提高 AI 生成文本的检测精度。

AI 生成内容检测的重要性

在文本、图像和音乐中,AI 生成的文本最难检测。因为现有的图像和音乐生成技术还没有像文本生成技术那样成熟,AI 生成的图像和音乐通常具有一些非自然的视觉或听觉特征。AI 生成的内容在整体上效果较好,但在细节上显得不够自然。在图像和音乐中,也可以人为添加人类难以察觉的水印,以便在后期检测中通过水印筛选出 AI 生成的作品。

然而,在文本中直接添加人类不可见的水印较为困难,这是因为文本与图像和音乐不同,每个文字都是完全可见的。此外,可用于训练 AI 的文本数据也远远多于图像和音乐。在基于大量人类写作语料库的训练下,AI 已经非常擅长模仿人类的表达方式和语言习惯,甚至能够调整文本的风格和语气,这使得 AI 生成的文本更难以直接检测。

尽管 AI 生成的文本与人类创作的文本难以区分,但 AI 生成的内容可能存在事实性错误,可靠性无法保证。无法辨别来源的内容可能会导致虚假信息的传播,还会带来学术作弊、版权争议等各种问题。

例如,在“杭州取消机动车依尾号限行”假新闻事件中,网友使用 AI 技术生成的“假新闻”行文严谨、措辞得当,也基本符合官方通报的格式,导致了错误信息的大规模传播。美国科技新闻网站 CNET 在三个月内上线了 70 多篇使用 AI 技术生成的新闻报道,却被发现其中存在大量基础性错误,包括计算错误、金融概念误解等,不得不暂停 AI 项目并重新审核。

为了避免 AI 技术的滥用,我们需要一种方法来辨别文本是否由 AI 生成。

主流检测方法:事前检测与事后检测

检测 AI 生成的文本是一个分类问题,主要目标是区分文本片段是由 AI 生成的还是人类创作的。通常,文本检测器会对给定的文本片段给出一个评分,当评分超过阈值时,该片段被认为是 AI 生成的,否则是人类创作的。


文本检测框架(图片来源:根据参考文献[1]翻译)

现有的主流检测方法可分为两大类:事前检测和事后检测。事前检测可进一步分为基于水印的检测和基于检索的检测。事后检测可分为基于零样本学习的检测和基于训练的检测。

Tags: 人工智能  AI