您现在的位置是:主页 > 科技圈快讯 > 最热 >
如何辨别 AI 的“一本正经”与“胡说八道”
发布时间:2024年12月23日 15:57:02 最热 人已围观
简介近年来,生成式人工智能发展迅速,但鉴别 AI 生成内容愈发困难。Google DeepMind 研究团队在《自然》杂志发表相关研究。...
以下是重写后的内容:
近年来,生成式人工智能在文本、图像、音乐等领域大放异彩。然而,随着生成式人工智能的不断发展,人们越来越难以鉴别 AI 生成的内容。
近日,Google DeepMind 研究团队在《自然》杂志上发表了一篇封面文章,提出了一种文本水印方案,可以提高 AI 生成文本的检测精度。
如上图所示,该方案基于之前的水印生成组件,采用了一种新的“锦标赛采样”方法。在扭曲和非扭曲设置下,与现有最佳方法相比,SynthID-Text 都提高了水印的检出率。
水印生成框架如上图所示。大语言模型的文本生成基于上下文,它会根据输入的文本序列计算下一个词汇的分布,然后从分布中抽样出下一个词汇。
生成式水印方案通常包括三个部分:随机数生成器、采样算法和评分函数。水印生成过程为:首先,使用随机数生成器根据前面的文本和水印键生成一个随机数;然后,采样算法利用这个随机数从词汇的分布中抽样出下一个词汇。
给定一段文本和一个水印键,评分函数提供一个分数来量化当前文本中含有水印的可能性,当分数超过阈值时,就认为该文本中含有水印。
锦标赛采样方法如上图所示。当输入“...我最喜欢的热带水果是”时,模型计算出下一个词汇的分布,其中“芒果”的概率为 0.5,“荔枝”的概率为 0.3,“木瓜”的概率为 0.15,“榴莲”的概率为 0.05。在正常生成中,模型会按照这个概率直接采样出下一个词汇。
在锦标赛采样中,模型首先根据随机数种子生成三个水印函数,然后从词汇的分布中采样出八个词汇,将这八个词汇两两组合进行竞赛,每一轮竞赛由一个水印函数决定胜出者。经过三轮竞赛,最终的胜出者就是模型的输出结果“芒果”。
在锦标赛采样中,词汇是根据水印函数的偏好采样得到的。因此,添加水印的文本在水印函数上会有更高的评分。在检测时,只需评估每个词汇在对应的水印函数下的评分,然后将评分相加,就可以得到这段文本包含水印的可能性。
水印的添加是通过改变采样方法实现的,它会改变模型输出下一个词汇的分布。然而,由于采样方法中使用了随机数种子,在对所有随机数种子进行平均后,可以得到与原始分布相同的结果。
SynthID-Text 可以在适当的配置下避免影响词汇的分布,从而保证文本的质量,也可以以牺牲部分质量为代价提高水印的检出概率。
SynthID-Text 方法在 Google DeepMind 的 Gemini 人工智能模型上进行了两千万次用户测试。测试结果表明,SynthID-Text 在添加水印的同时,不会降低文本的质量。同时,它不会产生过多的时间和计算开销,可以大规模应用于生产实践中。
事后检测文本是否由 AI 生成非常困难。随着 AI 能力的增强,事后检测将变得越来越困难,检测和反检测将是一场永无止境的技术竞赛。水印方法提供了一种可能的解决方案,但需要大语言模型的提供者在生成时预先加入水印。如果用户使用的模型没有主动加入水印,就难以在事后进行检测。
此外,用户还可以使用开源模型,或者对添加了水印的文本进行二次编辑来逃避检测。这些问题都需要进一步解决。
未来,随着生成式人工智能的普及,如何检测 AI 生成的内容将变得越来越重要。SynthID-Text 证明了水印技术在文本生成中大规模应用的可能性,但水印技术面临的困难也表明,检测不仅仅是一个技术问题。
解决这个问题需要各方共同努力,形成相关的行业标准和法律法规,推动 AI 走上为人类服务的正轨。