本栏推荐

快讯信息

发布时间：2023年08月10日 09:55:08 百度人已围观

简介AI大模型成为2023年的热门话题，OpenAI的ChatGPT领跑市场，微软、谷歌和Meta紧随其后。国内科技公司也迅速跟进，现已推出上百款大模型。这些大模型各具实力，正在不断推动行业发展。...

新标360快讯8月10日报道，AI大模型在今年备受关注，OpenAI的ChatGPT引领潮流，微软、谷歌、Meta等公司也紧随其后。国内科技企业迅速响应，目前国内据称已经推出超过一百款大模型。

那么，在众多大模型中，它们的实际实力如何呢？近期，清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》，对国内外的大模型进行了对比分析。

该报告还调查了这些模型在不同领域（如创意写作、代码编程、舆情分析和历史知识等）中的表现情况，以及它们在解决实际问题时的有效性与局限性。

从生成质量、使用性能、安全性与合规性三个方面，对当前市场上的七个大型语言模型进行了全面评估。

在这七款模型中，毫无疑问，GPT-4名列第一，紧随其后的是百度的文心一言，第三名是GPT-3.5，接下来是Claude、讯飞星火、阿里云的通义千问以及昆仑的天工。

虽然GPT-4在各个方面都表现优异，但对国内用户而言，能更好理解中文的大模型更具重要性。在中文语义理解方面，文心一言以92%的得分率拔得头筹，超越了讯飞星火和GPT-4。

这与百度的大模型涵盖了大量中文文本密切相关，使其能够更有效地处理与本土文化相关的内容。