本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 品牌 > 百度 >

清华发布大模型评估:GPT-4领衔,百度更精通中文

发布时间:2023年08月10日 09:55:08 百度 人已围观

简介AI大模型成为2023年的热门话题,OpenAI的ChatGPT领跑市场,微软、谷歌和Meta紧随其后。国内科技公司也迅速跟进,现已推出上百款大模型。这些大模型各具实力,正在不断推动行业发展。...

新标360快讯8月10日报道,AI大模型在今年备受关注,OpenAI的ChatGPT引领潮流,微软、谷歌、Meta等公司也紧随其后。国内科技企业迅速响应,目前国内据称已经推出超过一百款大模型。

那么,在众多大模型中,它们的实际实力如何呢?近期,清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,对国内外的大模型进行了对比分析。

该报告还调查了这些模型在不同领域(如创意写作、代码编程、舆情分析和历史知识等)中的表现情况,以及它们在解决实际问题时的有效性与局限性。

从生成质量、使用性能、安全性与合规性三个方面,对当前市场上的七个大型语言模型进行了全面评估。

在这七款模型中,毫无疑问,GPT-4名列第一,紧随其后的是百度的文心一言,第三名是GPT-3.5,接下来是Claude、讯飞星火、阿里云的通义千问以及昆仑的天工。

虽然GPT-4在各个方面都表现优异,但对国内用户而言,能更好理解中文的大模型更具重要性。在中文语义理解方面,文心一言以92%的得分率拔得头筹,超越了讯飞星火和GPT-4。

这与百度的大模型涵盖了大量中文文本密切相关,使其能够更有效地处理与本土文化相关的内容。

Tags: GPT-4  百度