本栏推荐

快讯信息

讯息入口：相关文章阅读

您现在的位置是：主页 > 科技圈快讯 > 最新 >

国产AI明星DeepSeek V3意外自称ChatGPT引发争议

发布时间：2024年12月29日 23:41:12 最新人已围观

简介近期大模型圈的热门话题无疑是DeepSeek V3。在网友们积极测试的同时，一个小bug引发广泛讨论——DeepSeek V3竟然因为缺少一个问号，错误地自称为ChatGPT。...

最近大模型领域最热议的话题非DeepSeek V3莫属。

在众多用户体验测试的同时，一个bug引发了热烈讨论——

仅仅因为一个问号的缺失，DeepSeek V3竟然自称是ChatGPT。

连讲笑话的结果也同样如ChatGPT的标准：

值得注意的是，DeepSeek V3之所以受关注，还有一个原因是它的训练成本仅为557.6万美元。

因此，有人开始猜测：它是否是在ChatGPT的基础输出上进行的训练呢？

巧合的是，Altman也发了一条状态，似乎有些微妙的暗示……

不过，DeepSeek V3并不是第一个出现这类错误的大模型。

例如Gemini曾自称为百度的文心一言……

这种情况究竟是怎么回事？为何DeepSeek V3会出现这样的错误？

首先要明确的是，根据网友们目前的讨论，DeepSeek V3是在ChatGPT输出基础上训练的可能性不大。

这一点的原因，如网友Riley Goodside所总结——因为ChatGPT的影响随处可见。

就算DeepSeek V3确实是以ChatGPT的输出为基础进行训练，也并不重要。

在ChatGPT之后发布的大模型几乎都接触过它的输出。

例如ShareGPT，作为一个颇为常见的ChatGPT对话数据集，很多人试图在它及其他ChatGPT数据源上进行优化，然而即便如此，依然无法匹敌DeepSeek V3的性能。

随后，Riley Goodside分享了DeepSeek V3报告中的一些证明：

如果使用了ChatGPT的数据，DeepSeek V3在质量方面的一些问题将无法解释。

例如在Pile测试中（基础模型压缩Pile效果），DeepSeek V3的得分几乎与Llama 3.1 405B相当，这与其是否接触ChatGPT的数据无关。

报告还指出，95%的GPU小时用于基本模型的预训练，即便与ChatGPT数据相关，这部分也更可能是在后期训练阶段中发生（剩下的5%）。

与其讨论DeepSeek V3是否使用了ChatGPT的数据，不如关注大模型频繁出现“报错家门”的原因。

TechCrunch对此现象给出了独到的见解：

因为AI公司获取数据的主要来源——互联网，正在被大量AI内容污染。

Tags：大模型 AI

提示：本站文章来源于网络或投稿

上一篇：你知道雪花的瓣数吗？可能你还没了解过！

下一篇：华为QLC固态硬盘登陆韩国市场：1TB售价仅235元，超值优惠！

相关文章

五菱推出全面购车政策，最高可享1.7万补

超薄设计！石头自清洁扫拖机器人G30图赏

俞敏洪发声反击网络暴力！东方甄选声明

手机购买可享最高500元补贴，预算6000元内

董明珠：借助格力风不吹人技术，电费可

技嘉推出RTX 50系列显卡：尺寸减小10%与散

OpenAI首席执行官奥特曼长文反驳亲妹妹性

融合先进技术的石头G30扫拖机器人评测：

广汽高层表示：埃安UT力争达成同级销量

博主陈震体验特斯拉FSD在美国撞护栏：表

随机图文

OnexPlayer X1 mini 三合一电脑解析：8.8 英寸
OnexPlayer X1 mini 三合一电脑发布，采用可拆卸手柄设计，支持三种使用方式，售...

关于“可可西里网红狼”死亡的园区回应
近日，网传“可可西里网红狼”因被游客投喂而变胖，后被半挂车压死，此事引...

： 1. 哪吒汽车 CEO 方运舟 1986 万元股权遭
哪吒汽车创始人方运舟新增股权冻结信息，被执行企业为合众新能源汽车股份有...

腾讯称微信春节前送礼物功能正灰度开放
微信小店推出送礼功能，体验似拆红包，被称为微信红包 2.0 或“蓝包”，计划...

热门排行

本栏推荐

相关阅读

猜你喜欢

快讯信息

您现在的位置是：主页 > 科技圈快讯 > 最新 >

国产AI明星DeepSeek V3意外自称ChatGPT引发争议

相关文章

随机图文