您现在的位置是:主页 > 科技圈快讯 > 最新 >
GPT-5 遭遇重大难题:OpenAI 耗费数亿美金后意识到牛皮吹大了
发布时间:2024年12月23日 17:06:06 最新 人已围观
简介OpenAI 的 GPT 项目备受关注,但 GPT-5 并未在近期宣传中出现,且该公司首席执行官曾表示不会在 2024 年推出 GPT-5 模型。...
OpenAI 的 GPT 项目一直备受瞩目,但近期该公司热火朝天的宣传中,却不见备受期待的 GPT-5 的踪影。
去年 11 月,OpenAI 首席执行官奥尔特曼曾表示,2024 年不会推出名为 GPT-5 的模型。然而,有知情人士透露,OpenAI 的最大投资者微软曾期望在 2024 年年中看到该模型。
还有人称,到目前为止,该项目已经筹备了超过 18 个月,但总体来说,未来 GPT-5 模型的代号为 Orion,其氛围并不友好。该模型已经进行了至少两次大规模训练,每次都需要数月时间来处理大量数据,但每次训练后都会出现新问题。
了解该项目的人士指出,Orion 目前最多只比 OpenAI 的公开模型好一些,距离该公司所谓的“重大飞跃”还很遥远,也无法说服投资人投入目前的巨大成本。据估计,该模型为期六个月的训练仅在计算成本方面就“耗费”了约 5 亿美元。
危险的是,OpenAI 在 10 月的最新估值达到了 1570 亿美元,受到了投资者的追捧。但分析人士指出,这一估值很大程度上基于奥尔特曼的乐观预测,即 GPT-5 将在各个学科和任务上表现出博士水平,较目前 GPT-4 的高中生水平有质的提升。
这意味着如果 GPT-5 不能在合理的时间内给出合理的亮相,那么 OpenAI 的繁荣可能会像泡沫一样破灭,成为反噬噩梦的开始。
数据“耗尽”
OpenAI 原本的想法是让 GPT-5 能够解锁新的科学发现,并完成类似预约或航班预订等类人类的决策行为,且犯错的概率更小,或者至少对 AI 幻觉有所警惕。
但内部人士透露,OpenAI 的预期有些过于乐观,仅在数据问题上,GPT-5 就面临着难以想象的挫折。
人工模型在训练过程中需要不断进行测试,可能会持续很长时间。在此期间,模型将输入数万亿个单词片段,即所谓的 token。而未来的人工智能模型吞噬 token 的数量将是目前模型的十倍甚至更多。
GPT-4 的训练使用了大约 13 万亿个 token,按照一千人每天协作 5000 个单词计算,这种规模的团队在几个月内才能生产十亿个 token,而其花费据奥尔特曼称超过 1 亿美元。
因此,GPT-5 模型的关键问题在于:数据不足。之前的模型使用了新闻文章、社交媒体帖子和科学论文等,但研究人员透露,公共互联网上的数据已经不够,他们需要更多样且更高质量的数据,以使 GPT-5 更加强大。
难以改变方向
OpenAI 目前的解决方案是从头开始创建数据,例如招聘人员编写新的软件代码或解决数学问题,供 Orion 学习。这些员工中部分是软件工程师,部分是数学家,必要时他们还需要向 Orion 解释自己的工作。