本栏推荐

快讯信息

发布时间：2024年12月23日 17:06:06 最新人已围观

简介OpenAI 的 GPT 项目备受关注，但 GPT-5 并未在近期宣传中出现，且该公司首席执行官曾表示不会在 2024 年推出 GPT-5 模型。...

OpenAI 的 GPT 项目一直备受瞩目，但近期该公司热火朝天的宣传中，却不见备受期待的 GPT-5 的踪影。

去年 11 月，OpenAI 首席执行官奥尔特曼曾表示，2024 年不会推出名为 GPT-5 的模型。然而，有知情人士透露，OpenAI 的最大投资者微软曾期望在 2024 年年中看到该模型。

还有人称，到目前为止，该项目已经筹备了超过 18 个月，但总体来说，未来 GPT-5 模型的代号为 Orion，其氛围并不友好。该模型已经进行了至少两次大规模训练，每次都需要数月时间来处理大量数据，但每次训练后都会出现新问题。

了解该项目的人士指出，Orion 目前最多只比 OpenAI 的公开模型好一些，距离该公司所谓的“重大飞跃”还很遥远，也无法说服投资人投入目前的巨大成本。据估计，该模型为期六个月的训练仅在计算成本方面就“耗费”了约 5 亿美元。

危险的是，OpenAI 在 10 月的最新估值达到了 1570 亿美元，受到了投资者的追捧。但分析人士指出，这一估值很大程度上基于奥尔特曼的乐观预测，即 GPT-5 将在各个学科和任务上表现出博士水平，较目前 GPT-4 的高中生水平有质的提升。

这意味着如果 GPT-5 不能在合理的时间内给出合理的亮相，那么 OpenAI 的繁荣可能会像泡沫一样破灭，成为反噬噩梦的开始。

数据“耗尽”

OpenAI 原本的想法是让 GPT-5 能够解锁新的科学发现，并完成类似预约或航班预订等类人类的决策行为，且犯错的概率更小，或者至少对 AI 幻觉有所警惕。

但内部人士透露，OpenAI 的预期有些过于乐观，仅在数据问题上，GPT-5 就面临着难以想象的挫折。

人工模型在训练过程中需要不断进行测试，可能会持续很长时间。在此期间，模型将输入数万亿个单词片段，即所谓的 token。而未来的人工智能模型吞噬 token 的数量将是目前模型的十倍甚至更多。

GPT-4 的训练使用了大约 13 万亿个 token，按照一千人每天协作 5000 个单词计算，这种规模的团队在几个月内才能生产十亿个 token，而其花费据奥尔特曼称超过 1 亿美元。

因此，GPT-5 模型的关键问题在于：数据不足。之前的模型使用了新闻文章、社交媒体帖子和科学论文等，但研究人员透露，公共互联网上的数据已经不够，他们需要更多样且更高质量的数据，以使 GPT-5 更加强大。

难以改变方向

OpenAI 目前的解决方案是从头开始创建数据，例如招聘人员编写新的软件代码或解决数学问题，供 Orion 学习。这些员工中部分是软件工程师，部分是数学家，必要时他们还需要向 Orion 解释自己的工作。