您现在的位置是:主页 > 科技圈快讯 > 最热 >
OpenAI 发布 o3 模型,AGI 能力飙升,近乎人类水准
发布时间:2024年12月21日 08:21:44 最热 人已围观
简介OpenAI 推出重磅新品 o3,号称是其迄今最强前沿推理模型的升级版。...
12 月 21 日,据快科技消息,OpenAI 的“连续 12 日圣诞发布”迎来了激动人心的大结局,重磅推出收官新品——其迄今最强前沿推理模型的升级版 o3。
OpenAI 表示,o3 在某些情况下接近通用人工智能(AGI),共有 o3 和精简版 o3-mini 两个版本。
评估数据显示,o3 在软件工程测试中的准确率比 o1 高出近 47%,在竞赛数学测评中的准确率比 o1 高 15%,在人类博士专家级生化物测试中的准确率比 o1 高近 13%。
在 AGI 相关测试中,o3 取得了最佳成绩 87.5,超过了人类水平门槛 85,这表明其在迈向类人智能方面取得了突破。
相比之下,GPT-3 的评测结果为 0%,GPT-4o 为 5%,而 o3 则一举将成绩提升到了 87.5%。
OpenAI 计划在明年初发布 o3 系列模型,其 CEO Altman 暗示,可能在一段时间内不会向大众推出这类模型,称希望在正式发布前,先有一个联邦政府的测试框架,以指导、监控并降低这类模型的风险。
从本周五开始,OpenAI 允许安全研究人员注册访问 o3 和 o3-mini 的预览版。
OpenAI12 天技术直播重点内容汇总:
1. 推出“满血版”推理模型 o1 和 ChatGPT Pro(每月订阅费用为 200 美元)。
2. 推出强化微调研究项目,可使用数十到数千个高质量任务定制模型。
3. 正式推出 AI 视频生成模型 Sora Turbo,最高支持 1080p 20s 视频。
4. 发布升级版 Canvas 创作助手,主打高效编程与写作,向所有用户开放。
5. 与苹果合作发布 iOS 18.2,将 Siri、写作工具和 Visual Intelligence 与 ChatGPT 深度集成。
6. 全量上线 4o 视频通话,可实时对话并理解用户的连续性动作,具有记忆功能。
7. 推出 Projects In ChatGPT,可整合 ChatGPT 的各种功能,便于创建和管理项目。
8. ChatGPT 搜索功能全面升级,新增地图集成、实时搜索等功能,向所有用户开放。
9. OpenAI 开放满血 o1 模型 API,实时 API 直接支持 WebRTC,且定价降低 60%。
10. ChatGPT 可入驻手机,拨打免费号码连接聊天机器人,每月可免费通话 15 分钟。
11. 支持原生应用程序自动化协作功能,与 AI Agent 玩法类似,能主动理解用户需求。
12. o1 的下一代模型 o3 亮相,有正式版 o3 和精简版 o3-mini 两个版本。