本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 科技圈快讯 > 最新 >

OpenAI 发布 o3 最强推理模型,AGI 能力飙升比肩人类

发布时间:2024年12月21日 08:21:44 最新 人已围观

简介OpenAI 推出迄今最强前沿推理模型升级版 o3,号称在某些条件下表现超越 GPT-4。...

12 月 21 日消息,OpenAI 历时 12 天的圣诞发布活动迎来了激动人心的终章,重磅推出了收官新品,即其迄今最强前沿推理模型的升级版——o3。 OpenAI 表示,o3 在某些情况下已接近通用人工智能(AGI)水平,共有 o3 和 o3-mini 两个版本。 据评估,o3 在软件工程测试中的准确率比 o1 高出近 47%,在竞赛数学测评中的准确率比 o1 高 15%,在人类博士专家级生化物测试中的准确率比 o1 高近 13%。 在 AGI 相关测试中,o3 取得了最佳成绩 87.5,突破了人类水平门槛 85,显示出在迈向类人智能方面取得了重要进展。 相比之下,GPT-3 的评测结果为 0%,GPT-4o 为 5%,而 o3 则将成绩大幅提升至 87.5%。 OpenAI 计划于明年初发布 o3 系列模型,CEO Altman 暗示可能在一段时间内不会向大众推出这类模型,希望在正式发布前先建立一个联邦政府的测试框架,以指导、监控并降低这类模型的风险。 从本周五开始,OpenAI 允许安全研究人员注册访问 o3 和 o3-mini 的预览版。 此外,OpenAI 在 12 天的技术直播中还发布了以下要点: 1. 推出“满血版”推理模型 o1 和 ChatGPT Pro(每月订阅费 200 美元)。 2. 推出强化微调研究项目,可使用数十到数千个高质量任务定制模型。 3. 正式推出 AI 视频生成模型 Sora Turbo,最高支持 1080p 20s 视频。 4. 发布升级版 Canvas 创作助手,主打高效编程与写作,向全量用户开放。 5. 与苹果合作发布 iOS 18.2,Siri、写作工具和 Visual Intelligence 与 ChatGPT 深度集成。 6. 全量上线 4o 视频通话,能实时对话并理解用户的连续性动作,也具备记忆功能。 7. 推出 Projects In ChatGPT,可整合 ChatGPT 的各种功能,便于创建和管理项目。 8. ChatGPT 搜索功能全面升级,新增地图集成、实时搜索等功能,向所有用户开放。 9. OpenAI 开放满血 o1 模型 API,实时 API 直接支持 WebRTC,且定价降低 60%。 10. ChatGPT 入驻手机,拨打免费号码可连接聊天机器人,每月可免费通话 15 分钟。 11. 支持原生应用程序自动化协作功能,与 AI Agent 玩法类似,能主动理解用户需求。 12. o1 的下一代模型 o3 亮相,推出了正式版 o3 和精简版 o3-mini。

Tags: OpenAI o3  OpenAI