本栏推荐

快讯信息

发布时间：2024年08月05日 07:06:25 腾讯人已围观

简介腾讯的混元大模型在最新的中文多模态大模型SuperCLUE-V基准评测中获得了国内第一名，稳居卓越领导者象限。该评测重点评估了大模型对复杂现实世界的多模态理解能力。...

新标360快讯8月5日报道，在最新发布的中文多模态大模型SuperCLUE-V基准测试中，腾讯的混元大模型凭借其出色表现荣登国内第一，稳居杰出领导者象限。

此次评测的重点是评估大模型在理解复杂现实时所需的关键能力，即多模态理解，也称为“图像生成文本”。

多模态理解的要求是模型能精确识别图像中的元素，理解它们之间的相互关系，并能够生成自然流畅的语言描述。

这一能力不仅考验图像识别的准确性，还反映了模型对场景的全面认知和细节的深入洞察，是衡量模型理解复杂现实世界能力的重要标准。

在这次测试中，参与的有12个国内外代表性多模态理解大模型，腾讯的混元大模型在多模态基本能力和应用能力两个方面均显示出明显的优势，最终获得71.95的高分。

评测标准涵盖了理解的准确性、回应的相关性以及推理的深度等多个维度，从而确保了评估过程的科学性与公正性。

腾讯混元大模型在基础能力方面与海外顶尖模型持平，总得分仅次于GPT-4o，且表现优于CLaude3.5-Sonnet和Gemini-1.5-Pro。

在应用能力方面，由于对中文语境的深入理解，以及在通用知识、常识和图像等多个领域的综合能力，腾讯的混元大模型展现出巨大的实际应用前景。