本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 品牌 > 阿里巴巴 >

阿里Qwen-2傲视群雄,荣登全球开源大模型榜首

发布时间:2024年06月27日 11:15:04 阿里巴巴 人已围观

简介强大的开源生态,阿里巴巴推出的Qwen2-72B指令微调版本成功登顶开源模型排行榜。Hugging Face的联合创始人兼首席执行官Clem对此表示激动,并强调了开源项目在推动技术创新和合作中的重...

新标360快讯6月27日报道,全球著名的开源平台Hugging Face的联合创始人及CEO克莱姆在社交媒体上激动宣布,阿里巴巴最新发布的Qwen2-72B指令微调版 modelo 在开源模型排行榜中蝉联第一。

为了实现一个更加公正和准确的开源大模型排名,克莱姆和他的团队借助300块H100高性能硬件,对全球逾100个主流的开源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严苛的基准测试上进行了全面且深入的评估。

此次重新评估的动机在于,许多开发者过于关注排行榜的排名,导致在模型训练中对评估集数据过度依赖,同时,之前的评估标准对模型来说显得过于简单。因此,本次评估提升了难度要求,以测试这些模型在更高挑战中的真实表现。

引人注目的是,阿里巴巴开源的Qwen-2 72B模型在激烈的竞争中脱颖而出,不仅超越了科技巨头Meta推出的Llama-3,还超越了法国知名的大模型平台Mistralai的Mixtral,成为新的行业先锋。这一成就充分彰显了中国在全球开源大模型领域的领导地位。

对此排名结果,Stability AI的研究总监、在19岁便获得博士学位的坦尼什克表示,他早就预言中国在开源大模型领域的强大竞争力。除了Qwen2,还有零一万物、InternLM、Deepsseek等众多出色的中国开源模型,正在国际舞台上大放异彩。

坦尼什克进一步指出,任何关于中国在开源大模型领域处于劣势的观点都毫无根据。相反,中国在这一领域正在逐渐展现出领导者的形象,引领全球开源模型的发展趋势。

Tags: 大模型  阿里巴巴