本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 品牌 > 阿里巴巴 >

阿里达摩院发布开源深度语言模型体系AliceMind,横扫六大权威榜单

发布时间:2021年06月22日 14:20:50 阿里巴巴 人已围观

简介阿里巴巴达摩院正式开源了深度语言模型体系AliceMind。经过三年的研发,AliceMind基于通用语言模型StructBERT,扩展到多语言、生成式、多模态、结构化和知识驱动等多个领域,展现出全面...

我们得知,阿里巴巴达摩院已经正式发布了深度语言模型体系AliceMind的开源版本。

经过三年的研发,AliceMind在通用语言模型StructBERT的基础上,延伸至多语言、生成模型、多模态、结构化和知识驱动等多个领域,表现出全面的能力;其在GLUE等六大权威AI榜单上获得了顶尖成绩,并于6月被选入2021年世界人工智能大会的最高奖SAIL奖TOP30榜单。

达摩院的相关负责人表示,开源的目标是降低行业内研究和创新应用的门槛,推动语言AI迈向工业化的新时代。

自然语言处理(NLP)被誉为AI领域的瑰宝,但传统NLP模型的构建过程复杂且费时,具体用途也相对单一且难以复用,类似一个手工作坊。然而,近年来兴起的预训练语言模型正在改变这一现状,有望推动语言AI走向可大规模复制的工业时代。可以类比炼钢,以前要创建一个可用的NLP应用模型,需从铁矿石开始,周期长、成本高、产量低;而现在有了开源的预训练语言模型,相当于提供了现成的粗钢,开发者只需进一步加工成所需的特定钢材,极大提高了效率。

据介绍,AliceMind深度语言模型体系包括了通用模型StructBERT、多语言VECO、生成式PALM、多模态StructVBERT、结构化模型StructuralLM、知识驱动的LatticeBERT、机器阅读理解UED,以及超大模型PLUG等,大部分已经开源发布。(https://github.com/alibaba/AliceMind)

AliceMind在GLUE Benchmark和多语言XTREME等六个权威AI榜单中都取得了优异成绩,上周再度在类似看图问答的多模态权威榜单VQA Challenge 2021中获胜,AI需要根据给定的图像和相关自然语言问题提供准确的自然语言答案。

AliceMind在与微软、Facebook等国际顶尖团队的竞争中脱颖而出,将去年的得分76.36%提升至79.78%,接近人类水平(80.78%)。

持续的创新与进步是AliceMind保持领先的关键。达摩院团队在BERT基础上提出了优化后的StructBERT模型,并在2020年多次赢得NLP顶级赛事GLUE Benchmark的冠军。该模型通过在句子和词级别引入两个新的目标函数,有点像为AI安装了“语法识别器”,使其能够在面对语法问题时依然准确理解并回应,从而显著增强机器的语言理解能力。而这次在VQA Challenge 2021中获胜的多模态模型StrucVBERT,则结合了通用模型StructBERT与结构模型StructuralLM,并引入了文本与图像的模态,以更高效的视觉特征和创新的注意力机制在统一的多模态语义空间中进行综合建模。

目前,AliceMind支持超过100种语言,具备阅读、写作、翻译、问答、搜索、摘要生成及对话等多种功能,已成为阿里巴巴语言技术的基础,每日调用量超过50亿次,活跃应用场景超200个,已在跨境电商、客户服务、广告等多个核心领域落地应用。在阿里之外,AliceMind同样广泛服务于医疗、能源、金融等多个行业。例如浙江电网公司基于AliceMind打造了智能运维平台,应用于变压器维修、供电抢修等,已开始在整个国家电网公司进行推广。

Tags: 达摩院  阿里巴巴