您现在的位置是:主页 > 品牌 > 阿里巴巴 >
北大95后“AI天才”回归:达摩院公布七款开源NLP模型
发布时间:2021年06月24日 19:31:42 阿里巴巴 人已围观
简介一位北大硕士生在校期间在国际顶级会议ACL上成功发表8篇论文,包含2篇第一作者,引发了知乎热搜。然而,在热搜后,她似乎低调许多。如今,她携手阿里达摩院展开深度技术研究,备...
曾经有位北大硕士生,她在校期间在国际顶尖会议ACL上一次性发表了8篇论文,其中两篇是第一作者,并因此登上了知乎热搜榜。
但是之后,这位"论文怪才"似乎逐渐淡出了公众视野。
今天,她以阿里达摩院的深度语言模型体系AliceMind的面貌重返公众视野。
被称作“AI萝莉”的罗福莉,正是这次AliceMind七个模型开源的主要负责人。
她的故事确实很“传奇”。
在上大学之前,她几乎没有接触过电脑,但她意外入读北师大计算机专业。
起初由于缺乏基础,她努力学习,迅速进步到班级前几名。
大三时,她在北大语言计算实验室实习,选择了自然语言处理(NLP)作为研究方向,并在短短三个月内自学了Python,发表了一篇顶会论文(非一作)。
随后,凭借优异表现她成功保送北大,硕士期间在国际顶会上发表了20多篇论文。
然而,她意外地未选择继续攻读博士学位,而是在2020年毕业后加入阿里达摩院,希望进行更实际的研究。
在工业界工作的这两年,她的论文数量明显减少。
在校园里,大家普遍看重论文数量,而进入工业界后,她开始关注工作的实际落地价值和领域影响力。
在达摩院,她主导开发了名为VECO的跨语言预训练模型,成为AliceMind中的一员。这次AliceMind的集体开源,她承担了重要责任。
简单的模型最令人欣赏
罗福莉在工业界工作一年,与在学术界的心态有了显著变化:
在校园时总是追求复杂难懂的模型,审稿人也难以理解,而在工业界时却发现,易于理解且有效的模型才是最优秀的。
这正是她所在达摩院深度语言模型团队的核心理念,他们研发的AliceMind的八个模型在GLUE、CLUE、XTREME、VQA Challenge、DocVQA、MS MARCO等六大NLP权威榜单中取得了优异成绩。
AliceMind中“Alice”的含义其实非常简单,就是Alibaba的Encoder-decoder集合。
其模型设计也秉持这一理念,都是从实际业务需求出发,基于Encoder-decoder进行创新和改良。
通用语言模型StructBERT是在BERT基础上增加的词级和句级两个新目标函数,使得AI具备“汉字序顺不影响阅读”的能力。
这是因为团队在阿里的业务中发现,用户在电商、娱乐等轻松场景中经常出现语法和语序不规范的情况。
因此,语言模型需要在面对这些不规范句子时,依然能够准确理解并作出合适的回应。
AliceMind最近在多模态权威榜单VQA Challenge 2021中再次夺冠。
VQA Challenge的任务类似于看图问答,给出一张图像及相关自然语言问题,AI需要提供准确的自然语言答案。