本栏推荐

快讯信息

发布时间：2021年06月24日 19:31:42 阿里巴巴人已围观

简介一位北大硕士生在校期间在国际顶级会议ACL上成功发表8篇论文，包含2篇第一作者，引发了知乎热搜。然而，在热搜后，她似乎低调许多。如今，她携手阿里达摩院展开深度技术研究，备...

曾经有位北大硕士生，她在校期间在国际顶尖会议ACL上一次性发表了8篇论文，其中两篇是第一作者，并因此登上了知乎热搜榜。

但是之后，这位"论文怪才"似乎逐渐淡出了公众视野。

今天，她以阿里达摩院的深度语言模型体系AliceMind的面貌重返公众视野。

被称作“AI萝莉”的罗福莉，正是这次AliceMind七个模型开源的主要负责人。

她的故事确实很“传奇”。

在上大学之前，她几乎没有接触过电脑，但她意外入读北师大计算机专业。

起初由于缺乏基础，她努力学习，迅速进步到班级前几名。

大三时，她在北大语言计算实验室实习，选择了自然语言处理（NLP）作为研究方向，并在短短三个月内自学了Python，发表了一篇顶会论文（非一作）。

随后，凭借优异表现她成功保送北大，硕士期间在国际顶会上发表了20多篇论文。

然而，她意外地未选择继续攻读博士学位，而是在2020年毕业后加入阿里达摩院，希望进行更实际的研究。

在工业界工作的这两年，她的论文数量明显减少。

在校园里，大家普遍看重论文数量，而进入工业界后，她开始关注工作的实际落地价值和领域影响力。

在达摩院，她主导开发了名为VECO的跨语言预训练模型，成为AliceMind中的一员。这次AliceMind的集体开源，她承担了重要责任。

简单的模型最令人欣赏

罗福莉在工业界工作一年，与在学术界的心态有了显著变化：

在校园时总是追求复杂难懂的模型，审稿人也难以理解，而在工业界时却发现，易于理解且有效的模型才是最优秀的。

这正是她所在达摩院深度语言模型团队的核心理念，他们研发的AliceMind的八个模型在GLUE、CLUE、XTREME、VQA Challenge、DocVQA、MS MARCO等六大NLP权威榜单中取得了优异成绩。

AliceMind中“Alice”的含义其实非常简单，就是Alibaba的Encoder-decoder集合。

其模型设计也秉持这一理念，都是从实际业务需求出发，基于Encoder-decoder进行创新和改良。

通用语言模型StructBERT是在BERT基础上增加的词级和句级两个新目标函数，使得AI具备“汉字序顺不影响阅读”的能力。

这是因为团队在阿里的业务中发现，用户在电商、娱乐等轻松场景中经常出现语法和语序不规范的情况。

因此，语言模型需要在面对这些不规范句子时，依然能够准确理解并作出合适的回应。

AliceMind最近在多模态权威榜单VQA Challenge 2021中再次夺冠。

VQA Challenge的任务类似于看图问答，给出一张图像及相关自然语言问题，AI需要提供准确的自然语言答案。