本栏推荐

快讯信息

发布时间：2023年09月07日 10:50:38 腾讯人已围观

简介国产大模型正进入长跑阶段，从追求参数数量转向重视实际应用。2023年9月7日，腾讯全球数字生态大会上，腾讯混元大模型首次亮相，并宣布将通过腾讯云对外开放。该模型是腾讯自主...

国产大模型进入了持续发展的阶段，从注重参数数量转向注重实用性。

在2023腾讯全球数字生态大会上，腾讯正式推出了混元大模型，并宣布通过腾讯云向外开放。

腾讯混元大模型是腾讯自主研发的通用大语言模型，参数超过千亿，预训练数据超过2万亿tokens，能够在中文创作、复杂逻辑推理以及任务执行等方面展现出强大的能力。

引人注意的是，腾讯混元大模型遵循“从实践中来，到实践中去”的理念，是一款实用型大模型。目前，超过50个腾讯业务和产品如腾讯云、腾讯广告、腾讯游戏等已接入该模型进行测试，并取得了初步成果。

据了解，混元大模型将成为腾讯云MaaS服务的核心，客户不仅可以通过API调用该模型，还能将其作为基础，开发适用于不同产业场景的专属应用。

腾讯集团的高级执行副总裁、云与智慧产业事业群CEO汤道生指出：“人工智能以大模型生成技术为核心，已成为数字化发展的新动力，并为解决行业困难提供了全新的视角。大模型必须依托于行业场景与企业数据的结合，方能释放出更大的价值。”

持之以恒，全链路技术自研

腾讯集团副总裁蒋杰表示，混元大模型从第一个token开始进行从零到一的训练，涵盖了从算法模型到机器学习框架，再到基础设施的全链路自主研发技术。

腾讯集团副总裁蒋杰

自2021年起，腾讯推出了千亿和万亿参数的大规模稀疏NLP模型，刷新了CLUE三大榜单的记录，在中文理解能力上实现了重要突破。

目前，业内的大模型应用仍然受限，主要集中在容错率高、任务简单的休闲场景。腾讯通过自主创新算法，提升了模型的可靠性和成熟度。

针对大模型产生“虚假信息”的问题，腾讯优化了预训练算法和策略，使混元大模型的误差率相较于主流开源模型降低了30%至50%；利用强化学习技术让模型更好地识别问题陷阱；通过位置编码的优化，提高了处理超长文本的效率和性能；并提出了新的思维链策略，使大模型能更好地在实际场景中进行推理和决策。

同时，腾讯还自主研发了机器学习框架Angel，使得训练速度比行业主流框架提升了1倍，推理速度提升了1.3倍。

腾讯混元大模型全链路自研

得益于全面的自主研发技术，腾讯混元大模型能够理解上下文与长篇记忆功能，流畅进行专业领域的多轮对话。此外，它还能够进行文学创作、文本摘要、角色扮演等多种内容生成，充分理解用户意图，并高效、准确地提供及时反馈。

Tags：腾讯