您现在的位置是:主页 > 品牌 > 腾讯 >
腾讯推出自研混元大模型,现已在腾讯云平台对外开放。
发布时间:2023年09月07日 10:50:38 腾讯 人已围观
简介国产大模型正进入长跑阶段,从追求参数数量转向重视实际应用。2023年9月7日,腾讯全球数字生态大会上,腾讯混元大模型首次亮相,并宣布将通过腾讯云对外开放。该模型是腾讯自主...
国产大模型进入了持续发展的阶段,从注重参数数量转向注重实用性。
在2023腾讯全球数字生态大会上,腾讯正式推出了混元大模型,并宣布通过腾讯云向外开放。
腾讯混元大模型是腾讯自主研发的通用大语言模型,参数超过千亿,预训练数据超过2万亿tokens,能够在中文创作、复杂逻辑推理以及任务执行等方面展现出强大的能力。
引人注意的是,腾讯混元大模型遵循“从实践中来,到实践中去”的理念,是一款实用型大模型。目前,超过50个腾讯业务和产品如腾讯云、腾讯广告、腾讯游戏等已接入该模型进行测试,并取得了初步成果。
据了解,混元大模型将成为腾讯云MaaS服务的核心,客户不仅可以通过API调用该模型,还能将其作为基础,开发适用于不同产业场景的专属应用。
腾讯集团的高级执行副总裁、云与智慧产业事业群CEO汤道生指出:“人工智能以大模型生成技术为核心,已成为数字化发展的新动力,并为解决行业困难提供了全新的视角。大模型必须依托于行业场景与企业数据的结合,方能释放出更大的价值。”
持之以恒,全链路技术自研
腾讯集团副总裁蒋杰表示,混元大模型从第一个token开始进行从零到一的训练,涵盖了从算法模型到机器学习框架,再到基础设施的全链路自主研发技术。
腾讯集团副总裁 蒋杰
自2021年起,腾讯推出了千亿和万亿参数的大规模稀疏NLP模型,刷新了CLUE三大榜单的记录,在中文理解能力上实现了重要突破。
目前,业内的大模型应用仍然受限,主要集中在容错率高、任务简单的休闲场景。腾讯通过自主创新算法,提升了模型的可靠性和成熟度。
针对大模型产生“虚假信息”的问题,腾讯优化了预训练算法和策略,使混元大模型的误差率相较于主流开源模型降低了30%至50%;利用强化学习技术让模型更好地识别问题陷阱;通过位置编码的优化,提高了处理超长文本的效率和性能;并提出了新的思维链策略,使大模型能更好地在实际场景中进行推理和决策。
同时,腾讯还自主研发了机器学习框架Angel,使得训练速度比行业主流框架提升了1倍,推理速度提升了1.3倍。
腾讯混元大模型 全链路自研
得益于全面的自主研发技术,腾讯混元大模型能够理解上下文与长篇记忆功能,流畅进行专业领域的多轮对话。此外,它还能够进行文学创作、文本摘要、角色扮演等多种内容生成,充分理解用户意图,并高效、准确地提供及时反馈。
Tags: 腾讯