本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 品牌 > 腾讯 >

腾讯发布高效PDF识别工具:复杂文档解析精确度超过98%

发布时间:2024年06月21日 18:49:17 腾讯 人已围观

简介腾讯云推出了新一代大模型知识引擎,新增文档解析功能。该功能基于腾讯优图实验室自研的多模态文档解析模型,能够进行版面分析,精准定位文档内容,提升信息提取和理解能力。...

新标360快讯6月21日报道,腾讯云推出了新的大模型知识引擎,并新增了一项功能——文档解析!

这项功能基于腾讯优图实验室自研发的新一代多模态文档解析大模型,能够首先进行版面分析,以定位文档中所有内容的类型和位置,随后对文本、表格和公式等进行精准识别,最终按照既定的阅读顺序输出连贯易懂的结果。

例如,当面对没有边框的PDF文档时,它能够通过结合行列关系和元素特征来推测出表格的行列间隔线。

其算法具备推理能力,能够准确恢复表格数据和结构,显著提升识别的准确性。对于那些每次复制表格时数据总是错位的用户来说,这无疑是一个好消息!

除了中英文外,它还支持超过20种语言,以及繁体字和各种生僻字的识别。

更令人振奋的是,它还能够将识别出来的图片和PDF文档转换为Markdown格式进行输出。

腾讯表示,该大模型知识引擎的文档解析功能,目前在处理复杂文档时可达到98%以上的准确率。

现在,这项文档解析功能已经集成到多个产品中,大家可以点击链接进行在线体验。

Tags: PDF  腾讯