主要内容 主要内容

文档解决方案的自然语言处理

深度对齐 - 一部专有技术,语义与两个文件的元素联系起来

背景

文件具有重要作用,作为表达,沟通和存储信息的方式。

人工智能(AI)已经进入了人们希望它理解文档的内容作为帮助简化和自动化任务的解决方案的一部分的级别。

自然语言处理(NLP)是这种高级文档解决方案中的关键技术。

解决方案

深度对准是由理光开发的NLP技术。它自动对齐两个文档,将句子和段落与相似的内容相互对齐。

该技术立即可视化两个文件之间的差异。例如,您可以将合同与另一个或比较类似的文章进行比较,并澄清在其中一个或另一个文件中缺席/存在的信息。

解决方案

技术亮点

深度对齐由下面描述的两种新技术组成。

1.合成个别短语的意义

完整的句子通常可以有几个含义。因此,一个句子太大了一个单位,用于基于单独的含义基于含义用于关联。相比之下,一个单词是最小的含义单位,太弱,无法用于关联,因为它往往出现在多个句子中。

深度对齐使用由多个单词组成的短语,作为关联的键。它综合通过深入学习获得的词语的含义在短语的含义中,从而能够精确结合意义。

1.合成短语的含义

2.处理句子

在机器翻译领域,已经开发了技术以在两个文本中关联原始和翻译句子。传统技术仅具有有限的应用程序,因为它们在其句子顺序方面承担两个文本之间的相关性。

然而,深度对齐,独立于句子顺序工作,因此它可以应用于关联的任务更加友好。它可以应用于一对多关联,其中一个具有多种含义的一个句子与多个不同的句子相关联,甚至是缺少关联对应物的任务。

2.处理句子

理光的愿景

除合同外,深对准还具有许多潜在的应用。提案,规格,规定等等。深度对齐在含义级别的项目将项目与许多任务中的检查过程大大加速和增强。

Ricoh将继续与许多合作伙伴公司同时推广技术,并进一步开发新的NLP技术。