ドキュメントはオフィス業務における情報の表現・伝達・保存の単位として重要な役割を担っています。
人工知能(AI)の発展に伴い,ドキュメントに書かれた内容を理解し,業務の効率化や自動化を支援するソリューションが求められています。
こうした先進的なドキュメントソリューションにおけるキーテクノロジーの1つが自然言語処理(自然语言处理、NLP)です。
リコーが開発した自然言語処理技術ディープアライメント™は2つのドキュメント間で,類似した内容を含む文や段落を自動的に対応づけ(アライメント)します。
この技術により,例えば自社と他社が作成した2つの契約書案の条文を対応づけることで,他社案の不足内容と余分な内容を瞬時に一目瞭然にすることができます。
ディープアライメント™は,次の2つの新規技術で構成されています。
一般に,文は複数の意味内容を含むことがあるため,意味にもとづく対応づけの単位としては大きすぎます。一方,単語は意味の最小単位ですが,複数の文に出現しやすいため,対応づけの手がかりとしては弱すぎます。
ディープアライメント™は,複数の単語からなる語句を対応づけの手がかりとし,ディープラーニングで求めた単語の意味から語句の意味を合成することで,高精度な意味の対応づけを実現します。
従来,自動翻訳の分野では2つのテキスト内の原文と訳文を対応づける技術が開発されてきましたが,両者の出現順に相関があることを前提としているため,適用対象が限られていました。
一方,ディープアライメント™は文の出現順に依存しないため,より一般的な対応づけ問題に適用できます。また複数の意味内容を含む文が,それぞれ異なる文に対応する場合もあります。本技術はこのような1対多の対応や,対応先がないケースにも対応できます。
契約書に限らず,企画書,仕様書,約款など,ディープアライメント™が実現する意味レベルの対応づけによって大幅な時間短縮と品質向上が期待できるチェック業務は多数考えられます。
今後は,このような本技術の水平展開を多くのパートナー企業様と推進するとともに,さらに新たな自然言語処理技術の開発にも取り組んで参ります。