TOPPAN SOLUTION

おもてなしサポートの目指すもの 多言語自動翻訳のこれから

多言語音声翻訳VoiceTraを開発

情報通信研究機構(NICT)では、多言語音声翻訳技術VoiceTraを開発し、スマートフォン用アプリとして無料で提供しています。例えば、日本語で「駅はどこですか」などと話しかけると、音声が通信ネットワークを通してサーバに送られ、翻訳処理ののち、外国語の音声がスマートフォンに戻ってきて出力されます。スマホやタブレット端末さえあれば、どこでも翻訳が可能となるアプリです。
VoiceTraの翻訳結果を、いろいろなTOEICスコアの人の翻訳能力と比較したところ、現在のシステムはTOEIC600点の人とほぼ匹敵する能力を持っていることがわかりました。600点というと、平均的な日本人よりは翻訳能力が高いということになります。

多言語音声翻訳システムの仕組み

翻訳システムの仕組みを確認してみましょう。まず下の図の左側の「音声認識」で音声を文字に変換し、次に「多言語翻訳」で文字を外国語に翻訳、最後に「音声合成」で文字を外国語の音声に変換します。
一番下の「コーパス」という部分が非常に重要で、日本語のさまざまな表現や音声などのデータを収集したものです。例えば、対訳コーパスは同じ意味になる日本語と外国語のペアを大量に集積したものです。そして、対訳コーパスに基づいて、同じ表現でも場面や使い方に合わせて翻訳するための確率付対訳辞書を自動的に作成するようになっているのです。システムを作る時に、この「コーパス」をどれだけ集めるかが、翻訳精度を高めることにつながります。この「コーパス」を使った統計翻訳を用いると、多言語の翻訳システムが簡単に作れるというところがメリットの一つです。
また、会話のような短い文章だけではなく、特許庁とも協力して、外国語の特許文献の長文が自動翻訳できる、高性能なシステムの開発にも取り組んでいます。

多言語音声翻訳の仕組み
統計翻訳(SMT)

研究開発のこれまでの経緯

多言語音声翻訳の研究は1986年から始まっていました。そして、やっとこうやって皆さんに使っていただけるところまできました。世の中に出るまでに30年くらい掛かっています。
最初は「けいはんな」(関西文化学術研究都市)という、京都と大阪と奈良のまん中にある学研都市でシステムづくりが始まりました。2007年に官邸で行われた総合科学技術会議で、安倍首相がわれわれのシステムを見て大変評価していただき、予算が手厚く手当されるようになって、研究が一気に加速したのです。日本全国の観光地で旅行会話の実証実験が行われ、得られた大規模実験データを活用することで、音声認識や翻訳の精度が飛躍的に向上しました。現在では、NTTドコモの「しゃべってコンシェル」やauの「おはなしアシスタント」などにも、われわれの技術が使われています。

オールジャパンで研究開発に取り組む

2014年4月、新藤前総務大臣がグローバルコミュニケーション計画を発表しました。東京オリンピック・パラリンピック等に向けて、音声翻訳技術を広く社会に普及させ、世界の「言葉の壁」をなくそうという計画です。第2次・第3次安倍内閣でも、多言語翻訳システムに関する研究開発および社会実装の予算が付くようになりました。
NICTでは組織変更を行い、専門の研究組織として「先進的音声翻訳研究開発推進センター」を「けいはんな」に設置し、センター長にはNICTの益子信郎理事が就任しました。トッパンさんをはじめ多くの企業の協力を得ながら、日本中の研究者が集まって研究開発を進めています。
さらにNICTだけではなく、文字通り「オールジャパン」で研究に取り組もうと「グローバルコミュニケーション開発推進協議会」が、2014年12月に設立されました。開発推進のためのアイデアを募る目的で、現在115の企業や自治体、大学、研究機関等が会員になっています。通信キャリアや電機メーカーだけでなく、サービス関係や交通・観光関係、病院などさまざまな分野の企業や機関が集まり、幅広く社会展開するための検討を行っています。

さまざまな場面での利用に期待がかかる

「こえとら」とは東京マラソンでは、音声翻訳機としてVoiceTraを使用していただきました。今後も毎年使うことで、翻訳精度を鍛えていこうと考えています。また、5月に東京で開催された国際ユース(U-14)サッカー大会でも、実際に使用してもらいました。
2020年の利用イメージは、どこでも使えるということです。例えば、病院でのコミュニケーションの80%は、看護士さんの日常のケアだそうです。そうすると専門的な表現よりも、比較的簡単なことがきちんと伝わることが重要になります。今年の1月から3月まで、実際に東大病院で実験をしました。最初は総合受付からでしたが、今後は、病棟や検査等でも実験を実施し、さらに、多言語化を実現していきます。
また、翻訳とは違う形になりますが、このシステムを応用して「日本語→日本語」のシステムも開発しました。これは、聴覚障がい者の方と健聴者の円滑なコミュニケーションをはかるもので、音声で入力した文章を文字で出力、文字入力された文章を音声で出力します。このシステムは「こえとら」という名前のアプリとしてリリースされ、2万近くダウンロードされています。
このように多言語翻訳技術は、これからますます多方面での発展・利用が期待されています。

隅田 英一郎(すみた えいいちろう)氏
国立研究開発法人 情報通信研究機構(NICT) ユニバーサルコミュニケーション研究所 副所長 隅田 英一郎(すみた えいいちろう)氏
日本IBM、ATRを経て、現職。一貫して自動翻訳の研究開発に携わり、研究と技術移転で受賞多数(2010年文部科学大臣表彰・科学技術賞 (開発部門)、2013年産学官連携功労者表彰・総務大臣賞、2014年アジア太平洋機械翻訳協会長尾賞等)。

ページトップへ