TOPPAN
凸版印刷株式会社

お問い合わせ

文字の大きさ

  • 大
  • 中
  • 小
  • 製品・サービス
  • IR情報
  • CSR活動
  • ニュースリリース
  • 企業情報
  • 研究開発
  • 採用情報

ニュースリリース検索

2017年04月25日

凸版印刷、くずし字翻刻を手軽に公開
~OCR技術を応用し、誰でも容易にくずし字で書かれた歴史的資料にアクセスできる
Webビューア「ふみのは」を開発、多言語対応により外国人への日本文化紹介にも活用~

 凸版印刷株式会社(本社:東京都千代田区、代表取締役社長:金子眞吾、以下 凸版印刷)は、江戸期以前のくずし字(※1)で記されている古典籍(※2)の文字を判別し、テキストデータに変換する光学文字認識(OCR)技術を2015年に確立。大学や研究機関と共同で実証実験を行っています。
 このたび、くずし字で書かれた歴史的資料の利活用を促進するビューア「ふみのは」を開発。2017年5月から、本ビューアを用いた公開用データ制作サービスの提供を開始します。

 本ビューアは、一般的なWebブラウザで、歴史的資料の原本画像の上に翻刻(※3)や多言語翻訳文を重ねて表示することが可能です。従来の原本画像と翻刻文の画像を重ねて表示する方法とは異なり、翻刻文をテキストとして扱えるため、全文検索やインターネット上の横断検索などにも対応しています。本ビューアの開発によって、くずし字で書かれた歴史的資料がテキストデータとして容易に扱えるようになり、全国各地に眠る貴重な歴史的資料の利活用推進が可能になりました。また、観光立国の実現に向け凸版印刷が従来提供する、訪日外国人の旅の質と利便性向上を目指す「旅道」(たびどう)プロジェクト(※4)の活動とも連携し、地方創生に向けた観光地域づくりやインバウンドビジネスなどへの活用にも取り組んでいきます。
「ふみのは」による表示サンプル(※5)
 なお本ビューアは、早稲田大学坪内博士記念博物館(所在地:東京都新宿区、館長:岡室美奈子)の演劇映像学連携研究拠点「特色ある共同研究拠点の整備の推進事業(演劇映像学連携研究拠点)機能強化支援」の一環として2017年4月25日に公開(※6)される字形データセットの公開手法として採用されました。今後、くずし字判読技術の習得補助や翻刻作業効率化の研究に活用される予定です。
■ 開発の背景
 近年、大規模災害による資料アーカイブの重要性の見直しや専門家の減少、資料の経年劣化による文化継承の危機的状況などから、歴史的資料のデジタルデータとしての保存が求められています。
 凸版印刷が2015年に開発したくずし字OCR技術は、これらのニーズを解決する新たな手法として、大学共同利用機関法人 人間文化研究機構国文学研究資料館(所在地:東京都立川市 館長:ロバート キャンベル)の古典籍共同研究事業センターとの共同研究により実証実験を重ねてきました。一方、貴重な歴史的資料の翻刻や現代語訳を利活用するための手法の確立が求められていました。
 今回、本ビューアを開発したことにより、日本人に限らず、誰でも容易にくずし字で書かれた歴史的資料が読める環境を実現しました。

■ 「ふみのは」の特長
・原本と翻刻文などの対比が容易
ビューア上で原本画像と翻刻文を重ね合わせて表示できるため、原本の持っている味わいを損なうことなく、くずし字で記された文字を読み進めることができます。また、現代語訳や外国語訳などを切り替えて表示することも可能です。
・テキスト検索や翻刻文のコピー&ペーストが可能
翻刻文や現代語訳はテキストデータのため、インターネットからのテキスト検索や、Webブラウザからコピー&ペーストなどの活用が可能です。
・閲覧に専用のアプリケーションが不要
表示データがHTML形式のため、Webブラウザさえあれば、どこでも表示が可能です。
・手軽な公開が可能
HTMLやCSSなどの標準的なWeb技術のみで構成されているため、配信のための専用システムや維持管理コストが不要。ビューア用のデータ制作後、迅速な公開が可能です。
・他の歴史的資料の翻刻効率化
ビューア用データ制作時に採取されるくずし字の字形データセットをくずし字OCRで活用することにより、同系統の字形で書かれた歴史的資料の翻刻作業効率化が可能です。
■ 制作から公開までのワークフロー


■ 価格

原本画像およびテキストから、ビューア用のデータ生成: 2,000円/頁~
(※原本のスキャニング、目視またはくずし字OCRよる翻刻、現代語訳、Webサーバー構築費用等は別途)

■ 今後の展開
 凸版印刷は本取り組みを起点に、全国各地に眠る貴重な歴史的資料の観光資源化や訪日外国人周遊促進など、地方創生に向けた観光地域づくりに取り組んでいきます。
 今後、資料の撮影やOCRなど高精度全文テキスト化サービス事業を推進、2019年度に約10億円の売上を目指します。


※1 くずし字
ひらがな、カタカナ、漢字を崩して書いた手書き文字。
※2 古典籍
江戸時代以前に作られた、内容・形態の優れた書籍。
※3 翻刻
古典籍などの古い文献を現代の活字等を使って一般に読める形式にすること。
※4 「旅道」(たびどう)プロジェクト
観光立国の実現に向け、「何度も旅したくなる日本」をコンセプトに、様々な企業と連携し、訪日外国人目線で旅の質と利便性向上を目指す、凸版印刷の取り組み。
http://www.toppan.co.jp/solution/service/tabido/
※5 山東京山著『大晦日曙草紙』稿本 天保九年 凸版印刷株式会社 印刷博物館蔵
※6 早稲田大学 演劇博物館演劇映像学連携研究拠点 公開サイト
http://www.waseda.jp/prj-kyodo-enpaku/kuzushiji


* 「ふみのは」は凸版印刷株式会社が商標登録出願中です。
* 本ニュースリリースに記載された会社名および商品・サービス名は各社の商標または登録商標です。
* 本ニュースリリースに記載された内容は発表日現在のものです。その後予告なしに変更されることがあります。
以  上