サービス概要
「高精度OCR全文テキストデータ化サービス」はトッパンが培ってきた印刷テクノロジーを基に、独自開発のOCRシステムや校正システムを活用することで、高品質なテキストデータを生成します。
旧字などの難易度の高い文字への対応はもちろん、お客さまの活用方法に最適なデータ形式への変換やデジタルアーカイブシステム構築に至るまで、豊富な実績とノウハウを活かしたご提案やご提供が可能です。
- 高精度OCR全文テキスト化サービスの
説明動画がご覧いただけます。
-
高精度OCR全文テキスト化サービス概要図

ページトップへ
他社では真似できないトッパンの高精度OCRの特長
特長1
- あらゆるスタイルの文字を
読み取り可能
- 旧字、和欧文混在、回転文字、ルビ付き文字、白抜き文字、
絵柄の上の文字、表組、手書き文字などあらゆる文字に対応。
従来では困難だった複雑な誌面や明治~戦前の旧文書、
漢文にも実績多数。
特長2
- 精度99.98%※以上
- 独自の校正システムにより精度の高いテキストデータを提供。
高精度なテキストデータは将来に渡りお客さまの情報資産となり、
今後起こりうるデジタルトランスフォーメーションの核として
活用することが可能になります。
※制作要件により精度が異なる場合がございます。
特長3
- 多彩なデータ形式に変換
- プレーンテキストや透明テキスト付きPDFのみならず、
お客さまの活用シーンに合わせたさまざまなデータ形式で
納品します。また、当社OCRシステムは複数データ形式の
書出しにも対応していますので、編集用としてテキストデータ、
検索用にPDFデータ等、多様なご活用が可能になります。
- 代表的な
データ形式
- TEXT/透明テキスト付きPDF/
XML/HTML/EPUB/EXCEL/WORD等
ページトップへ
本サービスの主な活用例
- テキストデータの再利用・
活用で、
新たな価値を創出
- ・AI分析の教師データや自動翻訳に用いるデータ部材として
- ・内外への情報公開やWebサイトコンテンツとして
- ・紙の貴重書からテキストデータを抽出して復刻本を制作
- 働き方改革・業務効率化
実現の
一助として
- ・帳票類、報告書等の紙書類入力業務を高精度OCRで効率化
- ・RPAに必要なテキストデータの作成をシステム化、人手作業減
- ・文書管理システム導入で全社的に資料検索業務を改善
- 検索可能な
デジタルアーカイブとして
- ・過去の年史や社内報等をアーカイブ化して年史編纂業務に流用
- ・カタログやマニュアル等をアーカイブ化して広報・コールセンター等での問合せ業務改善
- ・研究資料や貴重文献をアーカイブ化して図書館や資料館での調査・研究を効率化
採用事例
資料ダウンロード
ページトップへ
2012年、東日本大震災後の東北支援事業として福島県いわき市に生産ライン第一号を構築し、スタートした本サービスは現在では各地で地域雇用促進にお役立ちしています。地域の皆様のお力添えをいただきながら今後も本サービスは研究開発を重ねて発展していきます。