TOP/TOPPANグループのくずし字AI-OCRとこれまでの取り組み
ご相談・お問い合わせ
くずし字AI-OCRの
取り組みと事例紹介
TOPPANグループのくずし字AI-OCRと
これまでの取り組み
現代人には難読になってしまった「くずし字」。多くの方が手軽にくずし字を読めるように、TOPPANグループでは、「くずし字OCR」の研究開発に取り組んでいます。※OCR:Optical Character Recognition(光学文字認識) OCRでくずし字を認識できるようにするには、まず、くずし字の字形を網羅的に収集した「字形データベース」が必要になります。そこで、TOPPANグループが開発したのは、字形データベースを効率的に製作できる独自システム。これまで様々なジャンルの文字を対象に、数百万点のデータベースを蓄積してきました。
2015年には、公立はこだて未来大学の寺沢憲吾准教授が開発した「文書画像検索システム」と連携し、くずし字OCRが実現可能であることを原理検証。現在はAI-OCRによる文字認識に取り組んでいます。
くずし字AI-OCR
近年では、AI(人工知能)技術の進展により、人工知能ベースのOCRシステム(AI-OCR)の開発が可能に。これまでに蓄積した字形データベースをAIに学習させることで、精度の高いくずし字AI-OCRを実現。「ふみのは®」で各種サービスをご提供できるようになりました。
さらに、ふみのはシステムは、AI-OCRで読めなかった文字データを収集し、AI-OCRを再生成することも可能です。古文書を目視で読み進めるたびに、少しずつAI-OCRの精度が向上。くずし字がより多くの方に身近なものとなるような環境を実現しています。
くずし字AI-OCR
くずし字AI-OCRの仕組み
くずし字AI-OCRの仕組み
事例紹介
ご相談・
お問い合わせ
関連コンテンツ