TOP/古文書解読サービス
ご相談・お問い合わせ
古文書解読サービス
お客さまが所蔵する古文書や古典籍を解読し、高精度なテキストデータなどをご提供します。
このページでは、古文書解読の基礎と、「ふみのは」の解読サービスについてご案内しています。
古文書とは デジタルアーカイブの流れ 古文書解読の流れ 「古文書解読サービス」の概要と料金表
古文書こもんじょ とは

「古文書」には、古い文書もんじょという広義の意味がある一方で、書かれた目的によって「古文書」「古記録」「古典籍」などにも分類されます。例えば手紙や、契約書や覚え書きにあたる様々な証文、幕府のお触れを掲示した高札といった、人から人へ文字で伝達したものが「古文書」です。備忘録や日記などは「古記録」、そして文学作品や歴史書などは「古典籍」と呼ばれます。「古典籍」の中には、手書きで書かれた写本や、印刷技術によって製作された版本等が含まれます。

また、古文書以外にも、浮世絵をはじめとする絵画や掛け軸などの「美術品」にも、たくさんのくずし字が書かれています。

デジタルアーカイブの流れ

古文書の解読をするためには、事前に資料の整理や画像データ化をすることが大切です。デジタルアーカイブは、まず資料の状態を確認・整理し、目録を作成することからスタートします。劣化の進んでいる古文書に対しては修復計画を立てたり、劣化の進行を防ぐための環境の用意なども重要です。

デジタル化により、WEB公開・展示・出版など、文献資料としての活用度や価値も向上します。

ふみのは 文書系デジタルアーカイブの手順
資料の保全・保管
資料の状態を確認し、保管に最適な環境や設備を整えます。
目録づくり
資料に識別番号を付け、資料の外観が確認できる画像とともにデータベースに登録します。
資料の撮影
資料を撮影・デジタルデータ化することで、貴重な資料の劣化や破損などのリスクを軽減します。
解読
くずし字を判読し、テキストデータにします。さらに読み下し・現代語訳なども行うこともあります。
利活用
WEB公開・展示・出版など、さまざまな活用方法があります。
古文書解読(翻刻ほんこく )の流れ

古文書を、ひろく利活用可能な歴史的資料にするためには、紙の資料から読み取った文字を、書籍やWEBサイトなどの別の形にすることが必要で、翻刻ほんこくと呼ばれます。翻刻には、くずし字を一文字ずつ判別する翻字から、内容理解のための現代語訳まで、さまざまな作業が含まれます。

ふみのは 古文書の解読の手順
翻字ほんじ
古文書を読むためには、くずし字を一文字ずつ判別する作業が必要で、これを翻字と呼びます。しかし翻字をしただけでは、ほとんどの人はそのまま理解することはできません。
校訂・読み下し
校訂とは、翻字された文章に対して、句読点の補完や、仮名漢字交じり文への書き換えにより、読みやすくする作業です。
読み下しとは、漢字ばかりで書かれている候文などに対して、返読文字を解釈し、さらに句読点や「てにをは」などを加えて、日本語として読める状態にする作業です。
現代語訳・翻訳
文の構造をできるだけ維持しつつ、現代文として意味の通じる文にします。原文に縛られず全体の意味やニュアンスを汲み取った意訳を作成したり、必要に応じて説明的な文章を組み込む場合もあります。
海外向けの情報発信のためには、多言語への翻訳が必要です。
「古文書解読サービス」の概要

「ふみのは」の古文書解読サービスは、お客様の所蔵する古文書や古典籍の画像をお預かりして、テキストデータをお返しするサービスです。くずし字AI-OCRによって下読みすることが当サービスの特長です。AI-OCRの下読みから、専門家のチェックによる高品質なテキスト作成まで対応可能です。

    ご注意事項
  • 資料の種類や、文字の形によって価格は上下します。お見積りのためには、デジタルカメラやスマートフォンで撮影した画像や、コピーが必要になりますので、ご用意ください。
  • くずし字AI-OCRの文字認識精度を向上させるためには、できるだけ高品質・高画質の画像データが必要です。(解像度の目安は300dpi以上です)
  • 解読結果は、AI-OCRの精度向上のため、AI-OCRの再学習に使用させていただきます。
    ※お預かりした画像および解読結果を、目的外利用はいたしません。
料金表
古文書(手書き文字)
古典籍(版本など)
品質レベル
下読みのみ
(AI-OCR)
AI-OCR

校正
AI-OCR

校正
下読みのみ
(AI-OCR)
AI-OCR

校正
AI-OCR

校正
目標精度
60%~80
90
98
90
95
99
料金
(コマ単価)
1,000円~
2,000円~
4,000円~
1,000円~
2,000円~
4,000円~
※目標精度は、かすれや虫損等で判読不能な文字を除いて算出します。
※資料の状態や文字の難易度によっては、目標精度を下回ることがあります。
※料金は1コマ(1画像)の単価です。1コマあたり200文字として算出しています。
※上記料金は目安です。文字の量・難易度、内容の専門性等により、価格は上下します。
※ご発注は、合計100,000円以上にて承ります。
※料金は税別です。
※サービス内容と価格は予告なく変更することがあります。
オプション
校訂・読み下し
ひらがなばかりで構成された草双紙等の文章は、漢字への置き換え・句読点の補完等を行い、校訂文を作成します。また、漢字で書かれている和様漢文や候文は、返読文字などを解釈し、「てにをは」や句読点等を加えて、現代日本人が読みやすい文章にします。
※文字の量、難易度、内容の専門性等により、価格が変動します。別途お見積りください。
現代語訳
文の構造をできるだけ維持しつつ、現代文として意味の通じる文にします。必要に応じて説明的な文章を組み込む場合もあります。
※文字の量、難易度、内容の専門性等により、価格が変動します。別途お見積りください。
納品形態
ファイル形式
テキストファイル、MS-Word形式、原本画像付きPDFなどの形式で納品が可能です。
ふみのは®ビューア
ふみのは®タッチ
Web公開や展示に適したビューア用データでの納品も可能です。(別料金)
詳細は「ふみのは®ビューア」、「ふみのは®タッチ」のページをご参照ください。
ご相談・
お問い合わせ
関連コンテンツ