AcrobatでOCRをする


AcrobatでOCRを使って文字認識する

 当サイトでは、本の裁断やスキャンから、iPadでPDFを閲覧する方法まで、自炊について知っておきたいことをすべて解説しています。自炊を始めたばかりの方や、これから自炊をしようと検討している方は、ぜひこちらを参考にしてみてください。

 

 ここでは、ScanSnapを使ってスキャンした本のPDFデータを、付属のPDF編集ソフト「Acrobat」を使ってOCR(文字認識)する方法をご説明します。

FUJITSU ScanSnap S1500

36547円

 

 

 

 以下では、「裁断機で本を裁断する」と「ScanSnapで本をスキャンする」で使った『IDEA HACKS!』という本を例に説明します。

操作手順

 まず、スキャンして保存したPDFファイルを付属の「Adobe Acrobat」で開きます。もし、まだソフトをイントールしていない場合は、付属のCDを使ってインストールしてください。

 

 

 次に、上部のメニューバーの「文書」→「OCRテキスト認識」→「OCRを使用してテキストを認識」をクリックしてください。

 

 

 すると、下のような画面が表示されます。デフォルトの設定に変更を加える必要があるので、「編集」をクリックしてください。

 

 

ここで設定するのが、上から順に「言語」、「形式」、「圧縮レベル」です。

 

 

 「言語」は、本に使われている言語を選択します。英語の参考書やバイリンガル本など日本語と英語が2つ使われている場合は、用途にあわせてどちらか1つの言語を選択してください。PDF内検索に使いそうな言語、文章のコピペで使いたい言語を選べば良いと思います。

ちなみに、英語を選択した場合は、英単語のスペルチェックをするので英語の認識精度は非常に高いですが、日本語は全く認識されません。日本語を選択した場合は、英語のアルファベットも一応認識できますが、スペルチェックはされないので認識精度は低くなります。

 

 「形式」ですが、A「検索可能な画像(非圧縮)」を選べば大丈夫です

 

 

一応、下に3つの選択肢の意味を書いておきます。

 @「検索可能な画像」とA「検索可能な画像(非圧縮)」は、スキャンしたときの文字の画像はそのままで、見えないところにテキスト情報を埋め込んで検索できるようにする形式です。@の場合は、さらにPDFの画質を落としてファイルサイズを小さくするときに使います。
 B「ClearScan」は、PDFの文字の画像をOCRで認識したテキスト情報に置き換える形式です。文字が画像からテキスト情報に変換されるので、ファイルサイズはかなり小さくすることができますが、間違って認識された文字は間違ったまま表示されます。

 

 設定が完了したら「OK」をクリックして、戻った画面でもさらに「OK」をクリックします。すると、OCRが始まり、右下にOCR処理の状況が表示されて、本のページもOCR処理中のページへと移動していきます。

 

 

 パソコンの処理速度や本のページ数、文字量などによってOCRにかかる時間は変わりますが、だいたい300ページの本で5〜10分くらいかかると思います。
 *OCRの処理中は別のPDFファイルをAdrobatで開くことはできないので、開きたい場合は右クリックの「プログラムから開く」からAdobe Readerなど別のビュアーソフトを利用する必要があります。

 

 OCRが終わったら、最後に上書き保存をして完了です。




★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★

この記事が参考になりましたら、クリックしてシェアしていただけると嬉しいです。

  

このエントリーをはてなブックマークに追加

この記事を読んだあなたにオススメの記事は…

自炊した本をiPadで読む

PDF化した本をiPadに転送して読むためのアプリをご紹介します。

自炊(本の電子化) 関連記事

自炊(本の電子化)とは
本をスキャンしてPDF形式で保存する「自炊」(本の電子化)とそのメリットを説明します。
自炊に必要なもの
自炊(本の電子化)に必要な「裁断機」と「スキャナ」をご紹介します。
裁断機で本を裁断する
裁断機を使って本を裁断する方法を説明します。
ScanSnapの設定(初回のみ)
ScanSnap Managerの設定方法を解説します。
ScanSnapで本をスキャンする
実際にScanSnapを使って本をスキャンする方法を詳しく説明します。
AcrobatでOCRをする
Adobe Acrobatを使ってPDFをOCR(文字認識)する手順を説明します。
自炊した本をiPadで読む
PDF化した本をiPadに転送して読むためのアプリをご紹介します。