しばしばイライラすることの1つは、画像や特定のPDFファイル(たとえば、スキャンしたドキュメントから作成されたもの)からテキストを簡単にコピーできないことです。 ありがたいことに、時間の経過とともにこの問題に対処するソフトウェアソリューションが開発されており、そうでなければ手動でテキストをコピーして再入力するのに費やす時間を大幅に節約できます。 今日のヒントでは、画像およびPDFファイルからテキストをキャプチャできる光学文字認識(OCR)アルゴリズムを使用するCapture2Textと呼ばれるフリーソフトウェアツールについて説明します。
インストールとセットアップ
開始するには、プロジェクトのSourceForgeページに進み、Capture2Textの最新バージョンをダウンロードします。 ソフトウェアはzipアーカイブとして提供され、その時点では専用のインストーラーは含まれていません。 ダウンロードしたら、アーカイブを解凍し、Capture2Text.exeファイルを起動します。 これにより、ソフトウェアが起動し、システムトレイにアイコンが表示されます。
まず、ソフトウェアの設定、特にキャプチャを開始および停止するために使用するホットキー(またはショートカット)を設定します。
私の場合、「Windows + q」キーを使用してキャプチャを開始し、「Enter」キーを使用して停止することを選択しました。 これらのオプションを最適なものに調整できます。 多くの場合、「Windows + s」キーは既にスクリーンキャプチャに使用されていることに注意してください(Microsoft One Noteなどのプログラムによる)。
次のタブで、入力言語(現在7つの言語がサポートされています)およびOCR前処理を使用して精度を向上させるかどうか(強く推奨)を含むOCRオプションを構成できます。 最後に、[出力]タブでは、キャプチャしたテキストをクリップボードに保存するか、別のポップアップウィンドウを起動するかを選択できます。
ソフトウェアの使用
ソフトウェアをインストールして構成したら、キャプチャ開始ホットキーの組み合わせで使用を開始できます。 マウスを使用して、キャプチャするテキストを含む画像上の領域を選択します。 キャプチャを停止するには、キャプチャの停止を選択したホットキーを押します。 テキストは、クリップボード、出力ポップアップウィンドウ、またはその両方にコピーされます。 以下に例を示します。
画像を使用してツールをすばやくテストしたところ、その精度はまともであることがわかりました。 明らかに、このようなツールやOCR全般には制限があります。 たとえば、大幅に変更されたテキスト(非常に筆記体、斜体、または現代)は、まったく機能しない場合があり、まったく機能しない場合もあります。 また、場合によっては、キャプチャボックスの寸法をわずかに調整するか、画像自体をズームして再生すると、より正確な結果が得られます。
スキャンされたPDF文書からテキストをキャプチャする場合、精度は問題ありませんが、キャプチャされた出力には最終的な変更がいくつか必要になります(最初のスキャンの品質に応じて)。 また、特に大量のテキストを変換するように要求された場合、ソフトウェアの処理に数秒かかることがあることに気付きました。
全体的に言って、特に無料で入手できるので、このツールは全体的に良い仕事をしていると思います。試してみることをお勧めします。
補遺2015年11月16日:
別のオプションとして、Googleアカウントをお持ちの場合は、GoogleドライブにファイルをアップロードすることでGoogleのOCR機能を使用することもできます(詳細はこちらをご覧ください)。 さらに、Google Chromeユーザーが使用できるCopyfishというOCRプラグインもありますので、チェックアウトすることもできます。