2019年12月19日木曜日

GoogleのサービスでOCR(文字認識)をしてみる

たまにしか使わなくて手順を微妙に忘れてしまうので、メモ。
Googleドキュメントを使って、OCR(文字認識)をさせてみます。




まずは、なにか文字の写っている画像を用意します。4KだとPrint Screenが1回で済むので楽です。

・・・なにが?

画像を作るうえで注意しないといけないのは、文字が小さい(10pt未満?)と認識精度が悪くなるみたいなので、Photoshopで200%くらいに拡大しておきます。


そしたら Google Chrome とかブラウザで Googleドライブにアクセスします。




マイドライブに、何かフォルダでも作成して、そこへ文字の写っている画像をアップロードします。



ここから、間違えやすいポイント。
画像を右クリックして、
アプリで開く > Googleドキュメント
で画像を開きます


Googleドキュメントを立ち上げて、そこから画像を挿入しても文字認識はしてくれないので注意しましょう。たまにしか使わないと、コレをやってしまいます。


しばらく処理アイコンがアニメーションしたのち、Googleドキュメントが開きます。
で、低解像度のモニタだと、単に画像が開いただけに見えますが、2ページ目にテキスト化された文字が並んでいます。


クラウドアプリなので、Googleドキュメントが開いた瞬間、ファイルとしてドライブに保存されています。


Googleドキュメント上の画像はもう要らないので削除。
改行をうまく再現してくれないのは残念ですが、タイピングするより楽できます。


0 件のコメント:

コメントを投稿