インソースマーケティングデザイン
2015.11.25 ディレクション
超絶便利!画像化されている文字からテキストを抽出できるGoogleドキュメント(OCR)
ディレクターの籐です。
随分寒くなってきましたね。というか、そろそろ師走ですよね。
最近ちょっと記憶力に自信がなく、今年どんなことしてたかちっとも思い出せないのですが、きっとよい1年だったのではないかと思います。
そろそろ大掃除の準備をはじめないとですね。僕はお風呂掃除担当なのですが、毎年大量のカビキラーを消費するので、いっそのこと自分でカビキラー作れないかと、次亜塩素酸ナトリウムを20kgも買ってしまいました。
これで、当分カビキラーには困らなそうです。
ちなみに、お風呂系洗剤など酸性の洗剤と次亜塩素酸ナトリウムは絶対に混ぜてはダメ!!です。
昔、お風呂掃除をしている時、知らない内に混ざってしまい、呼吸困難を起こしかけたことがあります。
っていうか、お風呂洗剤もアルカリ性にできないんだろうか?結構混ざりそうなシーンてありそうな気がするけど・・
さて、今日は「画像化された文字からの文字起こし」を少し楽にする方法を紹介します。
みなさんも一度は経験あるのではないでしょうか、「テキストデータがなくて・・印刷物からなんとかならない?」
という場面。
数行であれば楽勝なんですけどね。数10ページ規模になってくると目眩がしますよね。
そこで、今日はこの文字起こしを多少楽にする「Googleドキュメント」を利用したOCRの手順をまとめてみました。
こんな感じです。(※手書きだとできません)
目次
「Googleドキュメントを利用したOCR手順」
(1) できるだけ鮮明な画像を用意する
(2) Googleドライブにアクセス
(3) Googleドライブに画像をドラッグアンドドロップ
(4) アップした画像をGoogleドキュメントで開く
(1) できるだけ鮮明な画像を用意する
まず、文字起こししたい元となる画像を用意します。印刷物の場合はできるだけ鮮明な文字となるようにスキャンします。
Photoshopなどの画像編集ソフトを持っている場合は、コントラストを高めると良いかもしれません。
ちなみに、手書きの文字だとまったくできませんでした。(^_^;)
(2) Googleドライブにアクセス
GoogleドライブはGoogleアカウントを持っていれば使えるんじゃないかと思います。
とりあえずGmailにログインしてみましょう。
ログイン後右上にGoogleアプリボタンが表示されているかと思いますので、Googleアプリボタンをクリックして下さい。
表示されたアプリの中から、「ドライブ」をクリックします。
マイドライブが表示されればOKです。
(3) Googleドライブに画像をドラッグ&ドロップ
マイドライブのファイルが表示されているエリアへ、今回OCRしたい対象の画像をドラッグアンドドロップします。
ドロップすると自動的にアップロードが始まるかと思います。
(4) アップした画像をGoogleドキュメントで開く
アップロードが無事終わりましたら、アップされた対象のファイルを右クリックしていただき、
表示されたメニューの中から「アプリで開く > Googleドキュメント」を選択して下さい。
Googleドキュメントが自動で開くと思います。
上の方には、元の画像が貼り付けてありますが、下の方へスクロールしていくと・・・
画像内の文字がテキストデータに変換されているのが確認できるはずです。
どうでしょう。OCRなので漢字がおかしな漢字に変換されていることもありますが、ほぼほぼ出来てるんじゃないかと思います。
まぁ完璧ではないので結局最初から呼んで確認していく作業は必要になるんですけどね。
打ち込んだほうが早いという場合もありますが、元の画像次第ではそれなりに作業を楽にしてくれるかもしれません。