写真で撮った文字やPDFの文字をデータにする(画像・PDF⇒データ化)

Google関連

写真やPDFのデータを文字に起こしたいという場合があると思います。

そんな時は、OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)を

利用するとデータに変換することができます。

OCR機能は、いろんなところで提供されていますが、一番簡単に利用できるとのはGoogleだと思います。昔は、プリンターを購入するとソフトの中にOCR機能が入っていました。

10年前ぐらいにも、Googleとは別のOCRを使ったことがありますが、誤字脱字があり精度が悪かった印象があります。

Googleはすごいです!進化し続けています。2021年のGoogleのOCRですが、精度が上がり、確実に利用できると思います。しかも無料で利用できます。

GoogleのOCR

画像やPDFを「Googleドライブ」に置き、「Googleドライブ」から「Googleドキュメント」で開くと自動でデータ化されます。

OCRできる条件

  • 形式: .JPEG、.PNG、GIF、PDF(複数ページのドキュメント)の各ファイル。
  • ファイルサイズ: ファイルは 2 MB 以下
  • 解像度: テキストの高さは 10 ピクセル以上にします。
  • 向き: ドキュメントは正しい向きにします。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードします。
  • フォントと文字セット: 最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用します。
  • 画質: 明るさが均一でコントラストがはっきりしたシャープな画像が最適です。

写真を文字にする手順

写真を撮ります!

「Googleドライブ」にアクセスします。

撮影した画像を「Googleドライブ」にアップロードします。

画像の上で右クリックし、Googleドキュメントで開く。

1ページ目

2ページ目

OCRで下記の文字データが取得できました!!!!素晴らしい

「 東京オリンピック サッカー 楽しみ

  見るぞ 」

また、横に書いた文字、縦に書いた文字どちらも試しましたが、

どちらも、高い精度で文字にできていると感じました!。

コメント

タイトルとURLをコピーしました