写真やPDFのデータを文字に起こしたいという場合があると思います。
そんな時は、OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)を
利用するとデータに変換することができます。
OCR機能は、いろんなところで提供されていますが、一番簡単に利用できるとのはGoogleだと思います。昔は、プリンターを購入するとソフトの中にOCR機能が入っていました。
10年前ぐらいにも、Googleとは別のOCRを使ったことがありますが、誤字脱字があり精度が悪かった印象があります。
Googleはすごいです!進化し続けています。2021年のGoogleのOCRですが、精度が上がり、確実に利用できると思います。しかも無料で利用できます。
GoogleのOCR
画像やPDFを「Googleドライブ」に置き、「Googleドライブ」から「Googleドキュメント」で開くと自動でデータ化されます。
OCRできる条件
- 形式: .JPEG、.PNG、GIF、PDF(複数ページのドキュメント)の各ファイル。
- ファイルサイズ: ファイルは 2 MB 以下
- 解像度: テキストの高さは 10 ピクセル以上にします。
- 向き: ドキュメントは正しい向きにします。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードします。
- フォントと文字セット: 最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用します。
- 画質: 明るさが均一でコントラストがはっきりしたシャープな画像が最適です。
写真を文字にする手順
写真を撮ります!
「Googleドライブ」にアクセスします。
撮影した画像を「Googleドライブ」にアップロードします。
画像の上で右クリックし、Googleドキュメントで開く。
1ページ目
2ページ目
OCRで下記の文字データが取得できました!!!!素晴らしい
「 東京オリンピック サッカー 楽しみ
見るぞ 」
また、横に書いた文字、縦に書いた文字どちらも試しましたが、
どちらも、高い精度で文字にできていると感じました!。
コメント