Microsoft News Japan

Windows10 や Microsoft Office、Hololensなど、Microsoft の製品に関する最新情報やニュースをまとめていきます。Microsoft や日本マイクロソフトとは一切関係ありません。

スポンサーリンク

Google Drive の「OCR 機能」が便利【Google Docs 文字起こし ドキュメント 精度】

Google Drive には「OCR 機能」があります。

 

OCR とは「光学文字認識」(Optical character recognition)の頭文字を取った語で、

スキャナーなどで読み取った画像の中にある文字を

文字コードの列に変換する技術のこと。

 

例えば、本の一説を Word に入力したい場合、

従来なら本を見ながら文字を手作業で打っていたところを

Google Drive を使えば、

一瞬で文字コードにすることができるわけです。

 

では、やり方をご紹介しましょう。

 

スキャナーやスマートフォンで画像データや PDF に変換する

文字データにしたいものをスキャナーで読み取るか、

スマートフォンで画像データにして

PC へ転送します。

 

対応している拡張子は以下の通り

JPEG、PNG、GIF、PDF

 

今回は以下の記事から文字データのない PDF と JPG を作り、

精度を検証したいと思います。

 

microsoftnews.hatenablog.jp

 

OCR 機能の使い方

複数のファイルを処理する場合、

1回の処理につき、

アップロードしたファイルと

OCR の処理が施された後の文字データが入ったファイル

の2つができるので、

ちらばらないように専用のフォルダを作っておくとよいでしょう。

f:id:shoplists:20190211013626p:plain

 

今回は「OCR」というフォルダを作成しました。

f:id:shoplists:20190211014229p:plain

左上の「+新規」をクリックします。

 

 

f:id:shoplists:20190211013834p:plain

 表示されるメニューから「ファイルのアップロード」を選択します。

 

 

f:id:shoplists:20190211014337p:plain

アップロードするファイルを選択します。

これでアップロードが完了します。

 

f:id:shoplists:20190211014425p:plain

 

OCR 処理を施したいファイルを右クリックし、

表示されるメニューの中から

「アプリで開く」→「Google ドキュメント」

を選択します。

 

f:id:shoplists:20190211014551p:plain

 別のタブが開き、処理が始まります。

(量によっては1分近くかかることもあります)

 

f:id:shoplists:20190211014626p:plain

通常の Google ドキュメントの画面が開きます。

ファイルの中を見ると、

文字データに変換されていることがわかります。

 

変換の精度は?

今回の検証に使った PDF ファイルと変換結果のリンクを以下に示します。

drive.google.com

docs.google.com

 

結果

  • 概ね正確に変換できている。
  • 文字の大きさやフォントがバラバラになっているが、Windows のメモ帳などに貼り付ければ、問題ない。
  • 中途半端なところで改行が行われており(元の記事通りのところもありますが)、手作業で改行を整えることが必要。
  • 当然ですが、表などはうまく変換されない。(変換した後、手作業で修正する必要がある。)

 

JPG でもほぼ同じ結果に

JPG ファイルを OCR 機能を使って変換してみたところ、

PDF の場合とほぼ同じ結果が得られました。

 

drive.google.com

 

docs.google.com

 

非常に便利な機能なので、

みなさんも使ってみてはいかがでしょうか。

 

Google のサポートページ

support.google.com

 

 関連記事

 

microsoftnews.hatenablog.jp