Microsoft News Japan

Windows10 や Microsoft Office、Hololensなど、Microsoft の製品に関する最新情報やニュースをまとめていきます。Microsoft や日本マイクロソフトとは一切関係ありません。(現在一部工事中)

Google Drive の「OCR 機能」が便利【Google Docs 文字起こし ドキュメント 精度 比較 スマホ iPhone Android Office Lens】

 

Google Drive には「OCR 機能」があります。

 

OCR とは「光学文字認識」(Optical character recognition)の頭文字を取った語で、

スキャナーなどで読み取った画像の中にある文字を

文字コードの列に変換する技術のこと。

 

例えば、本の一説を Word に入力したい場合、

従来なら本を見ながら文字を手作業で打っていたところを

Google Drive を使えば、

一瞬で文字コードにすることができるわけです。

 

では、やり方をご紹介しましょう。

 

スキャナーやスマートフォンで画像データや PDF に変換する

文字データにしたいものをスキャナーで読み取るか、

スマートフォンで画像データか PDF にして

PC へ転送するか、Google Drive アプリへ直接アップロードします。

 

対応している拡張子は以下の通り

JPEGPNG、GIF、PDF

 

今回は以下の記事から文字データのない PDF と JPG を作り、

精度を検証したいと思います。

 

microsoftnews.hatenablog.jp

 

OCR 機能の使い方

複数のファイルを処理する場合、

1回の処理につき、

アップロードしたファイルと

OCR の処理が施された後の文字データが入ったファイル

の2つができるので、

ちらばらないように専用のフォルダを作っておくとよいでしょう。

f:id:shoplists:20190211013626p:plain

 

今回は「OCR」というフォルダを作成しました。

f:id:shoplists:20190211014229p:plain

左上の「+新規」をクリックします。

 

 

f:id:shoplists:20190211013834p:plain

 表示されるメニューから「ファイルのアップロード」を選択します。

 

 

f:id:shoplists:20190211014337p:plain

アップロードするファイルを選択します。

これでアップロードが完了します。

 

f:id:shoplists:20190211014425p:plain

 

OCR 処理を施したいファイルを右クリックし、

表示されるメニューの中から

「アプリで開く」→「Google ドキュメント

を選択します。

 

f:id:shoplists:20190211014551p:plain

 別のタブが開き、処理が始まります。

(量によっては1分近くかかることもあります)

 

f:id:shoplists:20190211014626p:plain

通常の Google ドキュメントの画面が開きます。

ファイルの中を見ると、

文字データに変換されていることがわかります。

 

変換の精度は?

今回の検証に使った PDF ファイルと変換結果のリンクを以下に示します。

drive.google.com

docs.google.com

 

結果

  • 概ね正確に変換できている。
  • 文字の大きさやフォントがバラバラになっているが、Windows のメモ帳などに貼り付ければ、問題ない。
  • 中途半端なところで改行が行われており(元の記事通りのところもありますが)、手作業で改行を整えることが必要。
  • 当然ですが、表などはうまく変換されない。(変換した後、手作業で修正する必要がある。)

 

JPG でもほぼ同じ結果に

JPG ファイルを OCR 機能を使って変換してみたところ、

PDF の場合とほぼ同じ結果が得られました。

 

drive.google.com

 

docs.google.com

スマートフォンだけで OCR 機能を使う方法

PC を使わなくても OCR 機能を使う方法があります。

Google Keep」というアプリを

スマートフォンにインストールする必要があります。

f:id:shoplists:20190818052832p:plain

 画面左下の「メモを入力...」をタップします。

 

 

f:id:shoplists:20190818052837p:plain

キーボードの上に表示されている「+」ボタンをタップします。

 

 

f:id:shoplists:20190818052842p:plain

「写真を撮る」をタップします。

 

 

f:id:shoplists:20190818052846p:plain

カメラが立ち上がるので、書類の写真を撮ります。

写真が撮り終わったら、「写真を使用」をタップ。

 

 

f:id:shoplists:20190818052853p:plain

写真本体をタップすると、上の画面になるので、

右上のメニュー(ペンの右側にある「…」の部分)をタップ。

「画像のテキストを抽出」を選択します。

 

 

f:id:shoplists:20190818052900p:plain

 

すると、画像内に含まれる文字を

文字データとして表示してくれます。

 

精度はかなり高いものでした。

 

以下の PDF をパソコンのディスプレイに表示させ、

それをスマートフォンで撮影し、Google Keep にアップロードしました。

drive.google.com

 

認識結果は以下のようになりました。

iPadMicrosoft Officeをできる限り安く使う方法

【Word Excel PowerPoint無料iPad Pro有料】 (随時更

新)

iPad向けOfficeを使うには月

(年)額使用料が必要

iPad向けの

Microsoft Office (以下Office for iPad)は、

2014年3月に発表され

2014年11月に日本国内でも配信が始まりました。

Office for iPadが、

WindowsパソコンやMac向けのOfficeと異なっているのは、

「買い切り型」の購入方法が用意されていない点です。

パソコン向けのOfficeについては、

 

Google Keep を使う方法以外にも

Microsoft の「Office Lens」を使う方法(OneDrive アプリからも利用可能)や

ジャストシステムの「一太郎Pad」を使う方法があります。

 

機会があれば、精度の比較をしてみたいと思います。

 

OCR は非常に便利な機能なので、

みなさんも使ってみてはいかがでしょうか。

 

Google のサポートページ

support.google.com

 

 

 

 関連記事

 

microsoftnews.hatenablog.jp