最近、GoogleドライブやLINEなどで写真から文字を抽出してテキスト化するサービスが話題になっていますが、そもそもOCR(文字認識)の精度ってどのくらいか気になりますよね。
筆者もどうしてもその懸念があって使っていなかったのですが、改めてその認識精度と使い勝手を調べてみました!
いま話題のOCR(文字認識)できる3つのアプリを検証
今回、比較するのは先日、簡単に全文を文字起こししてくれると話題になった『Googleドキュメント』(Googleドライブも併用)。
LINEで画像を送るだけで文字起こしをしてくれるアカウント「文字起こし君」。
文字起こし系としては古くから存在していた、『Office Lens』の3つで比較をしていきたいと思います。
・Office lens(テキスト化の閲覧には『Microsoft Word』が必要)
文字起こしを検証する文章は、適度に「ひらがな」「漢字」「アルファベット」「数字」「記号」が入った過去のかみあぷ記事を用意。
これを一度プリントアウトしたものを、iPhoneで撮影した画像をそれぞれで取り込んで比較していきたいと思います。
比較にあたっては、以下の2点に注目してみていきますよ。
- 認識精度: どこまで正確に文字をテキスト化できるか
- 使い勝手: テキスト化するための手順や、出力されるデータ形式など
さて一体どこでどんな違いが出るのか、見ていきましょう。
OCR認識精度
まずはGoogleドライブ。テキスト化するにはSafariでGoogleドライブにアップロード ⇒『Googleドキュメント』で開くという手順になるのですが、取り込んだものがこちら。
文字サイズはやや大きめですが、タイトルや見出しだけでなく太字などがちゃんと反映されているのがすごい。
撮影の加減なのか一部改行にスペースが入ったりはしていましたが、1字も誤字がなく完璧な認識となっていましたよ。
続いてはLINEのアカウント「文字起こし君」。
リリースされた当初は自動返信があるのみで、なかなか文字起こししてくれませんでしたが…。あれから一ヶ月以上経過した今は、ちゃんと使えるようになっていました。
仕事放棄しないでやってくれた!文字起こし君はイケてる男子に(笑)
さて肝心なOCRの精度ですが、文章が前後していたり読み取れていない箇所も複数。一部、文章を段落で認識できていないようで、ところどころ変な位置で改行も入っていますね。
文字認識の誤字はありませんでしたが、取り込んだ後に手直ししなければならない箇所も多くお手軽な反面、手間は掛かるかも。
最後は『Office Lens』になりますが、『Microsoft Word』アプリを併せて使っていきます。
と言っても面倒なことはなく、『Office lens』で取り込んで画像のエクスポート先を「Word」に選択するだけで、こんな感じに。
他の2つとは違って、読み取った画像からなるべく似た配置で文字起こししてくれるのが『Office lens』の特徴と言えそうです。しかも画像までちゃんと配置してくれるとは。
そこまではよかったのですが、誤認識による文字化けや濁点抜けがちらほら。うーんおしい。
ということで3つを比較してみた結果は、OCR認識精度としては『Googleドライブ』の圧勝!
誤字のなさに加え他にも雑誌の料理レシピやスクリーンショットを試してみたところ、ほぼ完璧に文字に変換してくれていましたよ。さすがはGoogleですね。
使い勝手
いくら認識精度が高いと言っても、そこまでの手順や使い勝手が悪かったら使いませんよね。ということでその点も見ていきましょう。
まずは『Googleドキュメント』から。SafariからGoogleドライブを開いて、画像をアップロード。
Safariをデスクトップ表示に切り替えて、Googleドキュメントで開く…とiPhoneでやろうとするとちょっと手間が多いのが難点。
また保存形式としては、Googleドキュメント形式のほか、Word形式でのエクスポートにも対応しています。
続いてはLINEの「文字起こし君」。お手軽さでいけばピカイチで同アカウントを友達登録すれば、あとは文字起こししたい画像をトークルームにアップロードするだけ。
文字起こしされたデータはトークとして返ってくるので、保存する場合は長押しコピーからメモなどに貼り付ければテキストとして保存が可能です。
最後は『Office Lens』になりますが、文字起こし自体は『Office Lens』と『Microsoft Word』アプリさえ用意しておけば、簡単。
ただしやっかいなのが、Wordへのエクスポート時にMicrosoftアカウントでのログインを求められる点。
普段からOffice365やMicrosoftの「OneDrive」を使っている人は良いですが、わざわざこの為にアカウントを作るというのはちょっと考えてしまいます。
ということで3つ見てきましたが、手軽さで言えばLINEアカウント『文字起こし君』が断トツとなりますが、Word形式などへの出力も考えるとアカウントを持っている人も多いGoogleドライブに軍配といったところでしょうか。
まとめ
以上、文字起こしに関して調べていきましたが、もうまとめるまでもなくやはり『Googleドキュメント』の圧勝と言っても良いでしょう。
ほぼ完璧な文字認識に加え、GoogleアカウントさえあればSafariだけで文字起こしが完結できる点も高評価。
手軽さだけで言えば、LINEアカウント「文字起こし君」もいいのですが特性を考えると短い文章などちょっとした時に使うのが丁度良さそうです。
『Office Lens』に関しては、レイアウトや写真も一緒に取り込んでWordデータにしたいという場合には最適。ただやっぱりMicrosoftアカウントが必要というのは個人的にはマイナス点。
結局のところ目的に応じて使い分けするのが一番良いという話なのですが、Googleの認識精度はほんとすごいのでぜひ皆さんも一度お試し下さい!