テキスト抽出 - mamo-birdのブログ

画像からテキストデータのみ抽出しようと無料のアプリを検索していた。
何種類かあり、PDFから変換できるのを試してみた。
15日間無料の試用バージョンだ。
しかし英文は抽出できたが和文がヘンテコな化け文字に成る。
和文をそのアプリからインストールしたがやたら時間が掛かる。
　
時間が掛かったのに結局、和文の文字変換は上手く出来なかった。
バカバカしい時間を食ってしまった。
　
そこで今度はGoogleドライブをインストールしてみた。
画像からテキストデータを拾えると言う物だ。
早速、使ってみるとPDFデータの文字がデータ化されて無い部分は
何度やっても読み込まれない。
使い方をネット検索して色々やってみたのだが・・・。
昨日、半日近くやって結局うまく行かなかった。
　
納得出来ないので今朝から再挑戦してみた。何度やっても同じだ。
昨日ネットからインストールしたから超最新のアプリだ。
家の古いMAC-OSでは追いつかないのかと諦めたかけた・・・
　
ダメ元でPDFをJPEG画像にして試して見ると難なく出来た。
「なんだ画像にしないと駄目なのか」と思ったが詳しくは解らない。
とにかく一件落着。

↑ここの設定画面でつまづいたがここの問題では無かった。
　
しかしGoogleドライブの使い方はGoogleサイトには出ていない。
ネットで検索して出てくるのは一般の人の解説である。
インストールしたのは最新のだから一般の人の説明画像と違っていたので
余計時間が食った。　
しかし「画像でないと」とは・・・偶然解った事だ。
PDFなら間違いなかろうと思ったこっちも問題だが・・・