民芸的プログラミング 〜ソフトウェア開発日記〜

アクセスカウンタ

zoom RSS 「ScanSnap でスキャンした画像を OCR してみる」について

<<   作成日時 : 2010/01/28 23:01   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

ScanSnap でスキャンした画像を OCR してみる」について
今日、さらに微調整を加えてみた。

ScanSnap で読み取る際に、オプションを調整し、画質をスーパーファインにし、JPEG の圧縮率を最小にした。
これで画像のファイルサイズは10倍にもなってしまう。

この状態で tesseract-ocr にかけてみると、ついに90%以上の認識率に到達した。
しかも、読めていないのはほとんど、「0(ゼロ)」と「O(オゥ)」の違いや、「1(イチ)」と「I(アイ)」の違いなど、人間でも場合によっては間違えそうなものばかり。
これらを簡単なプログラムで処理、例えば数字しかありえない場面ならばO(オゥ)は0(ゼロ)に置換、I(アイ)やl(エル)は1(イチ)に置換するなどすれば、認識率は99%にかなり近づく。

ただ、それでも出てくる1%ほどの誤認識をどうやって、後からフォローするのか。
そのあたりの非技術的な部分が、ちょっと難しい。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
「ScanSnap でスキャンした画像を OCR してみる」について 民芸的プログラミング 〜ソフトウェア開発日記〜/BIGLOBEウェブリブログ
文字サイズ:       閉じる