OCRについて

OCRとは

OCR （Optical Character Reader）は紙面に写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、書かれている内容をテキストデータとして取り出す技術です。

OCR製品検討時の観点は？

OCR読み取り文字は？

①手書き
②活字（TEXT文字）

帳票レイアウトはどのような物？

③帳票フォーマット定型
④帳票フォーマット非定型（請求書など、フォーマットがバラバラな物）

従来のOCR 基本知識

従来、OCRの苦手、実運用不可とされてきた条件としては以下となります。

文字がOCRターゲットエリアからはみ出ている
文字の上の印鑑
罫線に文字が触れている
背景が白くない
（行単位でハイライト等）
項目内に点線・注目線がある
帳票の種類が多すぎる
（設定しきれない・仕訳が出来ない）
手書き（特に数字以外・漢字は１文字１枠以外は不可・１枠１行）
原紙がカーボン用紙、FAXなどの画像の汚れ、ノイズ

OCRの新技術

OCR項目探索非定型OCR

キーとなる項目(見積番号など)を探し、そこから該当箇所(OCR読取箇所)を自動抽出するOCR。
企業向け見積書、給与振込依頼書、給与支払報告書など同じ項目・内容が記載されて、フォーマットデザインが異なる帳票に対して強みがある。

文字読取精度向上AI-OCR

文字単体(「あ」や「ア」や「亜」など)を学習させ(手書き含め)、文字読取精度を向上させるOCR。
手書きの項目がある帳票に対して特に強みがある。クラウド環境上にAIを搭載し使用する。

DX Suite は“非定型帳票にも対応したAI-OCR”です。

OCR製品選定の際のポイント

OCR製品検討時の観点は
OCR可能な守備範囲を
どこまでと設定したいか？

すぐにトライアルをしたい方はこちら

弊社のDX Suiteで試しに読ませ、結果返却します【無料テストに今すぐ申し込む】

まずはお試し！トライアルはこちら

まずはお試し！サンプルテストはこちら