TOP

>

AI活用事例

>

「3年前に試して無理だった書類」が今は99.9%で読み取れる──生成AIベースOCRが変えた精度の常識

AI活用事例

「3年前に試して無理だった書類」が今は99.9%で読み取れる──生成AIベースOCRが変えた精度の常識

最終更新日:

2026.3.18

監修者情報

岡田 徹

NOVEL株式会社 代表取締役

大阪大学在学中よりエンジニアとして活動し、複数のプロダクト立ち上げを経験。
2019年2月にNOVEL株式会社を設立。

2022年より生成AI領域に特化し、
AIライティングSaaS『SAKUBUN』(累計70万回利用・2万アカウント)を企画・開発。大手メディアや人材企業・出版企業への導入実績を持つ。

現在は中堅企業向けAIコンサルティングに注力し、製造業・小売業・金融機関など業種を問わず、生成AIの導入から定着までを一気通貫で支援している。

著書: 『2冊目に学ぶ ChatGPTプロンプト攻略術』(C&R研究所、2024年)

この記事に関連するお役立ち資料

AIを活用した業務自動化 事例BOOK

無料ダウンロード

3〜5年前に諦めたOCRを再度試したら99.9%の性能が出た、という現場が増えています。生成AIベースOCR(VLM)が旧来OCRと何が違うのか。精度99%の実態と、図面・手書き書類への対応力の変化を解説します。

 この記事でわかること

  • 「3〜5年前に試して無理だった書類」が生成AIベースのOCRなら読み取れるようになっている

  • AI-OCR界隈で謳われる「精度99%」は条件次第の数字であり、帳票1枚まるごとの正答率で出している会社はほぼ存在しない

  • 生成AIベースのOCRは座標ではなく「意味」で読むため、バラバラなレイアウトや図面・手書きにも対応できる

  • 精度を高くしようとしすぎると特定帳票には強くなるが他が読めなくなる、個別最適化と汎用性のトレードオフがある

「この書類はOCRで無理」と諦めていた会社が、試し直したら99.9%出た

AI-OCR界隈では精度99%という数字自体は「当たり前レベル」です。ただし、その99%がどんな条件で計測されたかが重要で、いい条件で試せば99.9%、今の精度なら正直100%になると思う、というのが現場の実感です。

面白いのは、「3年前とか5年前ぐらいにやってみたけど無理だったんだよね」と言っていた会社が、試し直してみたら99.9%の性能が出て「え、全然できますよ」という展開がよくあることです。諦めている会社が多い、けど生成AIベースのOCRだとできる、というケースが増えています。

ただし「精度99%」という数字をそのまま信じて導入を決めるのは早計です。この数字が何を指しているかで、業務上の使えるかどうかが大きく変わります。

「精度99%」は何の99%か──帳票1枚まるごとで出している会社はほぼゼロ

精度の測り方には大きく3つの単位があります。1文字ずつ正誤を数える「文字精度」、品番・金額など1項目丸ごとの正否で評価する「項目精度」、そして帳票1枚まるごと全項目が正しいかを見る「帳票正答率」です。

帳票1枚まるごとの正答率で精度を出している会社は、実質的にほとんどないはずです。理由は単純で、1つでもミスっていたらその帳票はゼロパーになるからです。100枚の帳票があって20枚に1項目でも誤りがあれば帳票正答率は80%になる。精度80%のAI-OCRを買おうという人はいないので、みんな文字レベルか項目別の数字で出しています。

ベンダーから提示される「99%」はほとんどが文字精度です。業務で実際に使えるかどうかを判断するには項目精度で確認する必要があります。「型番が正しく読み取れているか」「金額フィールドが正しいか」という視点で測り直すと、数字が変わってくることがあります。

生成AIベースOCRが旧来OCRと根本的に違う点

従来のAI-OCRは座標ベースでした。「この枠の中に名前が書いてある」という紐付けをあらかじめ学習させる必要があり、そのために何百枚もの書類を用意して枠を囲う作業が必要でした。フォーマットが決まった書類には強いですが、バラバラに書かれた書類には対応できません。

生成AIベースのOCR(VLMと呼ばれます)は、意味から解釈します。バラバラに書かれていても「これは名前、これは電話番号」と意味で判断できるため、名前の項目はほぼ100%当てができる。事前に何百枚も学習させなくても、いちいちやらなくてもすぐ導入できるのが最近のAIです。

図面や手書きが読めるようになった、という現場の変化

従来のAI-OCRで最も難しかったのが図面と手書き文字です。

図面については、これまでのAI-OCRだと意味わかんないという状態でした。ところが生成AIベースのOCRだと、何の図面なのかがわかり、この部品が何ミリという寸法の数値まで読み取れます。不定形書類と呼ばれるカテゴリ(図面・グラフ入りのレポートなど)はこれまで「OCRには無理」とされてきましたが、その前提が変わっています。

手書き文字も同様で、申込書に乱雑な字で書かれた情報が読み取れなかったのが、AI-OCRなら読み取れる。3年前・5年前に「無理だった」という記憶が判断の基準になっている会社ほど、一度試し直してみる価値があります。

精度を上げようとしすぎると別の問題が起きる

精度への追求には注意点もあります。個別最適化と汎用性のトレードオフです。

ルールを縛れば縛るほど、特定の条件下での性能は上がります。例えばA社から届く注文書だけを高精度で読み取るようプロンプトを組んだとすると、A社はめっちゃ読み取れるけど、今度はB社が読めない。C社は読めるけどB社は読めない、という状態になりえます。

汎用性を保ちながら99%近くを目指す、というのが難しいところで、今のAIは汎用性も高いのでまあまあできる部分はありますが、何でも1つのルールで通そうとするとこのトレードオフに直面します。どの帳票・どの書類を対象にするかを先に絞り込む方が、結果的に安定した精度につながります。

まとめ

これまでの内容を3点に整理します。

第一に、「3年前に無理だった書類」という記憶で諦めている会社は、生成AIベースのOCRで試し直す価値があります。技術の前提が変わっています。

第二に、ベンダーが提示する「精度99%」は文字レベルの数字がほとんどです。業務で使えるかどうかは項目精度で確認する必要があります。帳票1枚まるごとの正答率で出している会社はほぼ存在しません。

第三に、精度を特定帳票に最適化しすぎると他の帳票が読めなくなるトレードオフがあります。どの書類を対象にするかを先に絞り、汎用性を保ちながら設計するのが現実的なアプローチです。

よくある質問(FAQ)

Q1: 社内にすでにOCRツールが入っています。入れ替えた方が良いですか?

A: 必ずしも入れ替える必要はありません。まず「今のツールで読めていない書類」だけを生成AIベースのOCRで試してみる方法があります。全書類を一気に移行するより、諦めていた書類から試してみて性能を確かめてからでも遅くありません。

Q2: 試してみたいのですが、まず何を1枚読ませればいいですか?

A: 「これは無理だろう」と思っている書類を1枚選んでください。諦めていたものから試す方が、変化を実感しやすいです。きれいな印字の書類で99%が出ても「まぁそうだろう」で終わりますが、手書き交じりや図面での予想外の精度が出ると導入判断がしやすくなります。

Q3: クラウド型の生成AIベースOCRにスキャンデータを送るのはセキュリティ上問題ないですか?

A: 利用するサービスの契約条件によって異なります。データが学習用に使われるかどうか、保存期間はどのくらいか、を契約前に確認する必要があります。機密性の高い書類を扱う場合は、オンプレミス対応の製品や、API経由でのプライベート環境での利用も選択肢になります。

Q4: 精度の比較検討をするとき、複数ベンダーに同じ条件で試させることはできますか?

A: できます。同じ書類・同じ枚数で複数社に試してもらい、「項目精度」で比較するのが最も実態に近い評価になります。ベンダーが自社の得意な条件で計測した数字ではなく、自社の実際の書類で計測した数字で判断することが重要です。

-----------------------------------------------------------------------------------------

AI-OCRの導入・精度改善にお悩みですか?

NOVELでは、生成AIの導入から定着まで一気通貫で支援しています。

まずはお気軽にご相談ください。

👉 [無料相談はこちら]
👉[次回ウェビナーに参加する]

この記事に関連するお役立ち資料を無料ダウンロード

AIを活用した業務自動化 事例BOOK

AI技術を活用した社内業務効率化の基本から、実際の導入ステップまでをわかりやすく解説しています。

下記フォームにご記入下さい。(30秒)

氏名

*

貴社名

*

ご役職名

メールアドレス(企業ドメイン)

*

具体的なお悩みがあればご記入ください

テックユニットは、下記のような方におすすめできるサービスです。
お気軽にご相談ください。

・開発リソースの確保に困っている方
・企業の新規事業ご担当者様
・保守運用を移管したい方
・開発の引き継ぎを依頼したい方

おすすめの記事

関連する記事はこちら

OCRを導入したのに工数が変わらない理由──「一気通貫で自動化しないと意味ない」と断言できる根拠

OCRを導入して読み取りはできるのに、その後のExcel貼り付けや確認作業は人のまま。「一気通貫で自動化しないと全体工数は変わらない」という構造的な理由と、例外処理・辞書の育て方・ROIの出し方を解説します。この記事でわかること「読み取り部...

「3年前に試して無理だった書類」が今は99.9%で読み取れる──生成AIベースOCRが変えた精度の常識

3〜5年前に諦めたOCRを再度試したら99.9%の性能が出た、という現場が増えています。生成AIベースOCR(VLM)が旧来OCRと何が違うのか。精度99%の実態と、図面・手書き書類への対応力の変化を解説します。 この記事でわかる...

使うのは全体の3割だけ──ChatGPTが社内に定着しない「2つの壁」

大企業でも全社導入後に使っているのは2〜3割にとどまる背景と、社内に定着しない「2つの壁」、そして企業によって定着しやすさに差が出る理由を解説します。この記事で分かること・ChatGPTは3000人規模の大企業でも、全社導入後に使っているの...

「提案は立派なのに何も変わらない」を防ぐーー1問で分かるAI導入コンサルの本当の見極め方

AI導入コンサル選びの失敗パターン3つと、面談で使える見極め方を実務経験から解説。「論点整理だけ」「開発はできるがコンサルはできない」など現場で起きる地雷の正体とは?この記事でわかること-AI導入コンサル選びの失敗は「提案の華やかさ」で選ぶ...

AI外注 vs 内製 どっちが正解?3年やって出た答えは"どっちもコケる"

AI外注か内製かで悩む中小企業向けに、どちらを選んでもコケる理由と、成果が出るハイブリッドの分業モデルを実務経験から解説します。この記事でわかること- フル外注もフル内製も、どちらを選んでも失敗しやすい構造的な理由がある- AI導入の失敗は...

そのデータ、本当にAIに使えますか?活用前に整理したい2つのこと

「AIを使いたいけど、うちのデータって本当に使えるのかな……?」そんな不安を感じている企業は少なくありません。ChatGPTなどの生成AIを導入しても、社内データの状態が整っていなければ、期待した答えが返ってこないことはよくあります。そこで...

Excel・Accessがもう限界?移行を判断する10のサインと、中小企業の現実的な進め方

ある日突然、業務が止まる前に「受注管理のExcelを2人で同時に開いたら壊れた。バックアップがなく、1週間分のデータが消えた。」「Accessのデータベース、作った担当者が退職してから誰も触れていない。クラッシュしたら終わり。」「月末の集計...

AI時代に必要なデータ基盤とは?整理しないとAIは使えない

「AIを入れたのに使えない」の本当の原因「ChatGPTを社内に導入したけど、精度が出なくて結局使われていない」「AIで月次レポートを自動化したいのに、どこから手をつければいいかわからない」こうした声は、AI導入を検討している中小企業のあち...

DX推進室がなくても大丈夫!現場主導のAI活用スモールスタート術  

「AIの導入は、専門のDX推進室や優秀なAIエンジニアがいる大企業だけの話だ」 「我が社には推進できる人材がいないから…」企業の規模を問わず、多くのビジネスリーダーがAIの可能性を感じながらも、人材不足を理由に最初の一歩を踏み出せずにいます...

AIで営業の優先度付けを自動化|売れる3%に集中する方法

「なぜ、あの人だけが常に高い成果を上げ続けるのか?」 多くの営業組織では、一握りのトップセールスが全体の売上の大半を支えるという、いわゆる「属人化」が長年の課題となっています。彼らの持つ勘や経験を組織に共有するのは難しく、多くの営業担当者は...

方法から入るAI導入は失敗する|現場起点のAI定着設計術

「最新のAIツールを導入したが、現場では全く使われず、ライセンス費用だけが無駄になっている…」 これは、AI導入に取り組む多くの企業が直面する、決して珍しくない現実です。鳴り物入りで始まったプロジェクトが、なぜ現場に受け入れられず、静かに形...

AIは指示待ちから先回りへ。次世代AIエージェントとは  

これまで私たちが慣れ親しんできたChatGPTをはじめとする生成AIは、非常に賢いアシスタントでした。しかし、その基本はあくまで「指示待ち」。ユーザーがプロンプトを入力して初めて、その能力を発揮する受動的な存在でした。しかし今、その常識が大...