【その手間、AIに任せましょう】事務作業を効率化!PDFを精度高く読み取るAI-OCRとは

最近、事務作業が多くなってきたこともあり、業務効率化に課題感を持っている。
まずはメールで受け取っているPDF化された手書きの申込書を指定のCSVフォーマットとして作成し、帳票発行システムに取り込む手間を削減したい。

今回はこのようなお悩みをお持ちのあなたに向けた記事です。
昨今はDX(デジタルトランスフォーメーション)の流れもあり、生産性の向上が企業の優位性に直結する時代になってきています。
本記事を参考にしていただくだけで、

AI-OCRのメリットを知り、事務作業をフローごと効率化する方法

を理解することができます。
現場の業務効率化を実現したい方にぜひご一読いただきたい記事です。

本記事のサマリ

読み取りの精度を高めたい場合はAI-OCRを活用

CSVファイルへの出力・帳票発行システムへの取り込みまでを自動化したい場合はAI-OCRツール・RPAツール・帳票発行システムを連携させる

DirectCloud-OCRを活用すれば帳票発行システムへのCSV取り込み自動化までが低コストで実現可能となる

OCRとは

AI-OCRを理解する前提として、そもそもOCRとは何かを改めて確認しておきましょう。
OCRとは「Optical Character Recognition」の略称で、日本語では「光学文字認識」と訳されます。画像データやPDFに記載されている文字を読み取り、テキストデータ化することができる技術です。

OCRの仕組み

実際に文字を読み取らせる前に、事前に文字を認識する工程を機械に覚えさせる必要があります。一般的に用いられる文字認識のアルゴリズムとしてはk近傍法やSVM法を挙げることができます。

アルゴリズムの名称 概要 特徴
k近傍法(k-Nearest Neighbor Algorithm法) データ間の距離を利用し、範囲内にあるデータの多数決で分類する教師あり学習 必要なハードウェアリソースが少なくて済むが、読み取り可能な書体の数が限られる
SVM法(Support Vector Machine法) データを分類するための軸となる線を引いていく教師あり学習 読み取り可能な書体の数が多いが、必要なハードウェアリソースが多くなる

・図1:文字認識のアルゴリズムの種類と特徴

アルゴリズムの名称 概要 特徴
k近傍法(k-Nearest Neighbor Algorithm法) データ間の距離を利用し、範囲内にあるデータの多数決で分類する教師あり学習 必要なハードウェアリソースが少なくて済むが、読み取り可能な書体の数が限られる
SVM法(Support Vector Machine法) データを分類するための軸となる線を引いていく教師あり学習 読み取り可能な書体の数が多いが、必要なハードウェアリソースが多くなる

・図1:文字認識のアルゴリズムの種類と特徴

同時に認識する文書のフォーマットや読み取り範囲の設定を行います。
その後OCRツールを起動させることで、対象範囲内の文字を行単位・文字単位で切り出し、テキストデータとして出力することができます。OCRは文書データをテキストデータ化するという特性上、経理業務における申込書や申請書の取り込み・フォーマット作成に活用されます。

OCRのメリット

定型的な業務へのOCR技術の活用には、下記のようなメリットがあります。

データ入力の作業を自動化できる

これまで、申込書や申請書などを社内で保管する場合や帳票発行システムに取り込む場合、指定のフォーマット上に文字を入力していく作業が発生していました。
OCRツールを導入し、他システムと連携することで、人手で行ってきたデータ入力の作業を自動化することができます

ヒューマンエラーを防止することができる

事務作業では受け取った帳票を元に、ミスなく正確に入力していくことが求められます。とはいえ、人間である以上いつしかヒューマンエラーは起きてしまうものです。
このような場合、OCRツールで入力業務を自動化することで、入力ミスのリスクを未然に防ぐことができます

リソースを別の作業に割り当てることができる

テキスト入力業務が自動化されることで、従業員は別の作業にリソースを割くことができます。
OCRに限らずRPA(Robotic Process Automation)などで定型業務を自動化することで、従業員はよりクリエイティブな業務に時間を割くことができるでしょう。

すぐに必要なファイルを探し出すことができる

OCRの特徴は、「テキスト情報」として画像ファイルやPDFから文字を抽出できることです。したがって、必要なファイルを探す際、キーワードで検索することで、瞬時に必要なファイルにたどり着くことができます
これまでフォルダ内を人手で辿っていった時間が短縮され、業務効率の向上を期待できます。

AI-OCRとは

OCRツールを利用することで多くのメリットを享受することができますが、OCRが認識できる文字情報には限りがあります。
黒字で記された書体や手書きの文字情報は問題なく認識することができますが、例えば下記の文字は認識率が下がります。

OCRの認識率が下がる文字情報

  • ・カラー文字
  • ・文字のかすれ
  • ・斜めで記された文字列
  • ・特殊文字

先ほどのk近傍法やSVM法はあくまで定義済みパターンを元に学習させる「教師あり学習」のため、異なるパターンを読み取ることができないのです。特に無料で公開されているOCRツールは精度が低いです。
そこで、上記のような文字情報を日頃の業務で取り扱うことが多い場合は、ツール自らがパターンを見つけ出し自己学習する「AI-OCR」を活用することをおすすめします。

AI-OCRのメリット

AI-OCR技術の活用には、下記のようなメリットがあります。

文字認識精度が高い

AI-OCRはその名の通り、深層学習(ディープラーニング)によってパターンを自ら学ぶことで、文字の特徴を抽出することができます。
したがって、OCRよりも文字認識精度が高く、OCRが弱点としていたカラー文字や斜めで記された文字列にも対応することができます

事前に読み取り範囲の定義付けをする必要がない

OCRでは、テキスト情報を読み取らせる前に、ユーザー側で読み取り位置に関する定義付けを行う手間が発生していました。
しかし、AI-OCRではツール自身で読み取り位置を抽出することができるので、ユーザーが事前に指定する必要がなくなります

事務作業を更に効率化する方法

このように申請書や申込書などのテキストデータ化はAI-OCRによって自動化することができます。
しかし、あなたが課題として抱えているのはその先までを一貫して自動化したい、ということではないでしょうか。
つまり、下記業務プロセスの自動化です。

事務作業において自動化したい範囲

・図2:事務作業において自動化したい範囲

指定フォーマットを作成する際、そのまま社内で保管する場合もありますが、大体は後続の作業が発生することが多いでしょう。例えば、CSVファイルとして作成し、帳票発行システムにインポートすることが挙げられます。
したがって、業務効率化するのであれば、「テキスト化~業務システムへのインポート」までを自動化するのが理想と言えます。
それでは、CSVファイルへの出力・帳票発行システムへの取り込みまでを自動化させるためにはどうすれば良いのでしょうか。
以下解説します。

AI-OCRツールとRPAツールを連携する

まず考えられる方法としてAI-OCRツール・RPAツール・業務システムをAPI連携することが挙げられます。
RPAとは従来人手で行っていた業務プロセスを自動化する技術で、主に定型業務が発生するホワイトカラーが多い職場で活用されます。
AI-OCRによって生成されたCSVファイルを業務システムに取り込むためのフォーマットに変換することができます。その他電話・メールの自動化などにも対応することができるため、特定の業務だけではなく幅広い業務改善を行いたい場合に検討しておきたいツールです。

DirectCloud-BOXを活用する

弊社の提供するクラウドストレージDirectCloud-BOXを活用することもおすすめです。
DirectCloud-BOXはオプション機能として「DirectCloud-OCR」を提供しており、ストレージ内に帳票を格納することで、メタデータとしてテキスト化することができます。

事務作業において自動化したい範囲

・図3:DirectCloud-OCRでのテキストデータ化

事前にDirectCloud-OCRと*帳票発行システムのAPサーバーをAPI連携することで、DirectCloud-OCRにより生成されたCSVファイルを元に、取り込み用フォーマットとして変換後、自動で帳票発行システムにインポートすることができるようになります

※フォーマット変換機能を有する帳票発行システムのみ


つまり、ユーザーは下記のような運用を実現させることができます。

自動化フロー
事前にDirectCloud-OCRで帳票のテンプレートを作成し読み取り範囲を設定
取引先をゲスト招待し、指定の共有フォルダ内にPDF化した申込書を格納いただくように伝える
取引先の担当者が申込書ファイルを格納
DirectCloud-OCRによりDirectCloud-BOXのプロパティ上で自動テキストデータ化
DirectCloud-OCRによりテキストデータをCSVファイルとして自動出力
API連携により自動でCSVファイルを帳票発行システムにインポート

・図4:DirectCloud-BOXと帳票発行システムのAPI連携で実現する自動化

■DirectCloud-OCRの詳しい製品説明はこちら
https://directcloud.jp/ai_ocr

どちらを選択するべきか

それでは、どちらのパターンを選択するべきなのでしょうか。
結論、貴社の置かれた状況によって異なりますが、例えば下記のような基準で決定することをおすすめします。

選択する際の基準

  • ・特定の事務作業だけではなく、その他全般的に自動化を行いたい場合
    ⇒AI-OCRツール・RPAツール・帳票発行システムをAPI連携する
  • ・低コストで帳票発行システムへのインポートまでを自動化したい場合
    ⇒DirectCloud-OCRとフォーマット変換機能を有する帳票発行システムをAPI連携する

弊社の提供するDirectCloud-OCRの価格帯はAI inside株式会社のDX Suiteに準拠しており、下記の通りとなっています。

プラン 初期費用 月額費用 フィールド数
ごとの単価
無料枠
スモール 0円 3万円~ 文字あり3円
文字なし3円
1万8千円分
ミディアム 20万円 10万円~ 文字あり1円
文字なし0.5円
5万円分
ラージ 20万円 20万円~ 文字あり1円
文字なし0.1円
20万円分

・図5:DirectCloud-OCRの価格帯

プラン スモール
初期費用 0円
月額費用 3万円~
フィールド数
ごとの単価
文字あり3円
文字なし3円
無料枠 1万8千円分
プラン ミディアム
初期費用 20万円
月額費用 10万円~
フィールド数
ごとの単価
文字あり1円
文字なし0.5円
無料枠 5万円分
プラン ラージ
初期費用 20万円
月額費用 20万円~
フィールド数
ごとの単価
文字あり1円
文字なし0.1円
無料枠 20万円分

・図5:DirectCloud-OCRの価格帯

初期費用・月額費用の他、プランが上がっていくごとにフィールド数ごとの単価が安くなっていく価格体系となっています。
したがって、例えばDirectCloud-BOXビジネスプラン(月額9万円)をご契約いただきオプションとしてDirectCloud-OCRミディアムプラン(月額10万円)を選択いただくと、月額料金19万円で自動化を実現することができます。
PCにインストールするクライアント型RPAを新規導入すると、

1ライセンスあたり年間でおよそ50万
100名が利用すると仮定すると、月額換算約4万×100名=400万

上記のように膨大な費用がかかってしまいます。
このように考えてみると、DirectCloud-BOXの活用がいかに低コストかお分かりになられるかと思います。

まとめ

いかがでしたでしょうか。

日頃の業務で大量の申込書や申請書を受け取っており、帳票発行システム用のフォーマット作成に工数を割いている状況であれば、AI-OCRツールの導入を検討してみることをおすすめします。

DirectCloud-OCR 込みでDirectCloud-BOXを契約することで、コストをかけずに自動化することが可能となりますので、ぜひ導入をご検討ください。

資料ダウンロード