ISIT | アイ・エス・アイソフトウェアーがお届けするIT通信

どこまで知ってる?AI-OCRについて

OCRやAI-OCRという言葉を耳にしたことはありますか?

IT用語って、アルファベット3文字ばかり、略称ばかりで何が何かわからなくなって来ますよね。
OCRも聞いたことはあるけどアルファベット3文字のIT用語だ。というような認識かもしれません。

名刺や書類などのデータを管理するのに手書きされていませんか?顧客から紙媒体でもらった資料を社内共有するのが大変で困っていませんか?そんなときに役立つのがOCRです!

そこで今回は、アルファベットが省略されたIT用語略称が苦手な方でもスラスラ理解していただけるOCR・AI-OCRについてご紹介していきます。

OCRとは、「Optical Character Recognition」の略で、日本語では「光学文字認識」と訳されます。
OCRは、カメラやスキャナーなどの光学的な手段で、印刷された文字を読み取り、コンピューターが利用ができる文字のデータ(テキストデータ)に変換する技術です。

画像や文書の取り込み

まずは、写真をスキャナーで取り込むように、データ化したい画像や文書をカメラやスキャナーで画像データとして取り込みます。

レイアウト解析

取り込んだものから、あらかじめ登録されたレイアウトデータをもとに画像のどこに文字や罫線、写真などがあるかを解析します。全体的に文字として認識する範囲を決定します。

行の認識

見出し、段落などから、1行単位に切り分けて認識処理をします。

文字の認識

切り分けられた文字に対して、特徴から文字を割り出し、1文字ずつ認識していきます。

そして、その文字が持つ特徴(どういった線で文字が構成されているのかなど)を見つけ、特徴に合致する文字を探し出し、候補とします。
最後に、前後の文字列の候補と単語情報と照合し、読み取った文字が適切かどうかを判断・決定していきます。

この際、OCRでは1文字単位での認識に対し、AI-OCRなら文字列での認識が可能です。

出力

OCRはデータに変換した書類をファイルとして出力することが可能です。テキストデータやCSV、WordやExcel形式での出力もできます。

OCRでは、フォーマットに沿ったスキャンしかできず、枠からはみ出たり傾いている文字の認識は難しいとされていました。

しかし、AIの「自然言語処理」と呼ばれる技術をOCRに活用することにより、AI-OCRでは、フォーマットに依存することがなくなり、枠からはみ出ている文字や手書き文字の認識までも可能となりました。

また、AIの「ディープラーニング技術」を活用することで、十分な量のデータの中から自動的に文字の特徴の抽出を可能としました。

AI-OCRに文字データを読み取らせば読み取らせるほど、文字データが蓄積するので、AI-OCRの識字率がどんどん向上していきます。

AI-OCRを取り入れるまでは、人が一つ一つ手作業で紙媒体などに書かれているデータを入力していました。もしかしたら、お読みいただいている方の中にも必要データを紙媒体から手入力している方がいるかもしれません。

AI-OCRは情報を読み取らせるだけで文字を取り込んでくれるので、様々なメリットが生まれます。 この章では、そんなAI-OCRを活用することで得られるメリットを3つご紹介いたします。

時間・手間・人件費が削減できる

データ入力が、人による業務であることで、入力するスピードにそれぞれバラつきが出てしまったり、複数人によるチェックが必要となることで時間もかかってしまいます。

しかし、AI-OCRのおかげでその入力業務が自動化するので、その手間が省け、そこに費やしていた人件費や工数を削減することができます。

入力ミスがなくなり、業務品質が向上する

手入力する場合、打ち間違いや目視による人為的ミスのリスクがあり、業務品質を向上させるための課題がありました。

しかし、AI-OCRは、OCRでは読み取ることが難しかった文字でもより正確に文字の認識をすることが可能なので、入力ミスがなくなるのはもちろん、データの品質向上にもつながります。

データの管理や検索、共有が容易になる

AI-OCRで読み取った文字は、紙面ではなくデータとして扱えるので、保管場所がいらずデータの管理や検索、共有が容易になります。

欲しい情報を紙媒体から一枚一枚探すのは大変時間がかかる作業ですが、AI-OCRで読み取ることで検索ができるようになるので、必要な情報を素早く取得することができます。

また、離れた場所でも複数名で閲覧しデータ共有することが可能なので、在宅勤務が増えた新しいワークスタイルにも適していると言えます。

AI-OCRを実際に活用できるシーンについてご紹介します。

アンケートのデータ化

展示会などのイベントで、入り口でアンケート用紙を配布し、出口で回収するというアンケート方法を採用した際に、集計が大変になるかと思います。

AI-OCRでアンケート結果を全て読み込んでしまえば、項目数が多いアンケートでも、集計結果を簡単に出すことができるようになります。

発注依頼書や口座振替依頼書のデータ化

項目数が多く、手書きやFAXしてもらう機会も多い、発注依頼書や口座振替依頼書もデータ化することで、より効率的に管理がしやすくなります。

名刺のデータ化

名刺の管理などもAI-OCRで読み取っておけば、保管場所に困らないうえに、会社名や氏名、メールアドレスなどの検索ができるので、大変便利になります。

その読み取ったメールアドレスデータ情報からメールを作成することで、メールアドレスを手入力する手間と、ミスを減らすことができるため、作業の効率化にもつながります。

かつては決まったフォーマットからしか文字認識することができなかったOCRですが、AIの「自然言語処理」や「ディープラーニング技術」を採用することにより、複雑な手書き文字など、より精度の高い識字ができるようになりました。

また、AI-OCRを取り入れることで、日々の業務改善・向上を期待することができます!

ITの力で、業務改善したいと考えている方や、この先DXや働き方改革などでどうしていけばいいのか悩んでいる方は、是非弊社ISIにお問い合わせください。