光学式文字認識（OCR）検出器の使用

更新日 20 Feb 2024
1 読む分
寄稿者

印刷する
共有

記事の要約

この要約は役に立ちましたか?

ご意見ありがとうございます

:::(Warning) (注）Frontline Coplilot™を使用すると、画像や文書から直接テキストを抽出できるため、Tulipで画像に対してOCRを行うプロセスが大幅に簡素化されます。今後はこの方法を推奨します：

カメラのビューでテキストを検出し、VisionのOCR検出器を使用してアプリのアクションをトリガーする

OCR検出器の概要

光学式文字認識（OCR）とは、画像内のテキストを見つけ、読み取るために画像をデコードするプロセスです。OCRは、何十年もの間、コンピュータビジョン技術の長い間、集中的に追求されてきたものですが、現存する認識問題の中でも難しいものの一つです。

OCR検出器を使用すると、カメラのストリーム上で事前に定義された領域を監視し、リアルタイムでテキストを検出することができます。その後、テキスト検出イベントを使用して、アプリ内でロジックを構築することができます。

:::(Info) (注）リアルタイムのOCR検出結果は、入力画像の品質に大きく依存します。再現性のある結果を得るためには、一貫性のある、非常に明るい読み取り環境を用意するよう努力してください。テキストが表示される場所にできるだけカメラを近づけてください。ハードウェアの推奨記事で提案されているように、ZoomカメラまたはDocumentカメラの使用を検討してください：

この記事では...

OCR検出器の設定方法
アプリ内トリガーによるOCR検出イベントの使用
OCR検出器の設定を調整する方法

前提条件

Visionの機能と要件を理解し、カメラのセットアップ方法を説明するために、Visionを始めるをご覧ください。
この機能はカラーカメラとデプスカメラの両方で動作します。
OCR機能はTulipバージョンr210+とPlayer1.1.0+で利用可能です。

OCR検出器の設定

カメラ設定のセットアップが完了すると、ビデオストリームが表示されます。OCR検出器を設定するには、テキストを検出するために監視したい領域を選択します。領域を定義するために、画像をクリックしてドラッグし、新しい領域を作成する必要がある場合があります：

Creating a region for OCR detection

次に、[検出器の作成] リンクをクリックして、OCR 検出器を作成します。検出器に名前を付け、説明（オプション）を付け、検出器のタイプとして OCR を選択します。トグルを使って、このリージョンのOCR検出器を有効にします。

Creating an OCR detector

領域内でテキストが検出されると、領域の境界が緑色に変わり、そうでなければ赤色のままになります。検出しきい値が 50% の場合、このリージョンで検出されたテキストは、正しく検出された信頼度が 50% 以上でなければなりません。この時点で、このカメラ設定を使用しているアプリでイベントがトリガーされます。

OCR 検出領域設定

ユースケースに適した結果を得るために、リージョンの設定を調整する必要があるでしょう。地域の設定を編集するには、カメラ設定をクリックし、調整したい地域を選択します。

以下の設定が可能です：

OCR detector confidence threshold

OCR 信頼度検出しきい値

これは「テキスト検出」イベントをトリガーするために必要な信頼度のパーセンテージです。厳しい条件下でテキストを検出する必要がある場合は、このしきい値を 40-50% のような低い値に設定できます。このしきい値を超える値は、その領域で以前テキストが検出されなかった場合、テキスト検出イベントをトリガーします。