Использование функции моментального снимка Vision с внешней службой распознавания символов
  • 31 Oct 2023
  • 2 Минуты для чтения
  • Авторы

Использование функции моментального снимка Vision с внешней службой распознавания символов


Article Summary

Использование функции моментального снимка Vision с внешним сервисом OCR

Захват и отправка изображений во внешний API-сервис компьютерного зрения

:::(Warning) (ПРИМЕЧАНИЕ) Эта функция доступна только в версии r210 и более поздних. :::

Обзор

Функция моментального снимка в Vision может использоваться совместно с коннекторами Tulip Connectors и внешним сервисом OCR. В этой статье мы расскажем вам о том, как быстро создать надежный конвейер оптического распознавания символов (OCR), который определяет текст на снимке, сделанном камерой Vision. Используя эту функциональность, вы сможете сканировать документы, считывать текст с напечатанных этикеток или даже текст, выбитый или вытравленный на предметах.

В следующей статье мы рассмотрим, как использовать эту функцию в Google Vision OCR. Функция Google Vision OCR способна считывать текст в очень сложных условиях изображения.

В этой статье мы рассмотрим следующие шаги:

  1. Настройка Tulip Vision и Google Cloud Vision API
  2. Создание коннектора Tulip к GCV API
  3. Создание приложения для получения снимка и взаимодействия с функцией коннектора OCR.

Предварительные условия

Настройка моментального снимка вместе с конфигурацией камеры

Убедитесь, что вы успешно настроили конфигурацию камеры Vision и знакомы с функцией моментального снимка Vision. Для получения дополнительной информации см: Использование функции моментального снимка Vision

Включите Google Cloud Vision API и проект Google Cloud Platform.

Создайте проект GCP и включите Vision API, следуя инструкциям, приведенным в этой статье: https://cloud.google.com/vision/docs/ocr.

Создайте API-ключ на Google Cloud Platform, который будет использоваться для аутентификации

Следуя инструкциям, приведенным в статье: https://cloud.google.com/docs/authentication/api-keys, создайте API-ключ для своего GCP-проекта. Вы можете ограничить использование этого API-ключа и установить соответствующие разрешения. Пожалуйста, обратитесь к своему сетевому менеджеру за помощью в настройке.

Создание функции коннектора Tulip для Google OCR

Создаваемый коннектор и функция коннектора будут настроены в соответствии с типом запроса, ожидаемого от Vision API, как показано на следующем изображении:

Конфигурирование функции-коннектора:

  1. Создайте HTTP-коннектор.

  1. Настройте коннектор так, чтобы он указывал на конечную точку Google Vision API.

Хост: vision.googleapis.com

TLS: Да 3. Отредактируйте заголовки коннектора, включив в них Content-Type.

  1. Протестируйте коннектор и сохраните конфигурацию.
  2. Далее создайте функцию коннектора POST-запроса и добавьте следующий путь к конечной точке: v1/images:annotate

  1. Добавьте изображение в качестве входного параметра в функцию коннектора. Убедитесь, что тип входных данных - Text.

  1. Убедитесь, что тип запроса - JSON, а тело запроса соответствует типу запроса Google Vision API:

Примечание: Замените PUT_YOUR_API_KEY_HERE на собственный API-ключ, созданный в описанных выше шагах. 8. Далее протестируйте эту функцию коннектора, преобразовав изображение текста в base64-строку (для этого можно воспользоваться этим сайтом). Используйте эту строку в качестве тестового значения для входной переменной image.

В ответ вы должны получить ответ, подобный этому:

  1. Установите выходную переменную, чтобы она указывала на**.responses.0.textAnnotations.0.description**
  2. Сохраните функцию коннектора.

Создание приложения Tulip, использующего моментальные снимки и коннектор Google OCR

  1. Перейдите в редактор приложений и используйте приложение, созданное при настройке триггера моментальных снимков: Использование функции моментальных снимков
  2. Далее создайте кнопку с триггером для вызова функции коннектора. В качестве входных данных для функции коннектора используйте переменную изображения, которая хранится на выходе моментального снимка.

  1. Добавьте в приложение Step переменную detected_text, чтобы можно было просматривать результаты, возвращаемые функцией коннектора:

  1. Протестируйте приложение и посмотрите результаты OCR:

Теперь вы создали приложение Tulip Vision, подключающееся к сервису OCR Google Vision API. Попробуйте его в своем цеху!

Дополнительная информация:


Была ли эта статья полезной?