Извлечение текста из изображения Триггерное действие
  • 24 Jan 2024
  • 5 Минуты для чтения
  • Авторы

Извлечение текста из изображения Триггерное действие


Article Summary

:::(Info) (Открытая бета-версия) Триггерные действия Frontline Copilot в настоящее время находятся в открытой бета-версии. Свяжитесь с copilot@tulip.co если вы заинтересованы в присоединении к бета-версии. ::::::(Warning) (Отказ от бета-версии) Использование бета-версий, предлагаемых Tulip, является необязательным и осуществляется исключительно на ваш страх и риск. Из-за непроверенной/недоказанной природы бета-версий, они предоставляются "как есть", "как доступно" и без гарантий. Это означает, что любые гарантии, компенсации и другие обязательства Tulip в соответствии с условиями обслуживания или MSA не распространяются на бета-версии. * Frontline Copilot - это мощно! Мы поможем направить, но в конечном итоге вы несете ответственность за последствия того, что вы создаете. * Мы оставляем за собой право отключить все триггеры Copilot в любой момент, если заметим что-то неожиданное. * Мы оставляем за собой право ограничить использование триггеров Copilot во время бета-версии, если это необходимо. * За использование триггеров Copilot во время программы с вас не будет взиматься плата. У вас будет три месяца после завершения программы, чтобы решить, продолжать пользоваться функцией или нет.
* В какой-то момент в будущем мы можем ввести цены на основе использования для бета-функций.
:::

Действие триггера Extract Text from Image извлекает текст из изображения на основе запроса. Другой способ описать это - "OCR (оптическое распознавание символов) на основе запроса" или "Извлечение текста из изображения по запросу".

Триггер всегда будет возвращать только тот текст, который действительно присутствует на изображении. Он не будет добавлять к нему дополнительную информацию или интерпретировать его. Это делает его очень мощным инструментом для переноса данных из физического мира в цифровой.

Примеры использования:

  • Получение данных из формы заказа от внешнего поставщика. Забудьте о ручном переносе 14-значного номера заказа из счета-фактуры поставщика в вашу WMS, используйте простое приложение и "Извлечение текста из изображения", чтобы получить эти данные за считанные секунды.
  • Оцифруйте бумажные формы. Данные, содержащиеся в существующих бумажных бланках, становятся еще более ценными, когда к ним можно получить доступ в приложениях Tulip. Действия "Извлечь текст из изображения" - отличный механизм, позволяющий соединить физический и цифровой мир.
  • Надежная работа с текстом на языках, чуждых вашим операторам. Мир производства глобален, дайте своим операторам суперспособности, объединив действия "Извлечь текст из изображения" и "Перевести", чтобы превратить бумажную информацию в то, что ваши операторы могут использовать.

Пример триггера

С помощью мобильного приложения сфотографируйте этикетку на продукте, чтобы узнать номер партии.

Изображение | Триггер | Результат | | --- | --- | --- | --- | | | | image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX |

Извлечение значения из изображения

Входы и выходы

Действие триггера имеет два входа, входное изображение и запрос, и один выход, извлеченный текст.

Вход: Входное изображение

Это изображение, из которого должен быть извлечен текст. Оно может быть получено из виджета ввода камеры, Tulip Vision или внешних систем.

| | Поддерживаемый тип данных | | --- | --- | | | Вход | URL-адрес изображения |

Ввод: Запрос

Это запрос, который используется для извлечения текста из изображения или документа.

Лучшие практики запросов: * По возможности используйте слова из документа. Это особенно полезно для аббревиатур и сокращений (например, SN, ID, SSN, Lot No. и т. д.). Триггерные действия извлечения текста поддерживают менее сложные запросы, чем триггерные действия ответа на вопрос из данных/документа* Например. Отличный ввод: "Кто поставщик?" * Пример. Плохой ввод: "Как вы думаете, кто мог отправить это нам?" * Указание местоположения информации также может помочь (например, "Какой номер ссылки внизу?").

| | Поддерживаемый тип данных | | --- | --- | | | Ввод | Текст |

Выход: Извлеченный текст

Это текст, который был извлечен из изображения на основе запроса.

| | Поддерживаемый тип данных | | --- | --- | --- | | Выход | Текст |


Извлечение значений из изображения/документа

:::(Warning) (Примечание) Извлечение значений из документов - относительно медленная операция. Мы ограничиваем документы 10 страницами, чтобы ограничить время выполнения.
:::

Извлечение значений из изображения/документа работает так же, как извлечение значений из изображения, но поддерживает массив вопросов. Это будет значительно производительнее, чем выполнение триггера извлечения значения из изображения.

Вход: Входное изображение/документ

Это изображение, из которого должен быть извлечен текст. Оно может быть получено из виджета ввода камеры, Tulip Vision или внешних систем. Для файлов это значение может быть задано статически, введено с помощью виджета ввода файлов или может содержать ссылки на файлы, хранящиеся в таблицах.

| | Поддерживаемый тип данных | | --- | --- | | | Вход | URL изображения |

Ввод: Запрос

Это запрос, который используется для извлечения текста из изображения. Это должен быть массив/список текстовых значений.

| | Поддерживаемый тип данных | | --- | --- | | | Вход | Список текста |

Выход: Извлеченный текст

Это текст, который был извлечен из изображения на основе запроса.

| | Поддерживаемый тип данных | | --- | --- | | | Выход | Массив объектов. Каждый элемент будет иметь атрибуты "Вопрос" и "Ответ"|.


Извлечение всего текста из изображения/документа

В некоторых случаях парадигма ключ:значение в действиях триггера извлечения значения не имеет смысла для вашего случая использования. Чтение всех данных из изображения обеспечивает практически безграничную гибкость в решении задач, которые может решить copilot. Триггерные действия "Извлечь весь текст" обеспечивают такую гибкость.

image.png

Вход: Входное изображение/документ

Это изображение, из которого должен быть извлечен текст. Оно может быть получено из виджета ввода камеры, Tulip Vision или внешних систем. Для файлов этот параметр может быть задан статически, введен с помощью виджета ввода файлов или ссылок на файлы, хранящиеся в таблицах.

| | Поддерживаемый тип данных | | --- | --- | | | Вход | URL изображения или URL файла |

Выход: Извлеченный текст

Это весь текст, найденный на соответствующем изображении или документе. Документы возвращают массив данных, каждый элемент которого представляет собой текст с одной страницы предоставленного документа.

| | Поддерживаемый тип данных | | --- | --- | --- | | Выходные данные | (для изображений) Текст. (для документов) Список текстов |


Краевые случаи

Нет входного изображения и/или запроса

Если в действии триггера нет входного изображения или запроса, приложение выдаст следующую системную ошибку:Your Input or Query is empty.

Это происходит во всех следующих случаях: * Входному изображению и/или запросу не присвоено значение. Это эквивалентно "null". * Запросу присвоена пустая строка.

Нет результата для запроса

Если для запроса не было найдено результатов, триггерное действие вернет пустой текст.

Лимиты

:::(Warning) (Внимание) Лимиты могут быть изменены.
::: В настоящее время существуют следующие ограничения для триггеров "Извлечение текста из изображения". Эти лимиты отслеживаются на уровне экземпляра. В случае превышения этих лимитов действие триггера "Извлечение текста из изображения" будет отменено.

Месячный лимит: 10 000 запросов/месяц Ограничение скорости: 10 запросов/минута


Была ли эта статья полезной?