- Распечатать
Извлечение текста из изображения Триггерное действие
Действие триггера Extract Text from Image извлекает текст из изображения на основе запроса. Другой способ описать это - "OCR (оптическое распознавание символов) на основе запроса" или "Извлечение текста из изображения по запросу".
Триггер всегда будет возвращать только тот текст, который действительно присутствует на изображении. Он не будет добавлять к нему дополнительную информацию или интерпретировать его. Это делает его очень мощным инструментом для переноса данных из физического мира в цифровой.
Примеры использования:
- Получение данных из формы заказа от внешнего поставщика. Забудьте о ручном переносе 14-значного номера заказа из счета-фактуры поставщика в вашу WMS, используйте простое приложение и "Извлечение текста из изображения", чтобы получить эти данные за считанные секунды.
- Оцифруйте бумажные формы. Данные, содержащиеся в существующих бумажных бланках, становятся еще более ценными, когда к ним можно получить доступ в приложениях Tulip. Действия "Извлечь текст из изображения" - отличный механизм, позволяющий соединить физический и цифровой мир.
- Надежная работа с текстом на языках, чуждых вашим операторам. Мир производства глобален, дайте своим операторам суперспособности, объединив действия "Извлечь текст из изображения" и "Перевести", чтобы превратить бумажную информацию в то, что ваши операторы могут использовать.
Пример триггера
С помощью мобильного приложения сфотографируйте этикетку на продукте, чтобы узнать номер партии.
Изображение | Триггер | Результат | | --- | --- | --- | --- | | | | {height="" width="400"} | {height="" width="400"} | 11EP8F4WA58CCX |
Извлечение значения из изображения
Входы и выходы
Действие триггера имеет два входа, входное изображение и запрос, и один выход, извлеченный текст.
Вход: Входное изображение
Это изображение, из которого должен быть извлечен текст. Оно может быть получено из виджета ввода камеры, Tulip Vision или внешних систем.
| | Поддерживаемый тип данных | | --- | --- | | | Вход | URL-адрес изображения |
Ввод: Запрос
Это запрос, который используется для извлечения текста из изображения или документа.
Лучшие практики запросов: * По возможности используйте слова из документа. Это особенно полезно для аббревиатур и сокращений (например, SN, ID, SSN, Lot No. и т. д.). Триггерные действия извлечения текста поддерживают менее сложные запросы, чем триггерные действия ответа на вопрос из данных/документа* Например. Отличный ввод: "Кто поставщик?" * Пример. Плохой ввод: "Как вы думаете, кто мог отправить это нам?" * Указание местоположения информации также может помочь (например, "Какой номер ссылки внизу?").
| | Поддерживаемый тип данных | | --- | --- | | | Ввод | Текст |
Выход: Извлеченный текст
Это текст, который был извлечен из изображения на основе запроса.
| | Поддерживаемый тип данных | | --- | --- | --- | | Выход | Текст |
Извлечение значений из изображения/документа
:::(Warning) (Примечание) Извлечение значений из документов - относительно медленная операция. Мы ограничиваем документы 10 страницами, чтобы ограничить время выполнения.
:::
Извлечение значений из изображения/документа работает так же, как извлечение значений из изображения, но поддерживает массив вопросов. Это будет значительно производительнее, чем выполнение триггера извлечения значения из изображения.
Вход: Входное изображение/документ
Это изображение, из которого должен быть извлечен текст. Оно может быть получено из виджета ввода камеры, Tulip Vision или внешних систем. Для файлов это значение может быть задано статически, введено с помощью виджета ввода файлов или может содержать ссылки на файлы, хранящиеся в таблицах.
| | Поддерживаемый тип данных | | --- | --- | | | Вход | URL изображения |
Ввод: Запрос
Это запрос, который используется для извлечения текста из изображения. Это должен быть массив/список текстовых значений.
| | Поддерживаемый тип данных | | --- | --- | | | Вход | Список текста |
Выход: Извлеченный текст
Это текст, который был извлечен из изображения на основе запроса.
| | Поддерживаемый тип данных | | --- | --- | | | Выход | Массив объектов. Каждый элемент будет иметь атрибуты "Вопрос" и "Ответ"|.
Извлечение всего текста из изображения/документа
В некоторых случаях парадигма ключ:значение в действиях триггера извлечения значения не имеет смысла для вашего случая использования. Чтение всех данных из изображения обеспечивает практически безграничную гибкость в решении задач, которые может решить copilot. Триггерные действия "Извлечь весь текст" обеспечивают такую гибкость.
Вход: Входное изображение/документ
Это изображение, из которого должен быть извлечен текст. Оно может быть получено из виджета ввода камеры, Tulip Vision или внешних систем. Для файлов этот параметр может быть задан статически, введен с помощью виджета ввода файлов или ссылок на файлы, хранящиеся в таблицах.
| | Поддерживаемый тип данных | | --- | --- | | | Вход | URL изображения или URL файла |
Выход: Извлеченный текст
Это весь текст, найденный на соответствующем изображении или в документе. Документы возвращают массив данных, каждый элемент которого представляет собой текст с одной страницы предоставленного документа.
| | Поддерживаемый тип данных | | --- | --- | --- | | Выходные данные | (для изображений) Текст. (для документов) Список текстов |
Краевые случаи
Нет входного изображения и/или запроса
Если в действии триггера нет входного изображения или запроса, приложение выдаст следующую системную ошибку:Your Input or Query is empty.
Это происходит во всех следующих случаях: * Входному изображению и/или запросу не присвоено значение. Это эквивалентно "null". * Запросу присвоена пустая строка.
Нет результата для запроса
Если для запроса не было найдено результатов, триггерное действие вернет пустой текст.
Ограничения
:::(Warning) (Предупреждение) Следующие языки являются единственными поддерживаемыми языками для документов, из которых извлекаются значения: Английский, Испанский, Итальянский, Португальский, Французский, Немецкий. ::: В настоящее время существуют следующие ограничения для триггеров "Извлечение текста из изображения". Эти лимиты отслеживаются на уровне экземпляра. В случае превышения этих лимитов действие триггера "Извлечь текст из изображения" завершится неудачей.
Размер изображения: Все изображения должны быть меньше 5 МБ Месячный лимит: 10 000 запросов в месяц Лимит скорости: 10 запросов в минуту
Лимит использования учетной записи: см. подробности здесь