Chinese

从图像中提取文本触发操作

24 Mar 2025
1 分钟阅读
贡献者

打印
分享
Twitter
Linkedin
Facebook
Email

从图像中提取文本触发操作

更新于 24 Mar 2025
1 分钟阅读
贡献者

打印
分享
Twitter
Linkedin
Facebook
Email

文章摘要

您觉得此摘要对您有帮助吗？

感谢您的反馈

从图像中提取文本"触发器操作根据查询从图像中提取文本。另一种描述方式是 "基于查询的 OCR（光学字符识别）"或 "通过询问从图像中提取文本"。

触发器将始终只返回图像中实际存在的文本。它不会添加额外的信息或对其进行解释。这使得它在将数据从物理世界传输到数字世界时非常强大。

使用案例示例：

**从外部供应商的订单中输入数据。**忘记手动将供应商发票上的 14 个字符的 PO 编号传输到 WMS 中吧，只需将一个简单的应用程序与 "从图像中提取文本 "相结合，就能在几秒钟内提取这些数据。
**将纸质表格数字化。**如果可以在 Tulip 应用程序中访问现有纸质出差单上的数据，那么这些数据将更有价值。"从图像中提取文本 "操作是连接实体世界和数字世界的绝佳机制。
**可靠地处理操作员不熟悉的语言文本。**制造世界是全球化的，通过结合 "从图像中提取文本 "和 "翻译 "触发操作，将纸质信息转化为操作员可以执行的操作，从而为操作员提供超级能力。

触发器示例

使用移动应用程序拍摄产品标签的照片，以获取批号。

图片	触发器	结果
image.png{height="" width="400"}	image.png{height="" width="400"}	11EP8F4WA58CCX

从图像中提取值

输入和输出

触发器操作有两个输入（输入图像和查询）和一个输出（提取的文本）。

输入：输入图像

这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。

	支持的数据类型
输入	图像 URL

输入：查询

这是用于从图像或文档中提取文本的查询。

查询最佳实践：* 尽可能使用文档中的单词。这对缩略词和缩写词（如 SN、ID、SSN、批号等）特别有用。与从数据/文档触发器操作中回答问题相比，提取文本触发器操作支持不太复杂的查询。 * 例如大输入："供应商是谁？ * 例如："谁是供应商？坏输入："指定信息的位置也有帮助（例如，"底部的参考编号是什么？）

	支持的数据类型
输入	文本

输出：提取文本

这是根据查询从图像中提取的文本。

	支持的数据类型
输出	文本

从图像/文档中提取值

Note

Extracting values from documents is a relatively slow operation. We limit documents to 10 pages to limit execution time.

从图像/文档中提取值的工作原理与从图像中提取值类似，但支持问题数组。这比运行从图像提取值触发器操作的性能要高得多。

输入：输入图像/文档

这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。对于文件，可以静态设置、使用文件输入 widget 输入或参考表中存储的文件。

	支持的数据类型
输入	图像 URL

输入：查询

这是用于从图像中提取文本的查询。这应该是一个文本值数组/列表。

	支持的数据类型
输入	文本列表

输出：提取的文本

这是根据查询从图像中提取的文本。

	支持的数据类型
输出	对象数组。每个元素都有一个 "问题 "和 "答案 "属性。

从图像/文档中提取所有文本

在某些情况下，提取值触发器操作的键:值模式对您的用例没有意义。从图像中读取所有数据为 copilot 解决哪些问题提供了无限的灵活性。"提取所有文本 "触发操作为您提供了这种灵活性。

输入：输入图像/文档

这是提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。对于文件，可以静态设置、使用文件输入 widget 输入或参考表中存储的文件。

	支持的数据类型
输入	图像 URL 或文件 URL

输出：提取文本

这是在相应图片或文件中找到的所有文本。文档将返回一个数据数组，每个项目代表所提供文档中一页的文本。

	支持的数据类型
输出	(图像）文本。(文档）文本列表

边缘案例

未提供输入图像和/或查询

如果触发器操作没有提供输入图像或查询，应用程序将显示以下系统错误*：您的输入或查询为空*。

以下所有情况都会发生这种错误：* 输入图像和/或查询输入未赋值。这相当于 "空"。* 查询分配了一个空字符串。

查询无结果

如果查询没有结果，触发器操作将返回空文本。

限制

Warning

The following languages are the only languages supported for documents where values are being extracted: English, Spanish, Italian, Portuguese, French, German.

目前，"从图像提取文本 "触发器有以下限制。这些限制在实例级别进行跟踪。如果超出这些限制，"从图像提取文本 "触发器操作将失败。

本文对您有帮助吗？

使用案例示例：

触发器示例
从图像中提取值
从图像/文档中提取值
- 输入：查询
从图像/文档中提取所有文本
边缘案例
- 未提供输入图像和/或查询
- 查询无结果
限制