从图像中提取文本触发操作
  • 24 Jan 2024
  • 1 分钟阅读
  • 贡献者

从图像中提取文本触发操作


Article Summary

:::(Info) (开放测试)前线副驾驶触发操作目前处于开放测试阶段。如果您有兴趣加入 copilot@tulip.co如果您有兴趣加入测试版。 ::::::(Warning) (测试版免责声明)使用郁金香提供的测试版是可选的,风险由您自行承担。由于测试版未经测试/验证,因此按 "原样"、"现有 "提供,不提供担保。 这意味着 Tulip 根据任何服务条款或 MSA 承担的任何担保、赔偿和其他义务均不适用于 Beta 版。 * Frontline Copilot 功能强大!我们保留在测试期间根据需要限制 Copilot 触发器使用的权利。项目结束后,您将有三个月的时间决定是否继续使用该功能。
* At some point in the future, we may implement usage based pricing for beta features.
:::

从图像中提取文本"触发器操作根据查询从图像中提取文本。另一种描述方式是 "基于查询的 OCR(光学字符识别)"或 "通过询问从图像中提取文本"。

触发器将始终只返回图像中实际存在的文本。它不会添加额外的信息或对其进行解释。这使得它在将数据从物理世界传输到数字世界时非常强大。

使用案例示例:

  • **从外部供应商的订单中输入数据。**忘记手动将供应商发票上的 14 个字符的 PO 编号传输到 WMS 中吧,只需将一个简单的应用程序与 "从图像中提取文本 "相结合,就能在几秒钟内提取这些数据。
  • **将纸质表格数字化。**如果可以在 Tulip 应用程序中访问现有纸质出差单上的数据,那么这些数据将更有价值。"从图像中提取文本 "操作是连接实体世界和数字世界的绝佳机制。
  • **可靠地处理操作员不熟悉的语言文本。**制造世界是全球化的,通过结合 "从图像中提取文本 "和 "翻译 "触发操作,将纸质信息转化为操作员可以执行的操作,从而为操作员提供超级能力。

触发器示例

使用移动应用程序拍摄产品上的标签,以获取批号。

图像 | 触发器 | 结果 | | --- | --- | | --- | | | | | image.png{height="" width="400"}| image.png{height="" width="400"}| 11ep8f4wa58ccx

从图像中提取值

输入和输出

触发器操作有两个输入(输入图像和查询)和一个输出(提取的文本)。

输入:输入图像

这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。

| | 支持的数据类型 | | --- | --- | | | 输入 | 图像 URL | | 输入:输入图像

输入:查询

这是用于从图像或文档中提取文本的查询。

查询最佳实践: * 尽可能使用文档中的单词。这对缩略词和缩写词(如 SN、ID、SSN、批号等)特别有用。提取文本触发操作支持的查询没有数据/文档触发操作支持的查询复杂。大输入:"例如:"供应商是谁?坏输入:"指定信息的位置也有帮助(例如,"底部的参考编号是什么?

| | 支持的数据类型 | | --- | --- | | 输入 | 文本 |

输出:提取的文本

这是根据查询从图像中提取的文本。

| 支持的数据类型 | | --- | --- | 输出:文本


从图像/文档中提取值

:::(Warning) (注)从文档中提取值是一项相对较慢的操作。我们将文档限制为 10 页,以限制执行时间。
:::

从图像/文档中提取值 "的工作原理与 "从图像中提取值 "相同,但支持问题数组。这比运行从图像提取值触发器操作的性能要高得多。

输入:输入图像/文档

这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。对于文件,可以静态设置、使用文件输入 widget 输入或参考表中存储的文件。

| 支持的数据类型

输入:查询

这是用于从图像中提取文本的查询。这应该是一个文本值数组/列表。

| | 支持的数据类型 | | --- | | 输入:文本列表

输出:提取的文本

这是根据查询从图像中提取的文本。

| | 支持的数据类型 | | --- | --- | | 输出:对象数组。每个元素都有一个 "问题 "和 "答案 "属性。


从图像/文档中提取所有文本

在某些情况下,"提取值 "触发器操作的键:值范例对您的用例没有意义。从图像中读取所有数据为 copilot 解决哪些问题提供了无限的灵活性。"提取所有文本 "触发操作为您提供了这种灵活性。

image.png

输入:输入图像/文档

这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。对于文件,可以静态设置、使用文件输入 widget 输入或参考表中存储的文件。

| 输入:图像 URL 或文件 URL

输出:提取的文本

这是在相应图片或文件中找到的所有文本。文档将返回一个数据数组,每项代表所提供文档中一页的文本。

| | 支持的数据类型 | | --- | --- | | | 输出 | (图像)文本。(文档)文本列表


边缘案例

未提供输入图像和/或查询

如果触发操作没有提供输入图像或查询,应用程序将显示以下系统错误:您的输入或查询为空

以下所有情况都会发生这种错误: * 输入图像和/或查询输入未赋值。这相当于 "空"。 * 查询分配了一个空字符串。

查询无结果

如果查询没有结果,触发器操作将返回空文本。

限制

:::(Warning) (警告)限制可能会更改。
目前,"从图像提取文本 "触发器存在以下限制。这些限制在实例级别进行跟踪。如果超过这些限制,"从图像提取文本 "触发器操作将失败。

月限制:10,000 次/月 速度限制:10 次/分钟


本文对您有帮助吗?