MENU
    从图像中提取文本触发操作
    • 08 Jan 2025
    • 1 分钟阅读
    • 贡献者

    从图像中提取文本触发操作


    文章摘要

    从图像中提取文本"触发器操作根据查询从图像中提取文本。另一种描述方式是 "基于查询的 OCR(光学字符识别)"或 "通过询问从图像中提取文本"。

    触发器将始终只返回图像中实际存在的文本。它不会添加额外的信息或对其进行解释。这使得它在将数据从物理世界传输到数字世界时非常强大。

    使用案例示例:

    • **从外部供应商的订单中输入数据。**忘记手动将供应商发票上的 14 个字符的 PO 编号传输到 WMS 中吧,只需将一个简单的应用程序与 "从图像中提取文本 "相结合,就能在几秒钟内提取这些数据。
    • **将纸质表格数字化。**如果可以在 Tulip 应用程序中访问现有纸质出差单上的数据,那么这些数据将更有价值。"从图像中提取文本 "操作是连接实体世界和数字世界的绝佳机制。
    • **可靠地处理操作员不熟悉的语言文本。**制造世界是全球化的,通过结合 "从图像中提取文本 "和 "翻译 "触发操作,将纸质信息转化为操作员可以执行的操作,从而为操作员提供超级能力。

    触发器示例

    使用移动应用程序拍摄产品标签的照片,以获取批号。

    图片触发器结果
    image.png{height="" width="400"}image.png{height="" width="400"}11EP8F4WA58CCX

    从图像中提取值

    输入和输出

    触发器操作有两个输入(输入图像和查询)和一个输出(提取的文本)。

    输入:输入图像

    这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。

    支持的数据类型
    输入图像 URL

    输入:查询

    这是用于从图像或文档中提取文本的查询。

    查询最佳实践:* 尽可能使用文档中的单词。这对缩略词和缩写词(如 SN、ID、SSN、批号等)特别有用。与从数据/文档触发器操作中回答问题相比,提取文本触发器操作支持不太复杂的查询。 * 例如大输入:"供应商是谁? * 例如:"谁是供应商?坏输入:"指定信息的位置也有帮助(例如,"底部的参考编号是什么?)

    支持的数据类型
    输入文本

    输出:提取文本

    这是根据查询从图像中提取的文本。

    支持的数据类型
    输出文本

    从图像/文档中提取值

    Note

    Extracting values from documents is a relatively slow operation. We limit documents to 10 pages to limit execution time.

    从图像/文档中提取值的工作原理与从图像中提取值相同,但支持问题数组。这比运行从图像提取值触发器操作的性能要高得多。

    输入:输入图像/文档

    这是从图像中提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。对于文件,可以静态设置、使用文件输入 widget 输入或参考表中存储的文件。

    支持的数据类型
    输入图像 URL

    输入:查询

    这是用于从图像中提取文本的查询。这应该是一个文本值数组/列表。

    支持的数据类型
    输入文本列表

    输出:提取的文本

    这是根据查询从图像中提取的文本。

    支持的数据类型
    输出对象数组。每个元素都有一个 "问题 "和 "答案 "属性。

    从图像/文档中提取所有文本

    在某些情况下,提取值触发器操作的键:值模式对您的用例没有意义。从图像中读取所有数据为 copilot 解决哪些问题提供了无限的灵活性。"提取所有文本 "触发操作为您提供了这种灵活性。

    image.png

    输入:输入图像/文档

    这是提取文本的图像。它可以来自摄像头输入部件、Tulip Vision 或外部系统。对于文件,可以静态设置、使用文件输入 widget 输入或参考表中存储的文件。

    支持的数据类型
    输入图像 URL 或文件 URL

    输出:提取文本

    这是在相应图片或文件中找到的所有文本。文档将返回一个数据数组,每个项目代表所提供文档中一页的文本。

    支持的数据类型
    输出(图像)文本。(文档)文本列表

    边缘案例

    未提供输入图像和/或查询

    如果触发器操作没有提供输入图像或查询,应用程序将显示以下系统错误*:您的输入或查询为空*。

    以下所有情况都会发生这种错误:* 输入图像和/或查询输入未赋值。这相当于 "空"。* 查询分配了一个空字符串。

    查询无结果

    如果查询没有结果,触发器操作将返回空文本。

    限制

    Warning

    The following languages are the only languages supported for documents where values are being extracted: English, Spanish, Italian, Portuguese, French, German.
    :::目前,"从图像提取文本 "触发器有以下限制。这些限制在实例级别进行跟踪。如果超出这些限制,"从图像中提取文本 "触发器操作将失败。


    本文对您有帮助吗?