将 Vision 的快照功能与外部 OCR 服务结合使用
  • 26 Mar 2024
  • 1 分钟阅读
  • 贡献者

将 Vision 的快照功能与外部 OCR 服务结合使用


文章摘要

将 Vision 的快照功能与外部 OCR 服务结合使用

捕捉图像并将其发送至外部计算机视觉服务 API

:::(Warning) (注)虽然您可以使用 Vision 完成此操作,但另一种方法是使用 CoPilot。点击此处了解更多有关 CoPilot 和 OCR 的信息:

概述

Vision 的快照功能可与 Tulip Connectors 和外部 OCR 服务结合使用。本文将指导您如何快速建立一个强大的 OCR(光学字符识别)管道,从 Vision 摄像头拍摄的快照中检测文本。利用这一功能,您将能够扫描文档、读取打印标签上的文本,甚至是物品上压印或蚀刻的文本。

下文将介绍如何使用 Google Vision OCR 来实现这一功能。Google Vision OCR 功能能够在非常苛刻的图像条件下读取文本。

本文将介绍以下步骤

  1. 设置 Tulip Vision 和谷歌云视觉 API
  2. 如何创建连接到 GCV API 的郁金香连接器
  3. 构建一个应用程序来拍摄快照,并与 OCR 连接器功能通信

先决条件

设置快照和摄像头配置

请确保您已成功设置了 Vision 摄像头配置,并熟悉 Vision 的快照功能。有关详细信息,请参阅:使用 Vision 快照功能

启用 Google Cloud Vision API 和 Google Cloud Platform 项目

创建一个 GCP 项目,并按照本文所述说明启用 Vision API:https://cloud.google.com/vision/docs/ocr。

在谷歌云平台上创建用于身份验证的 API 密钥

按照https://cloud.google.com/docs/authentication/api-keys文章中的说明,为你的 GCP 项目创建一个 API 密钥。您可以限制此 API 密钥的使用,并设置适当的权限。请咨询你的网络管理员,帮助你进行配置。

为谷歌 OCR 创建郁金香连接器功能

如下图所示,您创建的连接器和连接器功能将根据 Vision API 预期的请求类型进行配置:

配置连接器功能:

  1. 创建 HTTP 连接器。

  1. 配置连接器,使其指向 Google Vision API 端点。

主机:vision.googleapis.com

TLS: Yes 3.编辑连接器的标题,以包含Content-Type。

  1. 测试连接器并保存配置。
  2. 接下来,创建一个POST请求连接器函数,并在端点中添加以下路径:v1/images:annotate

  1. 添加一张图片作为连接器函数的输入。确保输入类型为文本

  1. 确保请求类型为 JSON,且请求 主体与 Google Vision API 请求类型一致:

注意:将PUT_YOUR_API_KEY_HERE替换为您上述步骤中创建的 API 密钥。8. 接下来,通过将文本图像转换为base64string来测试此连接器功能(可使用本网站进行此操作)。将此字符串作为图片输入变量的测试值。

你应该会收到类似的回复:

  1. 设置输出变量指向**.responses.0.textAnnotations.0.description**
  2. 保存连接器函数。

创建使用快照和 Google OCR 连接器的 Tulip 应用程序

  1. 转到应用程序编辑器并使用在设置快照触发器时创建的应用程序:使用快照功能
  2. 接下来,创建一个带有触发器的按钮,以调用连接器功能。使用快照输出存储的图像变量作为连接器函数的输入。

  1. 在应用程序步骤中添加变量detected_text,以便查看连接器函数返回的结果:

  1. 测试应用程序并观察 OCR 结果:

您现在已经创建了一个能连接 Google Vision API OCR 服务的 Tulip Vision 应用程序。现在就在你的车间里试试吧!

进一步阅读:


本文对您有帮助吗?