이미지 트리거 액션에서 텍스트 추출
  • 21 Oct 2024
  • 3 읽을 분
  • 기여자

이미지 트리거 액션에서 텍스트 추출


기사 요약

이미지에서 텍스트 추출 트리거 작업은 쿼리를 기반으로 이미지에서 텍스트를 추출합니다. 이를 설명하는 다른 방법은 "쿼리 기반 OCR(광학 문자 인식)" 또는 "이미지에서 텍스트를 요청하여 텍스트 추출"이라고 할 수 있습니다.

트리거는 항상 이미지에 실제로 존재하는 텍스트만 반환합니다. 추가 정보나 해석을 추가하지 않습니다. 따라서 실제 데이터를 디지털 세계로 전송하는 데 매우 강력합니다.

사용 사례 예시:

  • 외부 공급업체의 주문 양식에서 데이터를 수집합니다. 공급업체 송장의 14자 PO 번호를 수동으로 WMS로 전송할 필요 없이 간단한 앱과 '이미지에서 텍스트 추출'을 결합하여 몇 초 만에 이 데이터를 가져올 수 있습니다.
  • 종이 양식을 디지털화하세요. 기존 종이 송장에 포함된 데이터는 Tulip 앱 내에서 액세스할 수 있을 때 더욱 가치가 높아집니다. '이미지에서 텍스트 추출' 작업은 실제 세계와 디지털 세계를 연결하는 훌륭한 메커니즘입니다.
  • 작업자가 모르는 외국어로 된 텍스트로도 안정적으로 작업할 수 있습니다. "이미지에서 텍스트 추출" 및 "번역" 트리거 작업을 결합하여 종이 기반 정보를 작업자가 작업할 수 있는 정보로 전환하여 작업자에게 강력한 권한을 부여하세요.

트리거 예시

모바일 앱을 사용하여 제품의 라벨을 사진으로 찍어 배치 번호를 가져옵니다.

이미지트리거결과
image.png{height="" width="400"}image.png{height="" width="400"}11EP8F4WA58CCX

이미지에서 값 추출

입력 및 출력

트리거 액션에는 입력 이미지와 쿼리라는 두 개의 입력과 추출된 텍스트라는 하나의 출력이 있습니다.

Input: 입력 이미지

텍스트를 추출할 이미지입니다. 이 이미지는 카메라 입력 위젯, Tulip Vision 또는 외부 시스템에서 가져올 수 있습니다.

지원되는 데이터 유형
입력이미지 URL

입력입니다: 쿼리

이미지 또는 문서에서 텍스트를 추출하는 데 사용되는 쿼리입니다.

쿼리 모범 사례: * 가능한 경우 문서에 있는 단어를 사용합니다. 이는 약어 및 약어(예: SN, ID, SSN, 로트 번호 등)에 특히 유용합니다. 텍스트 추출 트리거 작업은 데이터/문서에서 질문에 답하기 트리거 작업보다 덜 복잡한 쿼리를 지원합니다. * 예. 훌륭한 입력: "공급업체는 누구인가요?" * 예. 잘못된 입력: "누가 이걸 우리에게 보냈을 것 같나요?"* 정보의 위치를 지정하는 것도 도움이 될 수 있습니다(예: "하단의 참조 번호는 무엇인가요?").

지원되는 데이터 유형
입력텍스트

출력 추출된 텍스트

쿼리에 따라 이미지에서 추출된 텍스트입니다.

지원되는 데이터 유형
출력텍스트

이미지/문서에서 값 추출

:::(Warning) (참고)문서에서 값을 추출하는 것은 비교적 느린 작업입니다. 실행 시간을 제한하기 위해 문서를 10페이지로 제한합니다.:::

이미지/문서에서 값 추출은 이미지에서 값 추출과 동일하게 작동하지만 다양한 질문을 지원합니다. 이것은 이미지에서 값 추출 트리거 작업을 실행하는 것보다 훨씬 더 성능이 좋습니다.

입력: 입력 이미지/문서

텍스트를 추출할 이미지입니다. 카메라 입력 위젯, Tulip Vision 또는 외부 시스템에서 가져올 수 있습니다. 파일의 경우, 정적으로 설정하거나 파일 입력 위젯으로 입력하거나 테이블에 저장된 파일을 참조할 수 있습니다.

지원되는 데이터 유형
입력이미지 URL

입력: 쿼리

이미지에서 텍스트를 추출하는 데 사용되는 쿼리입니다. 텍스트 값의 배열/리스트여야 합니다.

지원되는 데이터 유형
입력텍스트 목록

출력: 추출된 텍스트

쿼리에 따라 이미지에서 추출된 텍스트입니다.

지원되는 데이터 유형
출력객체 배열. 각 요소에는 "질문" 및 "답변" 속성이 있습니다.

이미지/문서에서 모든 텍스트 추출

경우에 따라서는 추출 값 트리거 작업의 key:value 패러다임이 사용 사례에 적합하지 않을 수도 있습니다. 이미지에서 모든 데이터를 읽는 것은 부조종사가 해결할 수 있는 문제에 거의 무한한 유연성을 제공합니다. "모든 텍스트 추출" 트리거 액션은 이러한 유연성을 제공합니다.

image.png

입력: 입력 이미지/문서

텍스트를 추출할 이미지입니다. 카메라 입력 위젯, Tulip Vision 또는 외부 시스템에서 가져올 수 있습니다. 파일의 경우, 정적으로 설정하거나 파일 입력 위젯으로 입력하거나 테이블에 저장된 파일을 참조할 수 있습니다.

지원되는 데이터 유형
입력이미지 URL 또는 파일 URL

출력 추출된 텍스트

각 이미지 또는 문서에 있는 모든 텍스트입니다. 문서는 데이터 배열을 반환하며, 각 항목은 제공된 문서의 한 페이지에 있는 텍스트를 나타냅니다.

지원되는 데이터 유형
출력(이미지의 경우) 텍스트. (문서의 경우) 텍스트 목록

에지 케이스

입력 이미지 및/또는 쿼리가 제공되지 않음

트리거 작업에 입력 이미지가 없거나 쿼리가 제공되지 않으면 앱에 다음과 같은 시스템 오류가 표시됩니다.입력 또는 쿼리가 비어 있습니다.

다음 모든 경우에 발생합니다.* 입력 이미지 및/또는 쿼리 입력에 값이 할당되지 않았습니다. 이는 "null"에 해당합니다.* 쿼리에 빈 문자열이 할당되어 있습니다.

쿼리에 대한 결과 없음

쿼리에 대한 결과를 찾을 수 없는 경우 트리거 작업은 빈 텍스트를 반환합니다.

제한 사항

:::(Warning) (경고) 다음 언어는 값을 추출하는 문서에서 지원되는 유일한 언어입니다: 영어, 스페인어, 이탈리아어, 포르투갈어, 프랑스어, 독일어:::현재 '이미지에서 텍스트 추출' 트리거에는 다음과 같은 제한이 있습니다. 이러한 제한은 인스턴스 수준에서 추적됩니다. 이러한 제한을 초과하는 경우 "이미지에서 텍스트 추출" 트리거 작업이 실패합니다.
이미지 크기: 모든 이미지는 5MB 미만이어야 함월별 제한: 10,000건/월 요청 횟수 제한: 10건/분 계정별사용 제한: 여기에서 자세한 내용을 참조하세요.


이 문서가 도움이 되었습니까?