- 인쇄
이미지에서 텍스트 추출 트리거 작업은 쿼리를 기반으로 이미지에서 텍스트를 추출합니다. 이를 설명하는 다른 방법은 "쿼리 기반 OCR(광학 문자 인식)" 또는 "이미지에서 텍스트를 요청하여 텍스트 추출"이라고 할 수 있습니다.
트리거는 항상 이미지에 실제로 존재하는 텍스트만 반환합니다. 추가 정보나 해석을 추가하지 않습니다. 따라서 실제 데이터를 디지털 세계로 전송하는 데 매우 강력합니다.
사용 사례 예시:
- 외부 공급업체의 주문 양식에서 데이터를 수집합니다. 공급업체 송장의 14자 PO 번호를 수동으로 WMS로 전송할 필요 없이 간단한 앱과 '이미지에서 텍스트 추출'을 결합하여 몇 초 만에 이 데이터를 가져올 수 있습니다.
- 종이 양식을 디지털화하세요. 기존 종이 송장에 포함된 데이터는 Tulip 앱 내에서 액세스할 수 있을 때 더욱 가치가 높아집니다. '이미지에서 텍스트 추출' 작업은 실제 세계와 디지털 세계를 연결하는 훌륭한 메커니즘입니다.
- 작업자가 모르는 외국어로 된 텍스트로도 안정적으로 작업할 수 있습니다. "이미지에서 텍스트 추출" 및 "번역" 트리거 작업을 결합하여 종이 기반 정보를 작업자가 작업할 수 있는 정보로 전환하여 작업자에게 강력한 권한을 부여하세요.
트리거 예시
모바일 앱을 사용하여 제품의 라벨을 사진으로 찍어 배치 번호를 가져옵니다.
이미지 | 트리거 | 결과 |
---|---|---|
image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX |
이미지에서 값 추출
입력 및 출력
트리거 액션에는 입력 이미지와 쿼리라는 두 개의 입력과 추출된 텍스트라는 하나의 출력이 있습니다.
Input: 입력 이미지
텍스트를 추출할 이미지입니다. 이 이미지는 카메라 입력 위젯, Tulip Vision 또는 외부 시스템에서 가져올 수 있습니다.
지원되는 데이터 유형 | |
---|---|
입력 | 이미지 URL |
입력입니다: 쿼리
이미지 또는 문서에서 텍스트를 추출하는 데 사용되는 쿼리입니다.
쿼리 모범 사례: * 가능한 경우 문서에 있는 단어를 사용합니다. 이는 약어 및 약어(예: SN, ID, SSN, 로트 번호 등)에 특히 유용합니다. 텍스트 추출 트리거 작업은 데이터/문서에서 질문에 답하기 트리거 작업보다 덜 복잡한 쿼리를 지원합니다. * 예. 훌륭한 입력: "공급업체는 누구인가요?" * 예. 잘못된 입력: "누가 이걸 우리에게 보냈을 것 같나요?"* 정보의 위치를 지정하는 것도 도움이 될 수 있습니다(예: "하단의 참조 번호는 무엇인가요?").
지원되는 데이터 유형 | |
---|---|
입력 | 텍스트 |
출력 추출된 텍스트
쿼리에 따라 이미지에서 추출된 텍스트입니다.
지원되는 데이터 유형 | |
---|---|
출력 | 텍스트 |
이미지/문서에서 값 추출
:::(Warning) (참고)문서에서 값을 추출하는 것은 비교적 느린 작업입니다. 실행 시간을 제한하기 위해 문서를 10페이지로 제한합니다.:::
이미지/문서에서 값 추출은 이미지에서 값 추출과 동일하게 작동하지만 다양한 질문을 지원합니다. 이것은 이미지에서 값 추출 트리거 작업을 실행하는 것보다 훨씬 더 성능이 좋습니다.
입력: 입력 이미지/문서
텍스트를 추출할 이미지입니다. 카메라 입력 위젯, Tulip Vision 또는 외부 시스템에서 가져올 수 있습니다. 파일의 경우, 정적으로 설정하거나 파일 입력 위젯으로 입력하거나 테이블에 저장된 파일을 참조할 수 있습니다.
지원되는 데이터 유형 | |
---|---|
입력 | 이미지 URL |
입력: 쿼리
이미지에서 텍스트를 추출하는 데 사용되는 쿼리입니다. 텍스트 값의 배열/리스트여야 합니다.
지원되는 데이터 유형 | |
---|---|
입력 | 텍스트 목록 |
출력: 추출된 텍스트
쿼리에 따라 이미지에서 추출된 텍스트입니다.
지원되는 데이터 유형 | |
---|---|
출력 | 객체 배열. 각 요소에는 "질문" 및 "답변" 속성이 있습니다. |
이미지/문서에서 모든 텍스트 추출
경우에 따라서는 추출 값 트리거 작업의 key:value 패러다임이 사용 사례에 적합하지 않을 수도 있습니다. 이미지에서 모든 데이터를 읽는 것은 부조종사가 해결할 수 있는 문제에 거의 무한한 유연성을 제공합니다. "모든 텍스트 추출" 트리거 액션은 이러한 유연성을 제공합니다.
입력: 입력 이미지/문서
텍스트를 추출할 이미지입니다. 카메라 입력 위젯, Tulip Vision 또는 외부 시스템에서 가져올 수 있습니다. 파일의 경우, 정적으로 설정하거나 파일 입력 위젯으로 입력하거나 테이블에 저장된 파일을 참조할 수 있습니다.
지원되는 데이터 유형 | |
---|---|
입력 | 이미지 URL 또는 파일 URL |
출력 추출된 텍스트
각 이미지 또는 문서에 있는 모든 텍스트입니다. 문서는 데이터 배열을 반환하며, 각 항목은 제공된 문서의 한 페이지에 있는 텍스트를 나타냅니다.
지원되는 데이터 유형 | |
---|---|
출력 | (이미지의 경우) 텍스트. (문서의 경우) 텍스트 목록 |
에지 케이스
입력 이미지 및/또는 쿼리가 제공되지 않음
트리거 작업에 입력 이미지가 없거나 쿼리가 제공되지 않으면 앱에 다음과 같은 시스템 오류가 표시됩니다.입력 또는 쿼리가 비어 있습니다.
다음 모든 경우에 발생합니다.* 입력 이미지 및/또는 쿼리 입력에 값이 할당되지 않았습니다. 이는 "null"에 해당합니다.* 쿼리에 빈 문자열이 할당되어 있습니다.
쿼리에 대한 결과 없음
쿼리에 대한 결과를 찾을 수 없는 경우 트리거 작업은 빈 텍스트를 반환합니다.
제한 사항
:::(Warning) (경고) 다음 언어는 값을 추출하는 문서에서 지원되는 유일한 언어입니다: 영어, 스페인어, 이탈리아어, 포르투갈어, 프랑스어, 독일어:::현재 '이미지에서 텍스트 추출' 트리거에는 다음과 같은 제한이 있습니다. 이러한 제한은 인스턴스 수준에서 추적됩니다. 이러한 제한을 초과하는 경우 "이미지에서 텍스트 추출" 트리거 작업이 실패합니다.
이미지 크기: 모든 이미지는 5MB 미만이어야 함월별 제한: 10,000건/월 요청 횟수 제한: 10건/분 계정별
사용 제한: 여기에서 자세한 내용을 참조하세요.