AntBot Studio > Activity > 화면제어 > OCR > OCR읽기-Tesseract
정의 (Description)
- 이미지 파일에서 OCR텍스트를 추출하여 변수에 저장하는 Activity입니다.
속성 (Properties) (*은 필수값입니다.)
항목 | 설명 | 데이터타입 | 기본값 | 설정가능옵션 |
---|---|---|---|---|
Common | ||||
Activity 이름 | 해당 Activity의 이름을 설정합니다. - 기본값은 Activity명이며, 사용자가 직접 변경 가능합니다. |
String | OCR읽기-Tesseract | |
에러무시여부 | 해당 Activity에서 발생한 오류를 무시할지 선택합니다. | Boolean | False | - True : 액티비티에서 오류발생 안함 - False : 액티비티에서 오류발생 |
Input Common | ||||
OCR 유형 | Option 속성 적용여부를 OCR 유형으로 선택합니다. | OCRProdutType | IronOCR | - IronOCR : Option 속성 적용불가 - Tesseract : Option 속성 적용 |
인식할 이미지변수 * | OCR을 인식할 이미지변수를 입력합니다. (우선순위 : 1) | System.Drawing.Image | Null | |
인식할 이미지파일 * | OCR을 인식할 이미지 파일 경로를 설정합니다. (우선순위 : 2) | String | Null | |
Option | ||||
OCR인식언어 | 인식하고자 하는 OCR 언어를 설정합니다. - 동시에 여러 언어는 불가능합니다. |
TesseractLanguage | English | - English : 영어 - Korean : 한국어 - Auto : 자동설정 - Vietnamese : 베트남어 |
제외문자 | 지정된 문자는 결과에 제외되도록 설정합니다. | String | Null | |
허용문자 | 지정된 문자만 결과에 나오도록 설정합니다. | String | Null | |
Option Addition | ||||
단일블록여부 | 이미지가 단일블록인 경우 선택합니다. - 영수증같은 경우는 미선택 |
Boolean | False | - True : 단일블록 O - False : 단일블록 X |
이미지 스케일 값 | 인식율을 위해 이미지의 확대 정도를 설정합니다. | Double | Null | |
이미지에 GrayScale 적용 | 인식율을 위해 원본이미지를 회색조 변경합니다. | Boolean | False | - True : 회색조 적용 - False : 회색조 미적용 |
이미지에 Threshold 적용 | 인식율을 위해 원본이미지에 한계점 적용합니다. | Boolean | False | - True : 단일블록 적용 - False : 단일블록 미적용 |
Output | ||||
인식된문자열 | 이미지파일에서 추출한 텍스트 데이터를 저장할 문자열 변수를 설정합니다. | String | Null |
액티비티 사용 예시 (Example Usage)
- OCR을 인식할 이미지변수를 사용하여 실행하는 예시
OCR을 인식할 이미지변수 설정
- Input Common > 인식할 이미지변수
- img_OCRread 변수 설정
- 이미지 읽기 액티비티 결과 변수
Tip
- 이미지 읽기 관련 매뉴얼 참고 링크 - 이미지 읽기
- img_OCRread 변수 설정
- Input Common > 인식할 이미지변수
'OCR읽기-Tesseract' 액티비티 설정값 입력
- Option > OCR인식언어
- Korea 설정
- Option Addition > 이미지 스케일 값
- 4 입력
- Output > 인식된문자열
- strOCRread 변수 설정
- Option > OCR인식언어
- OCR을 인식할 이미지파일을 사용하여 실행하는 예시
OCR을 인식할 이미지파일 경로 설정
- Input Common > 인식할 이미지파일
- Ex) "D:\AntBot\이미지.PNG"
- 예시로 테스트용 이미지 경로를 활용하므로, 실제 실행시킬 이미지 절대경로 입력 필요
- Ex) "D:\AntBot\이미지.PNG"
- Input Common > 인식할 이미지파일
'OCR읽기-Tesseract' 액티비티 설정값 입력
- Option > OCR인식언어
- Korea 설정
- Option Addition > 이미지 스케일 값
- 4 입력
- Output > 인식된문자열
- strOCRread 변수 설정
- Option > OCR인식언어
메시지 박스에 결과 값 출력
- 메시지 박스 내용에 변수 값 확인을 위한 수식 작성
"OCR읽기-Tesseract 결과" + Environment.NewLine + strOCRread
실행 결과 확인
- 'OCR읽기-Tesseract' 액티비티 수행 결과