728x90
반응형
Tesseract 4.x 학습하기 포스트를 작성하려다 잘못된 방법으로 진행하는 바람에 이 포스트를 작성하게 됐다. 기왕에 설치한 패키지이니 테스트나 해 보자 싶었던 내용을 작성했기에, 조금 부실한 내용이지만 Windows에서 진행했던 것보다는 훨씬 간단하게 Tesseract-OCR을 맛볼 수 있었던 것 같다.
참고로, 모든 과정은 Ubuntu 20.04에서 진행했다.
1. Tesseract-OCR 설치 및 설치 확인
# Tesseract 4.x 설치하기
$ sudo apt install tesseract-ocr
$ sudo apt install libtesseract-dev
# Tesseract 4.x 설치 확인
$ tesseract --version
# Tesseract 사용하기
$ Tesseract image01.jpg out -l eng
2. Tesseract-OCR 사용하기
2.1 기본 설치 언어팩 사용하기
# Tesseract 이미지(test-eng.png), 출력형식(stdout), 언어(-l eng) 지정
$ tesseract test-eng.png stdout -l eng
2.2 언어팩 다운로드 후 지정 사용하기
# Tesseract 언어팩(kor) 지정 사용하기
$ mkdir tessdata
$ cd tessdata
$ wget https://github.com/tesseract-ocr/tessdata/raw/master/kor.traineddata
$ cd ..
$ tesseract test-kor.png stdout --tessdata-dir ./tessdata/ -l kor
여기까지 간단하게 Tesseract OCR을 이용해 문자인식 기능을 확인해 볼 수 있었다. 기본 제공되는 언어(영어) 뿐만 아니라 추가 제공되는 언어까지 활용해 인식 테스트를 진행해 보았고, 생각보다 괜찮은 성능을 보여주는 것을 확인할 수 있었다.
Tesseract OCR 모델을 학습하는 과정은 다음 포스트를 참고하기 바란다.
[Development/OCR] - Tesseract OCR 4.x 학습하기 (1)
[Development/OCR] - Tesseract OCR 4.x 학습하기 (2)
728x90
반응형
'Development > OCR' 카테고리의 다른 글
EasyOCR 사용자 모델 학습하기 (2) - 학습데이터 생성 (0) | 2021.05.22 |
---|---|
EasyOCR 사용자 모델 학습하기 (1) - 시작하기 전에 (0) | 2021.05.22 |
Tesseract OCR 4.x 모델 학습하기 (2) (0) | 2021.05.04 |
Tesseract OCR 4.x 모델 학습하기 (1) (2) | 2021.05.04 |
EasyOCR 사용하기 (0) | 2021.04.15 |