본문 바로가기

Development/OCR

Tesseract OCR 사용하기 (with command line tools on Ubuntu)

728x90
반응형

 

Tesseract 4.x 학습하기 포스트를 작성하려다 잘못된 방법으로 진행하는 바람에 이 포스트를 작성하게 됐다. 기왕에 설치한 패키지이니 테스트나 해 보자 싶었던 내용을 작성했기에, 조금 부실한 내용이지만 Windows에서 진행했던 것보다는 훨씬 간단하게 Tesseract-OCR을 맛볼 수 있었던 것 같다.

 

참고로, 모든 과정은 Ubuntu 20.04에서 진행했다.

 


1. Tesseract-OCR 설치 및 설치 확인

 

# Tesseract 4.x 설치하기
$ sudo apt install tesseract-ocr
$ sudo apt install libtesseract-dev

# Tesseract 4.x 설치 확인
$ tesseract --version

# Tesseract 사용하기
$ Tesseract image01.jpg out -l eng

 

 

2.  Tesseract-OCR 사용하기

2.1 기본 설치 언어팩 사용하기

 

# Tesseract 이미지(test-eng.png), 출력형식(stdout), 언어(-l eng) 지정
$ tesseract test-eng.png stdout -l eng

 

입력이미지

 

실행 결과

 

 

728x90

 

2.2 언어팩 다운로드 후 지정 사용하기

# Tesseract 언어팩(kor) 지정 사용하기
$ mkdir tessdata
$ cd tessdata
$ wget https://github.com/tesseract-ocr/tessdata/raw/master/kor.traineddata
$ cd ..
$ tesseract test-kor.png stdout --tessdata-dir ./tessdata/ -l kor

 

입력이미지
실행결과

 

 

여기까지 간단하게 Tesseract OCR을 이용해 문자인식 기능을 확인해 볼 수 있었다. 기본 제공되는 언어(영어) 뿐만 아니라 추가 제공되는 언어까지 활용해 인식 테스트를 진행해 보았고, 생각보다 괜찮은 성능을 보여주는 것을 확인할 수 있었다.


Tesseract OCR 모델을 학습하는 과정은 다음 포스트를 참고하기 바란다.

 

[Development/OCR] - Tesseract OCR 4.x 학습하기 (1)

 

Tesseract OCR 4.x 학습하기 (1)

Tesseract에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 학습모델이 아닌 사용자가 직접 학습 시키고자 하는 데이터를 준비해 학습하고 원하는 성능의 모델을 만들어 사용할 수 있

davelogs.tistory.com

[Development/OCR] - Tesseract OCR 4.x 학습하기 (2)

 

Tesseract OCR 4.x 학습하기 (2)

이전 포스트에 이어서 학습데이터를 준비하고 실제 학습하는 과정을 진행해 보겠다. 참고로, 아래 이전 포스트는 Tesseract OCR 엔진의 신경망 학습을 위한 준비 과정을 서술한 것이다. davelogs.tistory

davelogs.tistory.com

 

728x90
반응형