본문 바로가기

728x90
반응형

Development

(25)
EasyOCR 사용자 모델 학습하기 (6) - 한글 학습데이터 생성, 학습 및 테스트 이번에는 한글 학습데이터를 생성하고 학습, 검증하는 과정을 진행해 보고자 한다. 이전에 작성한 학습데이터 생성부터 변환, 미세조정(Fine-tune) 학습 등에 대한 내용은 아래 포스트를 참고하기 바란다. [Development/OCR] - EasyOCR 사용자 모델 학습하기 (1) - 시작하기 전에 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (2) - 학습데이터 생성 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (3) - 학습데이터 변환 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (4) - 모델 학습 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (5) - 모델 적용 및 테스트 0. 시작하기 전..
EasyOCR 사용자 모델 학습하기 (5) - 모델 적용 및 테스트 마지막으로, EasyOCR에서 사용자 모델을 사용할 수 있는 방법을 기술하기에 앞서, 학습에 필요한 학습데이터 생성, 변환 및 미세조정(Fine-tune) 학습 등에 대한 내용은 이전 포스트를 참고하기 바란다. [Development/OCR] - EasyOCR 사용자 모델 학습하기 (1) - 시작하기 전에 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (2) - 학습데이터 생성 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (3) - 학습데이터 변환 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (4) - 모델 학습 4. 모델 사용하기 이제 EasyOCR에서 학습한 모델을 사용해 문자를 인식해 보자. 4.1 프로젝트 설치 및 개발..
EasyOCR 사용자 모델 학습하기 (4) - 모델 학습 신경망 모델 학습하기에 앞서 학습에 필요한 학습데이터 생성 및 변환 등에 대한 내용은 이전 포스트를 참고하기 바란다. [Development/OCR] - EasyOCR 사용자 모델 학습하기 (1) - 시작하기 전에 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (2) - 학습데이터 생성 [Development/OCR] - EasyOCR 사용자 모델 학습하기 (3) - 학습데이터 변환 3. 모델 학습하기 신경망 모델 학습 단계는 역시 앞서 말한 것과 같이 CLOVA AI에서 제공하는 deep-text-recognition-benchmark라는 오픈소스 프로젝트를 이용할 것이다. 해당 프로젝트와 관련된 자세한 내용은 아래 링크에서 확인하기 바란다. github.com/clovaai/..
EasyOCR 사용자 모델 학습하기 (3) - 학습데이터 변환 이전 포스트에서 TextRecognitionDataGenerator 프로젝트를 이용해 생성한 학습데이터는 학습을 위한 deep-text-recognition-benchmark 프로젝트에서 요구하는 데이터 구조는 아니었고, 또한 바로 사용할 수 없었다. 필요에 의해 다음과 같이 단순한 데이터 변환 기능을 갖는 프로젝트를 만들어 공유하고자 한다. 프로젝트명: TRDG2DTRB (TextRecognitionDataGenerator to deep-text-recognition-benchmark) DaveLogs/TRDG2DTRB Convert TextRecognitionDataGenerator's result data to deep-text-recognition-benchmark's input data. - D..
EasyOCR 사용자 모델 학습하기 (2) - 학습데이터 생성 첫 번째 단계인 '학습데이터 생성'부터 진행해 보도록 하겠다. 참고로, 이전 포스트에서는 전체 단계에 대해 설명했고 아래 링크를 통해 확인할 수 있다. [Development/OCR] - EasyOCR 사용자 모델 학습하기 (1) - 시작하기 전에 EasyOCR 사용자 모델 학습하기 (1) 이번에는 EasyOCR에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 신경망 모델이 아닌, 사용자가 직접 학습시키고자 하는 데이터를 준비해 학습하고, 원하는 성능의 모델을 만들어 사 davelogs.tistory.com 1. 학습데이터 생성 학습데이터 생성 단계는 앞에서 말한 것과 같이 TextRecognitionDataGenerator라는 오픈소스 프로젝트를 이용할 것이다. 해당 프로젝트와 관련된..
EasyOCR 사용자 모델 학습하기 (1) - 시작하기 전에 이번에는 EasyOCR에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 신경망 모델이 아닌, 사용자가 직접 학습시키고자 하는 데이터를 준비해 학습하고, 원하는 성능의 모델을 만들어 사용하는 과정을 정리해 보았다. 이전에 또 다른 오픈소스 기반의 유명한 Tesseract OCR을 이용하기 위한 신경망 모델 학습 및 사용과 관련된 내용은 아래 포스트를 참고하기 바란다. [Development/OCR] - Tesseract OCR 4.x 모델 학습하기 (1) Tesseract OCR 4.x 모델 학습하기 (1) Tesseract에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 학습모델이 아닌 사용자가 직접 학습시키고자 하는 데이터를 준비해 학습하고 원하는 성능의 모델을 만들..
Tesseract OCR 사용하기 (with command line tools on Ubuntu) Tesseract 4.x 학습하기 포스트를 작성하려다 잘못된 방법으로 진행하는 바람에 이 포스트를 작성하게 됐다. 기왕에 설치한 패키지이니 테스트나 해 보자 싶었던 내용을 작성했기에, 조금 부실한 내용이지만 Windows에서 진행했던 것보다는 훨씬 간단하게 Tesseract-OCR을 맛볼 수 있었던 것 같다. 참고로, 모든 과정은 Ubuntu 20.04에서 진행했다. 1. Tesseract-OCR 설치 및 설치 확인 # Tesseract 4.x 설치하기 $ sudo apt install tesseract-ocr $ sudo apt install libtesseract-dev # Tesseract 4.x 설치 확인 $ tesseract --version # Tesseract 사용하기 $ Tesseract ..
Tesseract OCR 4.x 모델 학습하기 (2) 이전 포스트에 이어서 학습데이터를 준비하고 실제 학습하는 과정을 진행해 보겠다. 참고로, 아래 이전 포스트는 Tesseract OCR 엔진의 신경망 학습을 위한 준비 과정을 서술한 것이다. 2021.05.04 - [Development/OCR] - Tesseract OCR 4.x 학습하기 (1) Tesseract OCR 4.x 학습하기 (1) Tesseract에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 학습모델이 아닌 사용자가 직접 학습 시키고자 하는 데이터를 준비해 학습하고 원하는 성능의 모델을 만들어 사용할 수 있 davelogs.tistory.com 2. 학습데이터 준비 학습에 필요한 데이터를 다음과 같은 구조로 변경한다. - ~ (root) - tesseract (tesse..