본문 바로가기

728x90
반응형

Development

(27)
Tesseract OCR 사용하기 (with command line tools on Ubuntu) Tesseract 4.x 학습하기 포스트를 작성하려다 잘못된 방법으로 진행하는 바람에 이 포스트를 작성하게 됐다. 기왕에 설치한 패키지이니 테스트나 해 보자 싶었던 내용을 작성했기에, 조금 부실한 내용이지만 Windows에서 진행했던 것보다는 훨씬 간단하게 Tesseract-OCR을 맛볼 수 있었던 것 같다. 참고로, 모든 과정은 Ubuntu 20.04에서 진행했다. 1. Tesseract-OCR 설치 및 설치 확인 # Tesseract 4.x 설치하기 $ sudo apt install tesseract-ocr $ sudo apt install libtesseract-dev # Tesseract 4.x 설치 확인 $ tesseract --version # Tesseract 사용하기 $ Tesseract ..
Tesseract OCR 4.x 모델 학습하기 (2) 이전 포스트에 이어서 학습데이터를 준비하고 실제 학습하는 과정을 진행해 보겠다. 참고로, 아래 이전 포스트는 Tesseract OCR 엔진의 신경망 학습을 위한 준비 과정을 서술한 것이다. 2021.05.04 - [Development/OCR] - Tesseract OCR 4.x 학습하기 (1) Tesseract OCR 4.x 학습하기 (1) Tesseract에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 학습모델이 아닌 사용자가 직접 학습 시키고자 하는 데이터를 준비해 학습하고 원하는 성능의 모델을 만들어 사용할 수 있 davelogs.tistory.com 2. 학습데이터 준비 학습에 필요한 데이터를 다음과 같은 구조로 변경한다. - ~ (root) - tesseract (tesse..
Tesseract OCR 4.x 모델 학습하기 (1) Tesseract에서 제공하는 API를 통해 OCR 기능을 이용할 때 사용되는 기본 학습모델이 아닌 사용자가 직접 학습시키고자 하는 데이터를 준비해 학습하고 원하는 성능의 모델을 만들어 사용할 수 있는지를 확인해 보고자 본 작업을 진행하게 됐다. 이 포스트의 모든 내용은 Tesseract에서 제공하는 아래 두 메뉴얼을 참고했다. tesseract-ocr.github.io/tessdoc/ Tesseract User Manual Tesseract documentation tesseract-ocr.github.io tesseract-ocr.github.io/tessdoc/tess4/TrainingTesseract-4.00.html How to use the tools provided to train Tesse..
EasyOCR 사용하기 이번에는 Easy OCR에 대해서 알아보고자 한다. 참고로 다른 OCR 엔진에 대한 내용은 다음을 참고하기 바란다. 2021.04.15 - [Development/OCR] - Tesseract OCR 사용하기 Tesseract OCR 사용하기 이번에는 오픈소스 OCR 엔진으로 유명한 Tesseract OCR에 대해서 알아보고자 한다. 참고로 또 다른 OCR 엔진에 대한 내용은 다음을 참고하기 바란다. 2021.04.12 - [Development/Machine Learning] - Naver CLOVA.. davelogs.tistory.com 2021.04.12 - [Development/OCR] - Naver CLOVA API - OCR 사용하기 (1) Naver CLOVA API - OCR 사용하기 ..
Tesseract OCR 사용하기 (with python on Windows) 이번에는 오픈소스 OCR 엔진으로 유명한 Tesseract OCR에 대해서 알아보고자 한다. 참고로 또 다른 OCR 엔진에 대한 내용은 다음을 참고하기 바란다. 2021.04.12 - [Development/Machine Learning] - Naver CLOVA API - OCR 사용하기 (1) Naver CLOVA API - OCR 사용하기 (1) 이번에는 CLOVA OCR을 사용해 보고자 한다. Google Cloud Vision API를 이용한 OCR은 아래 이전 포스팅을 참고하기 바란다. 2021.04.07 - [Development/Machine Learning] - Google Cloud Vision API - OCR 사용.. davelogs.tistory.com 2021.04.07 - [D..
Python 개발 환경 구축하기 (for Windows 10, virtualenv + virtualenvwrapper) 이번 포스트에서는 Windows 10에서 Python과 가상환경을 구축하고자 한다. 설치할 목록은 다음과 같다. Python 3.9.4 (Latest stable version) Virtualenv & Virtualenvwrapper 1. Python 설치하기 다음 링크에서 Python 설치 패키지를 다운로드한다. 본 포스트에서는 가장 최근의 안정화 버전인 Python 3.9.4를 설치했다. (단, 설치환경에 맞게 32bit 또는 64bit를 선택해 설치하면 된다. 여기서는 64bit를 설치한다) www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 다운로드 받은..
딥러닝(Deep Learning) 개발환경 구축하기 for Mac OS X (2) 이전 포스트에서 가상환경을 구축한 것에 이어서 Tensorflow와 같은 딥러닝 라이브러리 및 통합 개발 툴 설치 과정을 진행하고자 한다. 이전 포스트는 아래에서 확인하기 바란다. 2021.04.14 - [Development/Machine Learning] - 딥러닝(Deep Learning) 개발환경 구축하기 for Mac OS X (1) 딥러닝(Deep Learning) 개발환경 구축하기 for Mac OS X (1) 먼저 설치환경은 다음과 같으며, 모든 과정은 터미널 환경에서 진행한다. MacBook Pro (15-inch, 2017) 2.9GHz Quad-Core Intel Core i7 Intel HD Graphics 630 1536 MB RAM 16 GB 2133 MHZ LPDDR3 SDD ..
딥러닝(Deep Learning) 개발환경 구축하기 for Mac OS X (1) 먼저 설치환경은 다음과 같으며, 모든 과정은 터미널 환경에서 진행한다. MacBook Pro (15-inch, 2017) 2.9GHz Quad-Core Intel Core i7 Intel HD Graphics 630 1536 MB RAM 16 GB 2133 MHZ LPDDR3 SDD 512 GB # PYTHON 설치 Python 패키지 다운로드: www.python.org/downloads/mac-osx/ 안정화 버전 중 원하는 것을 선택하면 된다. 여기서는 가장 최신인 3.9.2의 안정화 버전을 설치한다. 이후 Python3가 가리키는 버전을 설치한 것으로 대치한다. (기존에는 맥북에 기본적으로 깔려있는 Python3.7.2 ? 로 타겟 설정이 되어 있었을 것이다) # python 버전확인 $ pyth..