OCR(광학 문자 인식) | Jung Eun

OCR(광학 문자 인식)

이미지 내의 글자를 자동으로 인식하는 인공지능 기술

Written by Jung Eun

2 minute read

Table of Contents

맨위로

OCR
OCR의 작동 방식
OCR 사용 분야
Reference

OCR

OCR(Optical Character Recognition)
텍스트 이미지를 기계가 읽을 수 있는 텍스트 포멧으로 변환하는 과정
이미지를 텍스트 문서로 변환하여 내용을 텍스트 데이터로 저장할 수 있음
ex
- 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지로 파일로 저장
- 이미지 파일에서 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를 계산
중요한 이유
- 대부분 비즈니스 워크플로에는 인쇄 매체로부터 정보를 수신하는 과정이 포함된다.(종이 양식, 인보이스, 스캔 문서, 인쇄된 계약서 등)
- 대용량의 종이 문서는 관리하기 힘들다. 수작업으로 문서를 이미지로 스캔하는 작업은 번거롭다.
- OCR 기술을 통해 텍스트 이미지를 텍스트 데이터로 변환하여 이런 문제 해결 !
- 데이터를 사용하여 분석을 수행하고 운영을 간소화하고 프로세스를 자동화하고 생선성을 높일 수 있음

OCR의 작동 방식

1 .이미지 획득

스캐너를 통해 문서를 읽어들여 이진 데이터로 변환
스캔된 이미지를 분석하고 밝은 부분을 배경으로 어두운 부분을 텍스트로 분류

2.전처리

스캔된 문서의 기울기 보정 및 틸팅하여 정렬 문제 해결
디지털 이미지의 얼룩을 제거하거나 텍스트 이미지의 가장자리를 부드럽게 만듬
이미지 내의 텍스트 상자 및 선 정리
다국어 OCR 기술용 스크립트 인식

3.텍스트 인식

패턴 매칭
- 문자 이미지를 격리해서 유사하게 저장된 글리프( 글자의 모양)와 비교하여 작동
- 저장된 글리프가 입력된 글리프와 비슷한 폰트와 크기를 가진 경우에만 작동
- 잘 알려진 폰트로 입력된 문서의 스캔 이미지에서 주로 사용
특징 추출
- 글리프를 선, 닫힌 고리, 선 방향 및 선 교차와 같은 특징으로 나누거나 분해함
- 이런 특징을 사용하여 다양하게 저장된 글리프 가운데 가장 정확하게 일치하거나 근사치에 가까운 글리프를 찾아냄

4.후처리

추출된 텍스트 데이터를 컴퓨터 파일로 변환

OCR 사용 분야

뱅킹
- 대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인함
- 이 확인 작업을 통해 사기 예방 및 거래 보안을 향상 시킬 수 있음
의료
- 치료, 검사, 입원 기록 및 보험료 지불과 같은 환자 기록을 처리함
- 워크플로를 간소화하고 병원의 수작업을 줄이면서 기록을 최신으로 유지할 수 있음
물류
- 패키지 라벨, 인보이스, 영수증 및 기타 문서를 보다 효율적으로 추적함

Reference

AWS - 광학 문자 인식이란 무엇인가?

More

Other Posts in this category

Categories

Machine-learning Python Deep-learning Data-structure Code-reviews