OCR(광학 문자 인식)
이미지 내의 글자를 자동으로 인식하는 인공지능 기술
Written by Jung Eun
2 minute read
OCR
- OCR(Optical Character Recognition)
- 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포멧으로 변환하는 과정
- 이미지를 텍스트 문서로 변환하여 내용을 텍스트 데이터로 저장할 수 있음
- ex
- 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지로 파일로 저장
- 이미지 파일에서 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를 계산
- 중요한 이유
- 대부분 비즈니스 워크플로에는 인쇄 매체로부터 정보를 수신하는 과정이 포함된다.(종이 양식, 인보이스, 스캔 문서, 인쇄된 계약서 등)
- 대용량의 종이 문서는 관리하기 힘들다. 수작업으로 문서를 이미지로 스캔하는 작업은 번거롭다.
- OCR 기술을 통해 텍스트 이미지를 텍스트 데이터로 변환하여 이런 문제 해결 !
- 데이터를 사용하여 분석을 수행하고 운영을 간소화하고 프로세스를 자동화하고 생선성을 높일 수 있음
OCR의 작동 방식
1 .이미지 획득
- 스캐너를 통해 문서를 읽어들여 이진 데이터로 변환
- 스캔된 이미지를 분석하고 밝은 부분을 배경으로 어두운 부분을 텍스트로 분류
2.전처리
- 스캔된 문서의 기울기 보정 및 틸팅하여 정렬 문제 해결
- 디지털 이미지의 얼룩을 제거하거나 텍스트 이미지의 가장자리를 부드럽게 만듬
- 이미지 내의 텍스트 상자 및 선 정리
- 다국어 OCR 기술용 스크립트 인식
3.텍스트 인식
- 패턴 매칭
- 문자 이미지를 격리해서 유사하게 저장된 글리프( 글자의 모양)와 비교하여 작동
- 저장된 글리프가 입력된 글리프와 비슷한 폰트와 크기를 가진 경우에만 작동
- 잘 알려진 폰트로 입력된 문서의 스캔 이미지에서 주로 사용
- 특징 추출
- 글리프를 선, 닫힌 고리, 선 방향 및 선 교차와 같은 특징으로 나누거나 분해함
- 이런 특징을 사용하여 다양하게 저장된 글리프 가운데 가장 정확하게 일치하거나 근사치에 가까운 글리프를 찾아냄
4.후처리
OCR 사용 분야
- 뱅킹
- 대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인함
- 이 확인 작업을 통해 사기 예방 및 거래 보안을 향상 시킬 수 있음
- 의료
- 치료, 검사, 입원 기록 및 보험료 지불과 같은 환자 기록을 처리함
- 워크플로를 간소화하고 병원의 수작업을 줄이면서 기록을 최신으로 유지할 수 있음
- 물류
- 패키지 라벨, 인보이스, 영수증 및 기타 문서를 보다 효율적으로 추적함
Reference
AWS - 광학 문자 인식이란 무엇인가?
More
Other Posts in this category