OCR(광학 문자 인식)

이미지 내의 글자를 자동으로 인식하는 인공지능 기술

...

Written by Jung Eun

2 minute read

OCR


  • OCR(Optical Character Recognition)
  • 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포멧으로 변환하는 과정
  • 이미지를 텍스트 문서로 변환하여 내용을 텍스트 데이터로 저장할 수 있음
  • ex
    • 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지로 파일로 저장
    • 이미지 파일에서 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를 계산
  • 중요한 이유
    • 대부분 비즈니스 워크플로에는 인쇄 매체로부터 정보를 수신하는 과정이 포함된다.(종이 양식, 인보이스, 스캔 문서, 인쇄된 계약서 등)
    • 대용량의 종이 문서는 관리하기 힘들다. 수작업으로 문서를 이미지로 스캔하는 작업은 번거롭다.
    • OCR 기술을 통해 텍스트 이미지를 텍스트 데이터로 변환하여 이런 문제 해결 !
    • 데이터를 사용하여 분석을 수행하고 운영을 간소화하고 프로세스를 자동화하고 생선성을 높일 수 있음


OCR의 작동 방식


1 .이미지 획득

  • 스캐너를 통해 문서를 읽어들여 이진 데이터로 변환
  • 스캔된 이미지를 분석하고 밝은 부분을 배경으로 어두운 부분을 텍스트로 분류

2.전처리

  • 스캔된 문서의 기울기 보정 및 틸팅하여 정렬 문제 해결
  • 디지털 이미지의 얼룩을 제거하거나 텍스트 이미지의 가장자리를 부드럽게 만듬
  • 이미지 내의 텍스트 상자 및 선 정리
  • 다국어 OCR 기술용 스크립트 인식

3.텍스트 인식

  • 패턴 매칭
    • 문자 이미지를 격리해서 유사하게 저장된 글리프( 글자의 모양)와 비교하여 작동
    • 저장된 글리프가 입력된 글리프와 비슷한 폰트와 크기를 가진 경우에만 작동
    • 잘 알려진 폰트로 입력된 문서의 스캔 이미지에서 주로 사용
  • 특징 추출
    • 글리프를 선, 닫힌 고리, 선 방향 및 선 교차와 같은 특징으로 나누거나 분해함
    • 이런 특징을 사용하여 다양하게 저장된 글리프 가운데 가장 정확하게 일치하거나 근사치에 가까운 글리프를 찾아냄

4.후처리

  • 추출된 텍스트 데이터를 컴퓨터 파일로 변환


OCR 사용 분야


  • 뱅킹
    • 대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인함
    • 이 확인 작업을 통해 사기 예방 및 거래 보안을 향상 시킬 수 있음
  • 의료
    • 치료, 검사, 입원 기록 및 보험료 지불과 같은 환자 기록을 처리함
    • 워크플로를 간소화하고 병원의 수작업을 줄이면서 기록을 최신으로 유지할 수 있음
  • 물류
    • 패키지 라벨, 인보이스, 영수증 및 기타 문서를 보다 효율적으로 추적함


Reference


AWS - 광학 문자 인식이란 무엇인가?










More