본문바로가기

PR Center

  • PR Center
  • 언론보도
언론보도




IDP(Intelligent Document Processing, 지능형문서처리) 전문기업 메인라인이 ‘딥러닝 기반 이종의 OCR AI 알고리즘을 이용해 최적 텍스트를 인식하는 장치, 방법 및 사용자 단말(특허 제 10-2619368호)’ 기술로 특허를 획득했다고 24일 밝혔다.


OCR은 광학을 이용해 인식된 텍스트와 기저장된 텍스트 데이터 간 비교를 통해 글자를 판독하는 기술이다. 기존 OCR 기술은 로직,패턴,알고리즘 등 PC용 솔루션을 통해 글자를 인식할 수 있었다. 하지만 최근 AI 기술 발전에 따라 머신러닝, 딥러닝 등을 활용해 스캔된 이미지를 분석함으로써 자동으로 글자를 인식할 수 있다.


OCR AI에는 다양한 신경망 알고리즘이 이용되며, 이용되는 알고리즘에 따라 텍스트 인식 결과가 각각 다르게 도출되는 문제점이 있다. 메인라인은 이를 해결하기 위해 이미지 데이터에 적용할 최소 둘 이상의 알고리즘을 포함한 텍스트 인식 엔진을 이용해 보다 정확한 텍스트 인식 결과를 도출하도록 했다.


이종의 OCR AI 알고리즘을 이용해 각각의 후보 텍스트를 도출하고, 도출된 각각의 후보 텍스트를 기학습된 강화학습모델에 입력한 후 최종 텍스트를 도출하도록 했다. 이는 높은 정확도의 텍스트 인식 결과와 최적의 텍스트 인식율을 제공할 수 있다.


한글 이미지 데이터의 경우 다양한 용어, 어순, 문장에 대해 점검을 수행하고, 단어의 정확한 텍스트 추출이 우선적으로 수행됐는지 검증한 후 수정을 통해 최종 텍스트를 도출할 수 있다. 예를 들어 진료비 영수증의 경우 '청구명세서', '검사료', '진찰료', '비급여' 등 용어를 ‘건강보험심사평가원’의 ‘진료비청구명세서’의 요양 기관별, 종별의 용어에 기초해 수정할 수 있다.


특허 기술은 각각의 후보 텍스트 및 사용자 규칙 정보를 강화학습 모델에 입력해 상태(state)를 인식하고, 인식된 상태로부터 리워드(Reward) 함수를 만족하는 행동(Action)을 도출하도록 강화학습 모델을 학습시킬 수도 있다.


따라서 진료비 영수증이나 사업자등록증, 공공기관 문서 등 텍스트를 포함하고 있는 다양한 이미지 데이터를 보다 정교하게 텍스트로 인식할 수 있다. 더욱 수준 높은 IDP 기술을 의료, 엔터프라이즈, 공공 등 폭넓은 산업 분야에 적용할 수 있게 된 셈이다.


최현길 메인라인 대표는 "메인라인은 국내 대표 IDP 리딩 기업으로서 선행 기술 R&D에 앞장서고 있다"며 "향후 텍스트 및 이미지를 활용한 AI 기술 분야로 진출을 위해 기술 경쟁력을 지속 확보하겠다"고 말했다.



[기사 보러가기] ▶ https://it.chosun.com/news/articleView.html?idxno=2023092108885

Product
Inquiry

제품 문의를 남겨주시면
빠르게 답변 드리겠습니다.

*표시는 필수 입력 항목입니다.

  • 유형 선택 *
    Insurance Solution
    Enterprise Solution