KANDA는 다양한 경험과 역량이 집약된
AI OCR* 기술입니다

*악어디지털이 자체 개발한 인공지능 문자인식 기술입니다

KANDA AI - OCR이란?

악어디지털의 다양한
문서처리 경험을 바탕으로 자체 개발된 인공지능 문자인식 기술입니다.
KANDA AI-OCR 엔진은 스캔된 종이문서를 열람·검색이 가능한 전자문서로 변환합니다.

악어디지털의 AI R&D팀이 자체 개발하여 엔진의 성능을 지속적으로 유지합니다.

*

400여 고객사의 다양한 문서 처리 경험이 축적되며 꾸준히 발전해 왔습니다.

*

오랜 경험과 지속적인 개발로 난이도 높은 문서도 전자화가 가능합니다.

KANDA AI OCR은 악어디지털의 다양한 서비스중,
데이터 추출에 해당하는 핵심적인 영역을 담당하고 있습니다.

비전자문서

전자문서 변환

데이터 추출

KANDA AI OCR

업무 자동화

98.94%의 인식률, AI 학습으로 정확도 향상

01. 높은 인식 정확도

NVIDIA사가 인정한 AI 플랫폼 기반 인식기술 보유
TTA 시험성적서 한글 인쇄체 기준 98.94%의 인식 정확도 제공

KANDA AI OCR은 왜곡되거나 복잡한 문서도 정확하게 인식합니다.
필기체, 수십년 전 설계도에 흐릿하게 적힌 손글씨, 복잡한 도표나 도면, 초서체·해서체가 쓰인 고문서,
일제강점기 타자기 기록물 등도 어려움 없이 전자화합니다.

테이블이 많이 있고,
글씨 Font가 작은 문서 케이스

인식률

0 %

휴대폰 카메라로 찍은
왜곡된 문서

인식률

0 %

해외에서 FAX로 송신된 문서를
스캔 한 이미지

인식률

0 %

테이블이 많이 있고,
글씨 Font가 작은 문서 케이스

인식률

0 %

휴대폰 카메라로 찍은
왜곡된 문서

인식률

0 %

해외에서 FAX로 송신된 문서를
스캔 한 이미지

인식률

0 %

02 . 고성능 포맷 인식기술

문자의 인식 정확도는 정확한 위치를 파악하는 기술이 중요하며,
경쟁 업체에 비해 고성능 세그먼테이션 기술 내재

복잡한 문서에서도
텍스트를 정확히 찾아냅니다.

표에 있는 문자의 위치를 정확하게 찾아내고 찾아낸 텍스트는 단어 단위로 인식합니다.

복잡한 테이블 구조도 문제없이 인식합니다.

여러 개의 Table로 구성된 복잡한 구조도 정교하게 인식하여 Excel 형태로 추출할 수 있습니다.

구겨짐 문서나 왜곡된 문서도 보정하여 인식합니다.
구겨진 서류는 빛 반사와 이미지 왜곡 등으로 인해 문자 인식이 어렵습니다.
기울기/구겨짐 보정, 빛 반사를 제거하여 인식률을 높입니다.

팩스 문서 같은 명도 차이가 큰 흑백문서도 문제없습니다.
팩스로 받은 문서를 스캔 하면 명도차이가 커서 왜곡이 발생합니다.
명도 차이를 제거하는 Pre-processing 과정으로 인식률을 높입니다.

03. 지속적 평가 및 학습

신규 문서 서식에 대한 엔진의 성능을 지속적으로 유지하기 위해,
품질을 평가하고 다시 학습 하는 과정을 반복

스캔 데이터와 훈련용 데이터를 활용하여 딥러닝을 수행합니다.
정확도 90% 이하의 데이터는 보정과 반복 학습을 통해 정확도를 지속적으로 높입니다.

문서 스캔 데이터

훈련용 데이터

딥러닝 학습

실제 스캔 데이터와

축적된 데이터 활용

정확도 90% 이하 데이터는
데이터 보정

보정된 데이터는
딥러닝을 위해 반복 사용

반복학습으로 정확도 목표를 달성한 후
실제 업무에 활용

04. 고객 전용 AI엔진 제공

고객사 전용 특화 학습 엔진과 서버를 별도로 운영

인식률 향상을 위해 고객사 별로 특화된 데이터를 생성하여 AI 엔진을 학습시킵니다.

고객사의 용어집을 바탕으로 스스로 필체를 생성하여 자가 학습하여 학습속도가 매우 단축됨

05. 지속적 기술 개발

AI-OCR 기술 개발을 위해 정부지원 연구과제에 지속적으로 참여 하고 R&D에 투자

한국어 인식기반 국내 엔진개발을 위해 AI-OCR 관련 정부지원 사업에 참여했습니다.

사업명 (시행부처/기관)
과제명
수행(협약)기간
총 과제비(천 원)
진행현황
POST-TIPS
(창업진흥원 / 한국엔젤투자협회)
독보적인 AI-OCR/RPA
플랫폼 사업기반 구축
20.08 ~ 21.07
642,857
수행중
창업도약패키지
(창업진흥원/한국기술벤처재단)
AI-OCR V2
19.08 ~ 19.12
42,860
완료
창업도약패키지
(중소기업청/대구경부과학기술원)
Ascan AI-OCR Toolkit
(AI 기술을 활용한 문자 인식 기술의 상용화
18.10 ~ 19.08
127,200
완료