DX Insight.

다가오는 AI 시대, 비즈니스를 위한 인사이트를 확보하세요.

AI 기반 OCR과 RPA로 달성하는 기업 문서 데이터 처리 프로세스

AI 기반 OCR과 RPA로 달성하는 기업 문서 데이터 처리 프로세스

안녕하세요. AI 기반 문서 전자화 기업, 악어디지털입니다. 🐊

 

바야흐로 데이터의 시대입니다. 

2025년까지 전 세계 데이터의 용량이 무려 175제타바이트를 넘을 것으로 전망되고 있습니다. 기업의 디지털 전환(DX)에 있어서 데이터는 핵심 중의 핵심이지만 전체 기업 데이터의 80% 이상이 ‘비정형’ 형식으로 구성되어 활용하지 못함으로써 업무 생산성을 크게 높이지 못하고 있습니다. 

이 때문에 문서에서 필요한 정보를 빠르게 검색하고 활용해야 하는 비즈니스 환경에서는 ‘종이문서 형태의 오프라인 데이터를 어떻게 활용하는 것인가’가 기업 생산성을 높이는 관건이라고 볼 수 있는데요. 오늘은 OCR과 RPA에 대한 설명을 통해 기업의 오프라인 문서 데이터 처리 프로세스에 대해 포스팅하겠습니다.

I OCR과 RPA

OCR(Optical Character Recognition)은 인지된 문자를 광학적으로 판독하는 스캐너 등의 하드웨어와 문자를 인식해서 데이터로 변환하는 소프트웨어를 포함한 시스템을 총칭하는 용어입니다.

OCR을 사용하면 문서 (택배송장, 치료비청구서 등) 와 함께 제품 사진과 같은 이미지에서 인쇄되거나 필기 된 텍스트를 추출할 수 있습니다. 주로 신청서 등에 기재된 항목들을 스캐너로 판독하고 데이터로 입력하는 시스템입니다. OCR을 활용하면 기업의 오프라인 문서를 디지털화하고, 분류된 정보로 신속하고 정확하게 변환할 수 있으므로 종이 문서는 더 이상 필요하지 않게 됩니다. 

 

RPA(Robotic Process Automation)는 사람이 하는 반복적이고 규칙적인 업무를 소프트웨어 로봇을 적용하여 자동화하는 기술입니다. 

로보틱(Robotic)은 물리적인 로봇을 의미하는 것이 아니라 사람이 하는 인지적인 일을 대신한다는 의미에서 컴퓨터 프로세스를 의미합니다. 단순 반복적이고, 노동집약적인 루틴한 업무를 RPA로 대체하여 직원들이 보다 고부가가치의 업무에 집중할 수 있습니다.

Human as Computer (과거)

Computer as Human(현재)

🤖

* 인간으로서의 컴퓨터

과거는 컴퓨터같이 정확한 사람에게 단순 반복 업무를 맡겼다면 현재는 사람 같은 컴퓨터(RPA)에게 반복 업무를 맡기는 시대로 바뀌고 있습니다.

차이점이 있다면 문자를 인식하여 데이터로 변환하는 기능은 OCR 고유의 기능이고, RPA는 취득한 데이터를 같은 값으로 활용하거나 별도 데이터로 변경하는 것은 가능하지만 OCR과 같이 이미지 데이터를 텍스트 데이터로 변환하는 것은 불가능하다는 점이 있습니다.

I 문서 데이터 처리 프로세스에서 OCR과 RPA의 역할

Designed by freefik
Designed by freefik

최근 대기업, 금융권 등이 디지털 전환을 통한 업무 효율화를 위해 RPA를 도입하고 있습니다. RPA는 영수증이나 보험 청구서에 기입된 고객 정보 입력 등 단순 반복적인 작업을 대신해 주는 역할을 합니다.

이 프로세스에서 OCR은 텍스트 정보들을 정확하게 읽고 처리하면서 높은 수준의 업무 자동화를 이룰 수 있어, 비즈니스 현장에서 핵심 기술로 자리 잡고 있는데요. 특히, OCR의 인식률이 떨어지면 결국 사람의 손을 거쳐야 하기 때문에 AI 기술로 정확도를 높이는 것이 가장 중요하다고 볼 수 있습니다.

 

OCR과 RPA의 기능 프로세스를 도식화하면 다음과 같습니다.

오프라인 문서의 스캔
🔽
AI – OCR 엔진으로 문서 데이터를 검색 가능한 데이터(문서)로 변환
🔽
데이터화되어 시스템에 입력된 데이터를 분류, 보관하여 활용
🔽
전자화된 데이터 기반으로 업무 자동화(RPA) 적용

OCR을 활용한 문서 인식이 시간과 비용을 절약해 주는, 문서 효율적이고 효과적인 수단이 되려면 AI가 필수적입니다. OCR에 적용할 머신 러닝 모델을 만들고 훈련시킨 인공지능을, 문서 인식에 활용하면서 오류는 줄어들고 효율은 향상되었습니다.

이러한 지능형 OCR은 손으로 쓴 글씨, 체크 박스, 삭제 표시(cross-out) 등, 기존 OCR 시스템에서 인식하기 어려웠던 부분을 디지털화하는데 큰 역할을 하고 있습니다. 해당 프로세스에서 AI가 개입한다면 OCR로 데이터를 읽고 데이터를 처리한 뒤 AI로 다시 판단하는 OCR -> RPA -> AI의 업무 프로세스 흐름을 구축할 수 있습니다.

I 이 모든 프로세스를 원스톱(One-Stop)으로

악어디지털 원스톱 문서 전자화 프로세스

악어디지털은 이처럼 OCR에서 RPA에 이르는 모든 문서 처리 프로세스를 원스톱으로 제공하고 있습니다.

​문서 전자화 목적으로 구축된 아시아 최대 규모의 디지털센터 (1,000평 규모)에는 소프트웨어 공정 기술과 물리적 보안시설을 구축하고 있으며, 여기에 자체 개발 AI-OCR 엔진인 ‘KANDA’는 각종 수기 데이터를 AI에 학습시켜 AI가 문자를 인식·추론하고 인식률이 낮은 데이터는 사람이 교정해 주는 학습 과정을 반복해 정확도를 높였습니다.

KANDA는 한글 필기체 문자 약 600만 자, 일본어 필기체 문자 약 120만 자를 학습하여 스스로 필체를 생성해 내용을 습득하며 인식한 정보를 일상 언어 맥락에 맞게 교정하는 등 두 단계를 거치는 게 특징인데, 이를 통해 문서 보관 과정에서 구겨졌거나 일부 훼손된 종이 문서도 디지털 문서로 변환할 수 있습니다.

Kanda AI-OCR
Kanda AI-OCR

또한 악어디지털의 RPA 솔루션은 이렇게 전자화된 기업 서류 데이터의 입력 자동화를 통해 업무 자동화까지 실현할 수 있습니다. ‘단순 반복’적인 업무는 RPA에게 맡기고, 전략적 작업에 더 많은 시간을 투자할 수 있는 것이죠.

문서 보관과 검색에 소요되는 비용과 단순 노동 집약적 업무의 비효율적인 시간과 비용을 고려한다면 전체적인 기업 문서 관리 시스템을 교체하는 것이 장기적인 생산성을 높이는 결과를 가져올 것입니다. 추가적으로, 전체 업무 프로세스를 고려해 AI-OCR 솔루션이 RPA 플랫폼과 함께 협업하고 운영되도록 해야 합니다. 

오늘은 OCR과 RPA로 기업 문서를 효율적으로 처리하고 업무를 자동화하는 프로세스에 대해 설명드렸습니다. 

빠르게 변화하는 디지털 전환 시대에서 경쟁에서 뒤처지지 않으려면, 문서에서 필요한 정보를 빠르게 찾고 접근할 수 있어야 합니다. 그러기 위해서는 오프라인 종이 문서를, 전자화 데이터로 변환하고 저장해서 관리해야 합니다. 이처럼 온/오프라인 문서를 얼마나 통합적으로, 또 효율적으로 처리하느냐는, 회사 전체의 생산성에도 영향을 미치는 중요한 요소일 것입니다.