AI 기반의 OCR 모듈 탑재! 개인정보 보안 및 문서 자동화 솔루션

홈페이지 게시판에 개인정보가 업로드/다운로드 되지 않도록 실시간으로 차단합니다.

L7 개인정보 보호

이미지 개인정보차단 솔루션 도입 시 고려할 사항

엘세븐시큐리티 2020. 12. 8. 15:57

이미지 개인정보차단 솔루션을 도입 시 고려해야 할 중요한 사항이 있다.

첫번째는 이미지에서 문자를 얼마나 정확히 추출 하느냐이다. 이는 이미지에서 문자를 추출하는 OCR 모듈의 성능이 중요하다. 개인정보가 포함된 이미지에서 주민등록번호나 운전면허번호, 여권번호 등의 문자를 잘 추출하는 것이 중요하다.

두번째로는 얼마나 빨리 문자를 추출하느냐 이다. 문서 안에는 많은 이미지가 포함되어 있다. 하나의 문서 안에는 몇 백개도 넘는 이미지가 포함 되어 있는 경우가 수두룩하다. 그 많은 이미지에서 개인정보를 검출하고 차단 하려면 빠른 문자추출 성능이 중요하다. 이미지 개인정보차단 솔루션들은 모두 실시간으로 탐지하고 차단을 한다. 홈페이지 앞단에 설치되어 1~2초안에 개인정보를 검출하고 사용자에게 컨텐츠를 전송해줘야 한다. 빠른 응답시간이 생명이다.

세번째로는 양방향 개인정보차단이다. 사용자가 게시판에 개인정보를 업로드 할 때도 차단 해야하고, 사용자가 게시판의 글을 클릭 시 개인정보가 포함된 문서를 다운로드 할 때도 차단 해야 한다. 이렇게 양방향으로 개인정보를 차단해야만 더욱 완벽히 개인정보의 유출을 차단할 수 있다.

 

 

 

그러나 다운로드차단을 한다는 것은 그리 쉬운 일이 아니다. 하루종일 게시판에 글을 쓰는 사람이 얼마나 될까? 많지 않다. 업로드만 차단하도록 세팅을 한다면 그 장비는 거의 하루 종일 부하가 없이 켜져 있을 것이다. 그러나 홈페이지를 클릭하는 사용자가 훨씬 많다. 사용자가 홈페이지를 클릭 할 때마다 텍스트는 물론 이미지 속의 개인정보까지도 검사하여 전송하거나 차단 하려면 다양한 트래픽 처리 기술이 접목 되어야만 가능하다. 이런 다양한 신기술을 사용하여 ImageOCR & OCR Filtering 제품은 개발이 되었다.

 

다운로드에 대해서 차단을 하는 것은 개인정보보호법의 준수에도 필수적이다. 개인정보의 안전성 확보조치기준 (제2019-47호) 해설서(개정)을 보면 “인터넷 서비스 검색엔진 (구글링 등)을 통해 관리자 페이지와 취급중인 개인정보가 노출 되지 않도록 필요한 조치를 취해야 한다”고 되어 있다.

인터넷 서비스 검색엔진은 구글만 있는 것이 아니라 네이버, 다음 등 다양하다. 이러한 검색엔진을 통하여 개인정보가 유출 되지 않게 하려면 반드시 다운로드 차단이 필요하다.

이 뿐만이 아니라 KISA에서도 이미지에 대한 개인정보탐지 모듈을 탐재하여 전국의 기관을 스캔하고 있다. 이런 경우 업로드에 대해서만 개인정보를 차단 했다가는 개인정보가 유출 될 우려가 크다. 반드시 다운로드의 차단을 통하여 개인정보의 추출을 차단 해야만 한다.

서버내의 개인정보에 대해 열심히 스캔 하는것도 방법이기는 하지만 서버를 스캔 하는 것은 실시간이 아니기에 완벽히 차단 할 수는 없다 또한 내부 업무망에 있는 서버들도 외부의 홈페이지와 연동되어 서비스를 하고 있기에 DMZ 구간의 홈페이지 시스템만 열심히 스캔 한다고 개인정보 유출을 모두 막을 수는 없다. 내부망의 업무서버에 있는 개인정보가 홈페이지 시스템을 통하여 외부로 유출 되는 것을 반드시 잡아야 한다. 매우 중요한 일이다. 현재 대부분의 공공기관의 웹 시스템이 일부는 내부 업무망 서버와 연동되어 운영이 되고 있다. 대부분 이런 시스템에서 개인정보가 유출 되고 있다.

결론적으로 엘세븐시큐리티의 이미지 개인정보차단 솔루션인 ImageOCR & OC Filtering 제품은 이런 문제점을 파악하여 다운로드 차단기능을 강조하고 있다. 반드시 다운로드 차단 기능이 있는 이미지 개인정보차단 솔루션을 도입하도록 권합니다.

 

 

 

www.L7secu.com

T. 02-6929-0505