컴퓨터가 이미지를 다루는 기술은 나날이 발전합니다. 특히 지난 10여년간 이미지룰 보고 무언가를 인식해 내는 기술이 Machine Learning 에서 가장 활발한 연구분야로 부각되었죠. 지문인식, 얼굴인식 뿐만아니라 자율주행에 사용되는 도로교통 표지판인식, 물체인식, 그리고 심지어 영상의학과 의사선생님 대신 MRI 영상을 판독해주는것도 하게되었습니다. 한국에서도 이분야에 많은 우수인력들이 있고요. facebook 의 group 중 google 의 tensorflow 이용자 group 과 같은 곳에 들어가보시면 엄청나게 많은 학생들이 이런 기술을 배우려한다는걸 알수있습니다.

디지털세계에서 이미지란 전체를 작은 pixel 들로 나누고 그 pixel 하나하나에 색을 표시하는 정보를 기록한 data 입니다. 색을 표시하는 방법도 여러가지고요 또 그렇게 이뤄진 data 를 작은 file 로 압축하는 방법도 다양합니다. 그래서 png, jpeg, 등 여러가지 이미지 file 들이 존재합니다. 물론 svg 와 같은 vector 이미지는 이와는 조금 다르죠. 그런데 사실 이런 이미지 file 들의 format 을 바꿔주는 software 가 많기에 보편적으로 많이 사용하는 png format 을 기준으로 생각해봅니다.

가장 간단한 이미지는 문서와 같이 색상이 서너가지로 제한되어 있는경우죠. 이미지의 모든 pixel 에서 특정한 색과 동일한 색을 가진 pixel 들만 따로 추출해서 새로운 이미지를 만들수 있습니다. Python 이란 컴퓨터 language 가 있는데 조금만 공부하면 이정도는 10줄 정도의program 으로 구현 가능합니다. 물론 컴알못에게 쉽다는 말은 아닌데요. 이정도 할수있는 사람들은 무지무지 많아요. 서두에 Machine Learning 과 영상인식을 언급했는데요. 그런걸 하기위해 전처리 (preprocessing) 을 하게 되는데 이미지를 읽어서 RGB 처럼 색을 표시하는 data set 을 만드는걸 포함합니다. 아주 초짜도 할수있단 얘기입니다.

문서에서 학교 logo 라던지 직인과 같이 문서의 글자나 바탕과 다른 색으로 표현된 부분은 이런식으로 쉽게 발췌할수 있습니다. 물론 illustrator 나 photoshop 같은 걸로도 할수는 있지만 깨끗하게 처리하려면 위의 방법을 선택할겁니다. 이런식으로 발췌된 이미지를 바탕이 투명한 png (transparent png) 나 svg 로 file 을 만들어 놓고 필요한 문서에서 insert 할수있습니다. 그래서 문서를 디지털로 만드는건 정말 쉽습니다. 그래서 그런 문서의 softcopy 즉 pdf 와 같은걸로 바꿔 text 나 이멜등으로 쉽게 전달가능합니다. 

실제 문서엔 도장의 인주와 프린터의 잉크가 화학적으로 다르기 때문에 디지털 문서와는 차이가 있습니다. 조국과 정모씨는 원본을 분실했다고 하고 검찰에 원본을 제출하지 않았습니다. 그런데 직인의 이미지 file 이 정씨의 컴퓨터에서 발견됩니다. 총장과 학교측은 그런 상장을 준적이 없다고 하죠. 

영어를 전공한 58세가 직인을 이미지로 만들긴 어려울수도 있습니다. 누군가 해줬겠죠. 만약 학교 로고와 총장직인이 있는 교수임용장과 같은 문서의 이미지가 있다면 저같으면 쉽게 할수있어요. 그 이미지 file 을 조사해보면 작성일과 작성자의 컴퓨터정보가 나와있습니다. 이멜로 그 file 을 벋았던지 아님 flash drive 로 받았을수도 있겠네요. 아님 가족중 누군가 photoshop 이나 illustrator 로 뽑았을 수도 있고요. 아무튼 그 직인 file 을 가지고 있다는 것 자체가 정씨에겐 치명적인 증거라 봅니다. 

거울과 같은 마음이라 했나요?


TL;DR

깨끗하게 logo 와 직인을 추출하는 법
직인의 image file 을 보관하는건 범행도구를 보관하는것과 동일하니 조심해야함