1. 다들 아시겠지만 'sorting'은 우리말로 '분류'라고 한다. 국어사전에서 단어의 설명을 'ㄱ', 'ㄴ', 'ㄷ' 등의 순서로 분류되어 있으며 'ㄱ'은 다시 '가',' 갸', '거' 등의 순서로 배열되어 수록되어 있다. 이렇게 (순차적으로)분류하는 것을 'sorting'이라고 한다.


오늘은 이 sorting에 대한 이야기


2.자유게시판에 쓴 내 글 '컴퓨터로 할 수 없는 두가지'라는 제하의 글에 getabeam님께서  이런 답변을 주셨다.

중국 사람 인구가 1.3 billion 정도 되나요? 중국 사람 이름은 3글자 혹은 4글자니까, 1글자에 2 바이트정도 잡으면 1.3 * 4 * 2 = 대충 10 GB 정도의 데이터네요. 요새 1TB 를 1분에 sorting하는 시스템들이 있으니까, 10GB 정도면 0.6 초에 sorting 되겠네요.

getabeam님의 답변은 내가 내세운 '실시간'이라는 조건에 동의한다는 것이 포함되어 있다. 


예를 들어, 신생아 한 명이 새로 중국행정전산망에 올라가면 굳이 전체를 다시 sorting할 필요는 없지만 '실시간'이라는 조건은 한명이 추가될 때마다 전체를 다시 sorting한다는 것을 전제로 한다. <---사실, 내 경험에 비추어 본다면 한 명만 추가하는 경우에도 전체 sorting이 필요할수도 있겠다. 내가 DB, 즉 데이터 베이스는 잘 모르니 상세는 생략...


그런데 getabeam님은 중국의 인구증가와 동명이인을 고려하지 않으셨다는 것이다. 물론, 결론부터 이야기하자면 여전히 getabeam님의 주장인 'sorting이 가능하다'는 참이다. 


어쨌든 디테일을 볼까?


중국의 인구증가는 다음과 같다.


'인구는 기하급수적으로 증가한다'는 것을 배제한다면 2000년부터 2010년 중국의 인구증가는 연간 천만명. 이 것을 계산해보면 3.1초당 한명씩 태어난다. 따라서, 0.6초에 sorting된다고 했으니 시간적으로는 충분하다.(입력시간을 고려하면 3.1초 당 행정전산망에 등재되는 것이 불가능하므로 sorting이 되지 않기는 하다. sorting 중에 새로운 입력을 해야 하므로. 물론, 한사람이 입력하는 것이 아니므로 sorting이 가능하기는 하다.)



그런데 동명이인을 고려한다면? 당시 계산했을 때는 중국의 동명이인이 10%에 육박한다...라는 통계자료를 바탕으로 한다. 지금 잠시 검색을 해보니 중국의 동명이인 비율이 검색되지는 않는데 만일, 동명이인이 10%라면?



그렇다면 2000년 기준으로 동명이인의 비율이 1억2천만명이고 중국의 최소 행정단위인 현(미국의 county에 해당)을 십만개만 잡아도 한 현에 천명의 동명이인이 존재하고 이 동명이인을 'sorting'하기 위하여는 이름 뿐 아니라 기타 추가적인 신상정보가 필요하다. 물론, 주소의 경우에는 일일히 주소명을 입력하지 않고 현단위로 '부호화'하면 3바이트면 가능할 것이다.



따라서, DB 검색은 getabeam님께서 언급하신 10GB이외에 10GB x 4바이트(이름)/3(부호화된 행정이름) = 13.3GB이다.



당연히, 13.3GB의 데이터를 sorting하는 경우에도 10GB를 sorting하는데 걸리는 시간이 0.6초, 신생아는 3.1초당 한명씩 태어나니까 실시간으로 sorting이 가능할 것이다.


내가 여기서 이야기하고자 하는 것은 getabeam님이 과거 5년 전의 일을 예단하지 않았다는 것이다. 간단하게, 현재의 사실만 드라이하게 이야기함으로서 논란을 최소화 시켰다는 것이다.



3. 내 인생의 최초의 sorting


내 신상정보가 sorting된다는 것은 누군가에 필요성에 의하여 중요도가 분류된다는 것이다. 


은행에서는 내 신상정보가 나의 연봉, 직업의 안정성 및 보유재산이 '키워드'가 되어 소팅이 되고 나는 그 기준에 의하여 번호가 매겨질 것이다. 그리고 그 번호가 클수록 나는 사회의 부유층보다는 하류층에 가깝다는 것을 의미한다.


보험회사에서는 내 나이와 건강이 '키워드'가 되어 번호가 매겨질 것이다. 이번에는 반대로 내 번호가 작을수록 클수록 나는 보험대상에서 멀어지는, 그러니까 '무탈하게 산다는 표징'이 될 것이다.


이렇게 자본주의 사회에서 나는 그 필요에 의하여 이렇게 저렇게 sorting이 되어 분류되고 번호가 매겨질 것이고 어떤 경우에는 번호가 커서 슬픈 처지로 간주가 되고 어떤 경우에는 반대로 번호가 작아서 행복한 처지로 간주가 될 것이다. 내 실제 상황과는 전혀 관계없이.



그러면 내 인생의 최초의 sorting 키워드는 무엇일까?



"자, 여러분 이제 복도로 나가서 키 순으로 서봐요"


초등학교 일학년 때 담임선생님에 의하여 나와 급우들은 복도에 나가서 sorting을 했다. '키'라는 키워드를 가지고.


당시에는 나나 급우나 키에 의하여 'sorting된다'는 의식조차 없었다. 아니 의식은 커녕 서로 큰 번호를 차지하려고 '도토리 키재기'를 한게 전부였다. 그리고 나는 초딩 4학년 때 최초로 그런 sorting에 대하여 의문을 제기했다.



 "선생님, 왜 우리는 항상 키순이나 이름 순으로 번호를 부여받고 자리에 앉아야 해요? 그냥 친한 친구들과 같은 자리에 앉으면 안되나요?"



나의 의문은 단 일고의 가치도 없이 묵살되었다.



내 인생 최초의 'sorting 키워드'는 키. 


그리고 대부분의 사람들 인생 최초의 sorting 키워드는 '키'일 것이다. 그래서 키가 180센티미터가 되지 않으면 '루저'라는 소리를 들어야 하는지도 모른다. 최초의 sorting 키워드인 '키'가 만들어낸 잠재의식의 발로일지도 모르는 체.

백이숙제는 "以暴易暴"를 남겼고 한그루는 "以"를 남기고 간다.