1. 아래의 표는 안티노님의 주장과 저의 주장을 표로 정리한 것입니다.

그림-010.gif


주장의 요지는

1) 출신지를 숨긴 호남인(호남인 A)이 각각 오십명, 백명 그리고 이백명일 때 
2-A) 안티노님의 주장은 호남인 A를 취업자와 미취업자를 취업률 비율로 나누어 통계에 반영한 것이고
2-B) 저의 주장은 호남인A가 백명인 경우 그 비율을 아래와 같은 범위에서 증명을 해야 한다는 것입니다.
(취업자=100명, 미취업자=0명)부터 (취업자=0명, 미취업자=100명)


선택편향취향 문제는 딱히 임상실험에서만 적용되는 것은 아닙니다. 이 것은 전자산업의 엔지니어링 상 설계 문제 및 그 결과인 생산 과정에서도 적용할 수 있습니다. 문제는 다른 경우에는 표본샘플의 선택편향취향을 계량화할 수 있지만 호남인의 출신지 숨기는 이유는 계량화될 수 없다는 것입니다. 그래서 저는 그 계량화될 수 없는 사회적 요인을 포스팅으로 두번을 했고 (취업자=100명, 미취업자=0명)부터 (취업자=0명, 미취업자=100명)으로 적용해야 하는 이유를 설명했는데 이해를 못하는 것인지 아니면 이해를 못한 척 하는 것인지 모르겠습니다. 그래서 다시 포스팅을 합니다.


사실, 계량화한 방법을 김교수는 짧은 지면이지면 힌트를 줬어야 합니다. 그런데 없습니다. 검증의 결과, 그리고 안티노님의 유효한 그리고 유효하지 못한 지적들을 고려하면서 나름대로 내린 결론은 '영남패권 은페 심리'입니다. 

1) 우선 제기하는 문제는 (제가 어문학적으로 설명을 드렸듯) 영남인 -> 호남인이나 호남인 -> 영남인 경우(앞은 출생지, 뒤는 출생지를 숨긴 결과의 출생지)는 발생할 수 없습니다. 여기서 추가하자면, (김교수도 상위층에서는 영남패권이 존재한다고 했으므로)추가 이익을 바라고 비비영호남인 -> 호남인은 가능성이 없다고 보는 것이 맞고 비영호남인 -> 영남인으로 할 가능성이 있기는 합니다만 역시, 어문학적 이유 때문에 쉽지 않다고 봅니다.

물론, 10세 이전에 서울로 올라온 경우에는 다르겠죠. 그러나 여전히 (출생지에서 성장했을 가능성이 많은)부모 밑에서 자란 것을 생각한다면 실제 출생지 = 숨긴 출생지와 실제 출생지 -> 숨긴 출생지의 결과 당장의 이익 또는 추후 이익 등을 고려하여 비영호남인-> 영남인도 사실 상 없다고 보는게 맞습니다.

즉, 일베 등에서 호남을 마타하는 글들을 보면, 그리고 그동안 출생지가 호남이어서 문제가 되었던 사람들의 기록 상의 출생지들을 미루어 생각한다면 호남인 -> 호남인A에서 호남인A가 선택한 선택지는 예외없이 '서울 아니면 경기도'라는 것입니다.


2) 기사에 보면 김교수는 다음과 같은 순서로 행동했습니다.

a. '2010년 인구총조사 자료'를 토대로 여론조사를 실시
b. 여론조사 결과 선택취향문제 지적을 받고 여론조사에 반영
c. 선택편향효과를 여론조사에 반영한 결과 선택편향효과는 자신의 주장을 강화하는 방향으로 한다.

저 주장에는 수많은 함정이 있습니다. 함정을 일일히 대기는 함들고 제가 Asker님께 답변을 드리면서 언급한 '영남패권의 trickle down'(관련 글은 여기를 참조)은 아마 직관적으로 영남패권을 인정하시는 분들은, 아니 영남패권을 인정하지 않는 분들도 예를 들어, 회사의 사장이 특정 지역 출신이면 자신의 출신지 인물들을 선호할 것이라는데 동의하실겁니다. 특히, 한국은 인맥의 사회로 악명이 높으니까요.

이걸 김교수에게 이렇게 질문을 드립니다.

"사회학자 교수라는 양반이 짐멜류의 트리클 다운 효과를 모릅니까?"

김교수는 b에서의 지적을 받기 전에 아래와 같이 결론을 내렸습니다.

"영남패권은 권력층에서는 존재하지만 하위층에서는 존재하지 않는다. 선택편향효과를 적용한 결과는 오히려 자신의 주장을 강화시킨다"


물론, 김교수는 상위층에서 영남패권이 있고 그 것이 하위층에서는 없다고 주장한 이유가 호남인-> 호남인A를 조사한 결과이겠지요. 즉, 선택편향취향을 지적 받기 전에는 호남인A의 존재를 김교수는 몰랐을 수도 있다는 이야기입니다. 그러나 선택편향효과를 반영하기 전이라면 영남패권이 상위층에서 존재한다는 김교수의 주장, 그 주장에 영남패권 트리클 다운이 적용됨에도 4%의 오차 밖에 안난다는 것은 김교수가 자신의 조사를 자기부정하는 행위 아닌가요?



그래서 여기서 김교수에게 추가 질문을 드립니다.

"호남인A의 샘플 조사를 어떻게 하셨습니까? 김교수께서는 2010년 인구총조사 자료를 기본으로 조사했을 것이고 선택편향취향의 통계상 검증을 위해서라면 대학생들 중 2010년 인구총조사 자료에서 출생지가 비호남인 경우에 한하여 면담을 하셨을테인데 과연 그들 중 얼마나 많인 샘플이 호남인A라고 대답을 했습니까?"

"호남에서 호적을 파가 호남 출신을 숨긴 부모층과 대학생들의 편차는 어떤 방법으로 보정하신겁니까?"

 


2. 여기서 생기는 의문은 전수조사를 한 경우 그 것을 표본조사를 한 경우로 대치했을 때입니다. 아래의 표를 보십시요.

그림-012-02.gif

김교수가 표본샘플을 천명으로 했을 때 선택편향효과가 반영이 되려면 최소한 두 명 이상이 됩니다. 편의 상 김교수의 표본샘플수를 천명, 그리고 호남인A의 샘플수를 10명이라고 할 때 그걸 호남인 모집단으로 환산합니다.(Case 4)

호남인 모집단 99,000명 중에 호남인A가 1,000명입니다. 그러면 이 것은 이미 선택편향취향의 문제 여부가 아닙니다. 정치 및 사회 병리학 과제입니다. 아닌가요? 내가 '툴 자체가 틀렸다'라고 한 이유입니다. 처음에는 제가 단순히 오차의 범위만 따졌기 때문입니다. 그런데 다시 보니 김교수가 잘못 말했습니다.

김교수는 이렇게 말했어야 맞다는 것이죠.

"선택편향취향 조사의 결과, '정치 및 사회 병리학 차원에서 심층적 조사 및 분석이 이루어져야 한다'



3. 은행의 경우 호남인->호남인A의 경우

1) 아래는 은행장들에 대한 기록들입니다.

전두환 정권 때는 13개 은행의 은행장이 전부 영남 출신
이명박 정권 때는 5대 은행의 은행장이 전부 영남 출신에 4명이 고려대 출신


만일, 서울대 출신이며 아주 똑똑한 호남인이 은행에 들어갔을 때 그는 호남인->호남인A로 바뀔 확률은 얼마일까요?


상기 기록은 영남패권이 존재한다는 증거지만 호남인->호남인A로 바뀔 확률은 낮을겁니다. 왜? 호남출신을 숨겨봐야 영남인이 아닌 이상 은행장이 될 확률은 없으니까요.

그럼 호남 및 타지역 출신이 은행장이 될 가능성을 높이기 위하여 영남으로 출생지를 바꿀까요? 바꾸는게 유리하겠죠. 그러나 이미 위에서 설명한 것처럼 '가능성이 희박하다'라고 했습니다. 무시해도 된다는 것이죠.

따라서, 은행에 취업한 호남인이 호남인A로 바뀔 확률은 직종에 따른 호남인->호남인A로 바뀌는 평균치(김교수가 이걸 무시했습니다)보다 떨어지겠죠.

마찬가지입니다. 은행에 취업하고자 하는 미취업자 호남인 역시 호남인->호남인A로 바꾸어 대답할 확률은 은행에 취업한 취업자의 확률과 비슷할겁니다.


따라서 호남인->호남인A로 바꿀 확률은, 아이러니하게도 상위층이 영남패권의 증거가 뚜렷한 은행 직종의 경우 '기대감'이 없기 때문에 호남인->호남인A로 바뀔 가능성이 평균치보다 밑일겁니다.


여기 하나의 변수가 있습니다. 은행에 취업하고자 하는 호남인 모두가 은행장을 겨냥하지는 않을겁니다. 은행에 취업만 되고 그리고 가능한 한 정년퇴직, 정년퇴직은 안되더라도 오래동안 은행에 근무하는 것을 원할겁니다.


은행에 취업한 호남인들 중 호남인A로 바뀔 확률과 은행에 취업하고자 하는 미취업 호남인들 중 호남인A로 바뀔 확률의 비율이 호남인의 치업률과 비례하지 않는다는 것입니다.

은행장을 바라는 호남인은 호남인A로 바뀔 확률이 상당히 높지만 은행장을 바라는 호남인의 숫자는 적기 때문에 표본오차에 미치는 영향은 상당히 적습니다. 그리고 은행장을 바라지 않고 은행에 취업된 것으로 그만인 호남인들 중 호남인A로 바뀔 가능성은 은행별로 다를겁니다. 반면에 취업난인 현실에서 미취업자들은 직종에 관계없이 취직이 최우선이겠지만 그래도 은행에 취업하는 것을 우선 순위로 두는 호남인은 호남인A로 바뀔 확률이 평균보다 큽니다. 


4. 재벌들의 부사장 이상 중에서 호남인 출신은 삼성은 한명, LG와 한화는 0명(한화는 사외이사에 최소 두명 호남 출신이 있기는 합니다)

삼성이나 LG 그리고 한화가 인사 상의 호남을 차별(고의적이건 미필적이건)했다는 것은 이 통계를 알 수 있습니다. 그런데 이 경우, 호남인->호남인A로 바뀌는 경우는 어디가 가장 많을까요?

이 사실을 아는 호남인들은 오히려 삼성을 '출신지나 학벌보다는 능력'이라는 판단에 호남인->호남인A로 바뀔 확률이 적습니다. 아니, 삼성이 LG와 한화와 같이 0명인 경우에도 외부에서 알려지기에는 '인사 상의 공정성'이 LG나 한화보다 압도적이므로 호남인->호남인A로 바뀔 확률은 실제 '기업 중 호남차별을 가장 심하게 한다는 삼성'에서 가장 낮을 수도 있습니다.


수많은 사례들이 있습니다만 이 정도면 아래 제 주장의 합당성을 찾을 것입니다.

호남인A가 백명인 경우 그 비율을 아래와 같은 범위에서 증명을 해야 한다.
(취업자=100명, 미취업자=0명)부터 (취업자=0명, 미취업자=100명)

즉, 선택편향취향의 대상인 표본샘플의 방향성이 외부요인에 따라 예측이 불가하기 때문에 -100%~100%의 범위에서 검증되어야 한다는 것입니다. 제가 주장하는 것이 의심스러우면 통계전문가에게 검증을 받아보십시요.


5. 내가 주장하는 것은 물론 저는 그렇게 판단하고 있습니다만 '하위계층에서 영남패권이 있다'라는 것이 아닙니다. "김교수의 '하위계층에서 영남패권이 없다'라고 말하는 근거가 틀렸다"입니다. 그리고 상기의 예를 들어 김교수는 '영남패권 은폐 심리 의혹이 있다'라고 판단합니다.


물론, 이렇게 레이블링을 붙이는 것이 옳은지는 모르겠습니다. 아니, 해가 되겠지요. 왜냐하면, 그래도 객관적으로 분석을 시도했던 사람들에게 레이블링을 붙인 결과 영남패권 및 호남차별 문제는 쳐다보지도 않을 결과를 초래하니 말입니다.

그러나 친노의 조기숙의 예를 들면, 진짜 객관적인 입장에서 영남차별 그리고 호남차별을 연구해보고 싶은 사람들은 이런 레이블링 쯤은 무시할겁니다. 그래서 붙여봅니다.


6. 몬테카를로의 악마의 동전

동전을 던져서 앞면이 나올 확률은 50%입니다. 물론, 동전을 던진 후 손바닥 위에 올리거나 또는 바닥에 동전이 떨어지게 하는 경우 동전을 튕기는 높이를 조절해서 확률을 바꿀 수는 있습니다. 아마 한 10% 정도? 그 정도는 확률을 조작할 수는 있겠지요. 라스베가스의 경험 상 트럼프나 블랙잭 등에서 딜러들이 카드를 조작하는 경우도 많습니다. 당연히 동전던지기에서도 확률을 조작할 수 있겠지요.


그런데 1920년대 놀랄만한 사건이 터집니다. 바로 '몬테카를로 악마의 동전'으로 불리는 것인데 26번 연속 동전의 앞면이 나왔습니다. 딜러가 조작을 했다고 해도 26번 연속해서 동전의 앞면이 나올 확률은 0%. 더우기 레이스를 하는 손님들도 나름 '타짜'여서 딜러가 함부로 확률 조작을 하지는 않았을 것입니다.


자, 동전을 던져서 앞면이 나올 확률은 50%. 그런데 15번째 판돈을 거는 경우, 20번째 판돈을 거는 경우 그리고 25번째 판돈을 거는 경우, 손님들은 각각 50%의 확률로 판돈을 걸었을까요?

백이숙제는 "以暴易暴"를 남겼고 한그루는 "以"를 남기고 간다.