1. 아래 안티노님이 계산을 했는데 내가 그럴 줄 알았습니다. 누구 마음대로 출신지를 숨긴 호남인(이하 호남인A로 약칭)들이 반반치킨입니까? 

호남인A 중 반이 미취업자고 반이 취업자예요? 누가 그래요? 통계가 엿장수 마음대로인지 아세요?

내가 그랬죠? 

"통계는 수치 놀음이 아니라 '국산사자음미체' 전반에 대한 이해를 해야 한다"

미안한 이야기인데 님은 통계를 내는데 필요한 관련 지식이 참 미약해요. 더우기 엑셀도 잘 못쓰시는 모양이네요. 나중에 자유게시판에 엑셀 사용하는 법을 올려드릴께요.


2. 지난 대선 때 출구조사 결과 상의 당선자와 개표 후 당선자가 바뀐거 기억하시죠? (총선이었나? 하여간) 왜 바뀌었을 것이라고 생각하세요?

1) 통계 기술의 문제
2) 선택편향의 문제

생각해 보세요. 이 논제하고 아주 같은 문제입니다.


3. 그런데 김교수는 취업률이 71%라고 하는데 어디서 나온 근거입니까? 아래 KBS의 보도와는 아주 다른데 말입니다.(논점은 아닙니다만 논지 진행 상 언급합니다.)

영남패권-003.gif

이 보도에 의하면 실업률이 4% 이상 올라간 적이 없는데 취업률 71%? 이 부분은 아마 김교수가 맞을겁니다. 우리나라 대학들은 입대 및 대학원 진학 또는 유학도 취업으로 잡으니까. 이건 논제가 아니니까 패스.


4. 그런데 다음 통계를 보면 과별로 미취업률이 나옵니다.

영남패권-004.gif

취업하지 못한 대졸자 전공비율이 인문-사회 분야가 50%에 가깝습니다. 이건 뭘 의미하냐? 바로 향후 권력의 핵심이 속할 법과-경영학과 등이 속해 있고(법과는 차지하는 비율이 좀 높고 경영학과는 차지하는 비율이 상대적으로 낮겠죠) 또한 향후 취업의 가능성이 낮은 정외과-역사학과 등의 학과는 높은 비율로 포함되어 있을겁니다.


이 인문-사회학과 중 호남인A들은 안티노님 표현대로 '선동을 당해서 아래의 기사들'을 보고 믿을겁니다. 즉, 이공학계, 의예과 등에 비하여 정치적 성향이 강하기 때문에 언론은 이 학과들보다 더 자주 접할 것이고 더 선동이 잘 되어 있겠죠.

영남패권-001.gif

영남패권-002.gif


이게 뭘 말하느냐? 미취업자가 50%에 가까우니까 미취업자들 중 표본샘플로 채택될 확률이 크고 그 표본샘플은 상기의 기사들을 자주 접하고 선동을 당해서 호남인 --> 호남인A가 되어 김교수 설문 조사에 응했을 것이라는 점입니다.


아, 김교수가 조사한 것에는 원적지 및 호적이 기록이 안되어 있을테니까 직접 전화 등을 통해 설문조사를 했을겁니다. 반면에 취업자들 중에는 이공학과 및 의대 등이 많은데 이들 중 상당학과가 미래에 권력층에 있을 확률이 상대적으로 적을 것이니 호남인 --> 호남인 A로 변하는 비율이 인문-사회학과의 호남인 --> 호남인 A로 변하는 비율이 적을겁니다. 개체수에서는? 모르죠.

내가 제기하는 문제입니다.

(이공계-의예과)취업자 중 호남인--> 호남인A >=< (인문-사회학과)취업자 중 호남인 --> 호남인 A.


그런데 김교수나 님은

(이공계-의예과)취업자 중 호남인--> 호남인A = (인문-사회학과)취업자 중 호남인 --> 호남인 A.

그래서 내가 이거 증명하라는겁니다. 증명하면 되요.

{(이공계-의예과)취업자 중 호남인--> 호남인A} = {(인문-사회학과)취업자 중 호남인 --> 호남인 A.}

저런 배경에 대한 고려없이 마음대로 반반치킨이예요?

다시 말하면, 모집단에서 차지하는 비율이 크지만 표본샘플로 채택 호남인A로 작동될 확률과 모집단에서 차지하는 비율은 작지만 표본샘플 로 채택 호남인A로 작동될 확률의 대소 비교 문제라는 것입니다.



4. 김교수의 '자기 의견을 강화시킨다'라는 발언

이 김교수, 통계를 알기는 하나요? 통계학에서 '강화시킨다'라는 발언은 오차가 줄어든다는 이야기입니다. 신뢰범위내라면 오치가 늘건 늘지 않건 '대세에 지장없다'라고 합니다.

만일 김교수가 '대세에 관계없다'라고 하면 그런가보다 하고 넘어갔을겁니다. 선택편향취향은 제가 문예계에 쓴 '사람이 낯선 길을 갈 때 갈림길에서 오른쪽을 택한다'라는 것이 바로 이 선택취향 문제이고 통계학에서 필요하니까요.


그런데 아니예요. 오차의 문제를 넘어 툴 자체가 문제가 있는겁니다. 그렇다면? 둘 중 하나죠.

1) 김교수는 호남인A의 상세 자료를 가지고 있지만 지면 공개 상 공개하지 않았다.

2) 그런데 1)이 만족하려면 독자에게 몇가지 정보는 줘야 했습니다. 그런데 없었어요. 검증해볼수록 '결론을 내놓고 짜맞추기 했다'라고 밖에 없었죠. 어떻게? 바로 안티노님처럼 호남인A를 반반으로 나누어놓고요.

3) 증명은 간단해요 호남인A가 전부 취업자인 경우, 전부 미취업자인 경우에 김교수의 데이터 상 영남과 호남의 치이인 4% 이내에 들어오면 됩니다.


5. 살인자의 선택귀향문제

퀴즈하나 내고 가죠.

갈림길이 있는데 하나는 밝은 골목길 하나는 어두운 골목길.

그런데 밝은 골목길을 빠져 나가려면 15분이 걸리고 어두운 골목길을 빠져나가려면 10분 걸립니다.

이 때, 살인을 하려고 마음 먹은 살인자는 어느 골목길에서 피해자가 걸리기를 기다릴까요?

백이숙제는 "以暴易暴"를 남겼고 한그루는 "以"를 남기고 간다.