정치/경제/사회 게시판
글 수 20,654
김교수 말의 의미에 대해서 알아보자.
김교수는 다음과 같은 말을 했습니다.
<<<
청년층에서 영남 출생자가 더 이득을 보는 것도 아니다. 대졸자 직업 이동경로 조사 자료를 이용해 서울 소재 4년제 대학 졸업자의 졸업 직후 노동시장 성과를 보면 영남 출생 남성은 73%, 호남 출생 남성은 69%가 취업했다.
>
단순화 하여 간단하게 표로 나타내면, 다음과 같습니다.
여기서, 영호남 제외 전국에서 71%의 취업률은 그저 (영남+호남)/2 한 취업률입니다. 해당 수치를 저렇게 잡은 것은 영남패권주의자들의 주장에 따르면, 영남이 가장 발전하고 살기 좋고 지들끼리 해먹고 아무튼 좋은건 다 쓸어담았고, 호남은 가장 낙후하고 살기 나쁘고 들키면 불이익을 받고 아무튼 나쁜건 다 쓸어 담았기 때문에, 전국 취업률은 그 사이 어딘가에 있겠지 하는 영남패권론을 외치는 자들의 가정에 따른 것입니다.
편의상이것을 원자료라고 부르겠습니다. 다음으로 이 원자료에 대해서 김교수는 다음과 같은 말을 합니다.
<<
혹자는 출생지역으로는 지역 효과를 파악할 수 없고 출신지역을 봐야 한다고 주장할 것이다. 사회과학에서 흔히 말하는 ‘선택편향효과’를 통제해야 한다는 얘기다. 하지만 호남 출신이 출신지를 숨기는 이유는 호남 출신자의 불이익을 완화하기 위해서다. 이 경우 출신지역 효과는 줄어들면 줄어들지 늘어나지는 않는다. 선택편향의 방향이 필자의 결론을 약화하기보다 오히려 강화한다는 얘기다
>>
여기서, 김교수는 영남패권론의 가정이 호남 출신의 출신자가 불이익을 완화 하기 위해서 고향을 숨기는 것이기 때문에, 그것을 반영하는 경우 유의미한 차이를 발견할 수 없다는 김교수의 논지를 강화하는 방향으로 작동한다는 것이다.
개인적으로 제 입장에서는 이 말이 뭐가 그렇게 이해하기 힘들다는 것인지 모르겠습니다만, 이해하지 못하는 사람이 있으니 한번 정리해 보겠습니다.
가정 1. 호남출생 취업자중 1%가 고향을 속인 경우.
단계 1. 작은 차이를 무시할 경우. 호남의 인구수에 해당하는 10명을 ‘지역관계 없이 랜덤’으로 뽑아오면 됩니다. 호남 인구수는 1000-> 1010명으로 1% 증가합니다.
단계 2. 어느지역으로 거짓말을 했는지 모르니 랜덤하게 빼오기위해 호남을 제외하고 영남+영호남제외 전국에서 영남이 1/5를 차지하니 거기서 인구수를 2명 빼옵니다.
영호남 제외 전국이 4/5를 차지하니 거기서 8명을 빼옵니다. 영남의 인구는 998명, 영호남 제외 전국은 4992명이 되었습니다.
단계 3. 영남에서 빼온 2명의 취업률은 73%입니다. 취업자는 2*0.73=1.46 명입니다. 영남 취업자에서 1.46 만큼을 빼 줍니다. 영남 최종 취업자 수치는 728.54명 입니다.
영호남 제외 전국의 취업률은 71%로 가정 했으므로, 취업자는 8*0.71=5.68 명입니다. 먼저, 영호남제외 전국 취업자에서 5.68 명을 빼줍니다. 3544.32명이 됩니다.
마지막으로 호남지역의 취업자 수를 더해 줍니다. 1.46+5.68=7.14 이고 697.14명이 됩니다.
변경된 사항을 표로 정리하면 다음과 같습니다. 편의상 수정후 자료로 부르겠습니다.
결론적으로 차이는 3.976238%p로 4%p에서 줄어들었습니다. 김교수가 제시한 대로 영남패권론이 실제로 존재한다면 김교수의 결론을 강화하는 방향으로 수치는 수정됩니다.
원자료와 수정후 자료가 보여주는 결과는 매우 간단하고 직관적입니다. 여기서는 랜덤한 지역을 강화했으나, 영남패권주의자의 주장을 따른다면 분명 호남 출생의 사람이 영남출생이라고 속인 유인이 발생합니다.
이것을 단순화 해서 설명하니 영남 100% 호남 100%는 없다는 말을 하면서 한그루님께서 단순화 한것에 대해서 트집을 잡았습니다만, 단순화를 이해하지 못하면 뭐 어쩔 수 없지요.
영패론자들의 가정을 받아들여 수치를 수정하는 경우 다른 결론이 나오기는 힘듭니다. 고향을 속인자가 0.1%, 0.0001%, 0.0000000000000000001% 라고 해도, 방향성은 언제나 김교수가 말한대로 결론을 강화하는 방향 즉, 4%보다 차이가 줄어들게 됩니다.
ps: 영남: 영호남 제외 전국 비율은 0.167: 0.833 인데 실수했네요. 계산결과로 나오는 방향성은 달라지지 않습니다.
Tweet
김교수는 다음과 같은 말을 했습니다.
<<<
청년층에서 영남 출생자가 더 이득을 보는 것도 아니다. 대졸자 직업 이동경로 조사 자료를 이용해 서울 소재 4년제 대학 졸업자의 졸업 직후 노동시장 성과를 보면 영남 출생 남성은 73%, 호남 출생 남성은 69%가 취업했다.
>
단순화 하여 간단하게 표로 나타내면, 다음과 같습니다.

여기서, 영호남 제외 전국에서 71%의 취업률은 그저 (영남+호남)/2 한 취업률입니다. 해당 수치를 저렇게 잡은 것은 영남패권주의자들의 주장에 따르면, 영남이 가장 발전하고 살기 좋고 지들끼리 해먹고 아무튼 좋은건 다 쓸어담았고, 호남은 가장 낙후하고 살기 나쁘고 들키면 불이익을 받고 아무튼 나쁜건 다 쓸어 담았기 때문에, 전국 취업률은 그 사이 어딘가에 있겠지 하는 영남패권론을 외치는 자들의 가정에 따른 것입니다.
편의상이것을 원자료라고 부르겠습니다. 다음으로 이 원자료에 대해서 김교수는 다음과 같은 말을 합니다.
<<
혹자는 출생지역으로는 지역 효과를 파악할 수 없고 출신지역을 봐야 한다고 주장할 것이다. 사회과학에서 흔히 말하는 ‘선택편향효과’를 통제해야 한다는 얘기다. 하지만 호남 출신이 출신지를 숨기는 이유는 호남 출신자의 불이익을 완화하기 위해서다. 이 경우 출신지역 효과는 줄어들면 줄어들지 늘어나지는 않는다. 선택편향의 방향이 필자의 결론을 약화하기보다 오히려 강화한다는 얘기다
>>
여기서, 김교수는 영남패권론의 가정이 호남 출신의 출신자가 불이익을 완화 하기 위해서 고향을 숨기는 것이기 때문에, 그것을 반영하는 경우 유의미한 차이를 발견할 수 없다는 김교수의 논지를 강화하는 방향으로 작동한다는 것이다.
개인적으로 제 입장에서는 이 말이 뭐가 그렇게 이해하기 힘들다는 것인지 모르겠습니다만, 이해하지 못하는 사람이 있으니 한번 정리해 보겠습니다.
가정 1. 호남출생 취업자중 1%가 고향을 속인 경우.
단계 1. 작은 차이를 무시할 경우. 호남의 인구수에 해당하는 10명을 ‘지역관계 없이 랜덤’으로 뽑아오면 됩니다. 호남 인구수는 1000-> 1010명으로 1% 증가합니다.
단계 2. 어느지역으로 거짓말을 했는지 모르니 랜덤하게 빼오기위해 호남을 제외하고 영남+영호남제외 전국에서 영남이 1/5를 차지하니 거기서 인구수를 2명 빼옵니다.
영호남 제외 전국이 4/5를 차지하니 거기서 8명을 빼옵니다. 영남의 인구는 998명, 영호남 제외 전국은 4992명이 되었습니다.
단계 3. 영남에서 빼온 2명의 취업률은 73%입니다. 취업자는 2*0.73=1.46 명입니다. 영남 취업자에서 1.46 만큼을 빼 줍니다. 영남 최종 취업자 수치는 728.54명 입니다.
영호남 제외 전국의 취업률은 71%로 가정 했으므로, 취업자는 8*0.71=5.68 명입니다. 먼저, 영호남제외 전국 취업자에서 5.68 명을 빼줍니다. 3544.32명이 됩니다.
마지막으로 호남지역의 취업자 수를 더해 줍니다. 1.46+5.68=7.14 이고 697.14명이 됩니다.
변경된 사항을 표로 정리하면 다음과 같습니다. 편의상 수정후 자료로 부르겠습니다.

결론적으로 차이는 3.976238%p로 4%p에서 줄어들었습니다. 김교수가 제시한 대로 영남패권론이 실제로 존재한다면 김교수의 결론을 강화하는 방향으로 수치는 수정됩니다.
원자료와 수정후 자료가 보여주는 결과는 매우 간단하고 직관적입니다. 여기서는 랜덤한 지역을 강화했으나, 영남패권주의자의 주장을 따른다면 분명 호남 출생의 사람이 영남출생이라고 속인 유인이 발생합니다.
이것을 단순화 해서 설명하니 영남 100% 호남 100%는 없다는 말을 하면서 한그루님께서 단순화 한것에 대해서 트집을 잡았습니다만, 단순화를 이해하지 못하면 뭐 어쩔 수 없지요.
영패론자들의 가정을 받아들여 수치를 수정하는 경우 다른 결론이 나오기는 힘듭니다. 고향을 속인자가 0.1%, 0.0001%, 0.0000000000000000001% 라고 해도, 방향성은 언제나 김교수가 말한대로 결론을 강화하는 방향 즉, 4%보다 차이가 줄어들게 됩니다.
ps: 영남: 영호남 제외 전국 비율은 0.167: 0.833 인데 실수했네요. 계산결과로 나오는 방향성은 달라지지 않습니다.
2017.01.08 18:30:45
안티노님/짝짝짝. 환타지 쓰느라 수고하셨습니다.
근데 님은 호남->영남 없다고 동의까지 해놓고 또 통계에 그렇게 쓰면 뭘 어쩌자는겁니까? 호남->영남 없다고 했죠?

그리고 천명 중 한명? 10명, 50명으로 놓고 계산 다시해보세요. 내가 제기한 것은 그럴 경우에 김교수가 제시한 4%의 신뢰 오차를 넘어간다...입니다. 님이 고향을 숨긴 호남인의 숫자를 1000명 당 한명으로 놓고 계산하니까 뻘 계산이 되는겁니다. 이해력이 부족해 보이니까 다르게 설명해 줄께요.
1) 호남의 전국 인구가 5천만 인구 중 30%라 치면 천오백만명
2) 님의 계산치인 출신지를 숨긴 호남인은 천명 당 한명 꼴이라면 총 호남인 중 출신지를 숨긴 인원이 15만명입니다.
3) 질문 하나 : 15만명이면 큰거예요? 작은거예요?
질문 둘 : 왜 고향을 숨긴 인원이 15만명입니까?
질문 셋 : 김교수나 님은 왜 천명 당 한명으로 놓고 계산했죠? 무슨 근거로?
추가 : 내가 그랬죠? '결론 내놓고 짜맞추기 했다고?' 님도 아마 50명 쯤으로 했다가 내 주장이 맞으니까 천명 당 한명으로 한거 같은데요?
2017.01.08 20:22:08
한그루님은 역시 답을 못하는군요 ㅠ.ㅠ 어쩔수 없죠. 김대중과 영남패권은 한그루님이 지켜야 할 신념이니까요. 여기에 또 한번 대답하면, 한그루님이 김교수의 주장을 전혀 이해 하지 못했다는 것을 확인사살하는거니까요.
신념이 아니라 머리로 토론을 하세요. 그럼 지금같이 쪽팔린 상황은 모면 하실수 있습니다.
ps: 전체 대학생을 출신 혹은 출생지역으로 구분했을때, 영남출신(생)과 호남출신(생) 중에 누가 더 많을까요? 아마 이것도 대답하지 못할껄요. 영패론에 따르면 어디가 많아야 하는지 답이 뻔~~~~ 한대 그거 대답하면 김교수의 말이 맞거든요 ㅋㅋㅋ
신념이 아니라 머리로 토론을 하세요. 그럼 지금같이 쪽팔린 상황은 모면 하실수 있습니다.
ps: 전체 대학생을 출신 혹은 출생지역으로 구분했을때, 영남출신(생)과 호남출신(생) 중에 누가 더 많을까요? 아마 이것도 대답하지 못할껄요. 영패론에 따르면 어디가 많아야 하는지 답이 뻔~~~~ 한대 그거 대답하면 김교수의 말이 맞거든요 ㅋㅋㅋ
2017.01.08 18:36:29
나는 통계 자체의 오차를 증명하기 위하여 생략했지만 님은 '인구보정'은 안했습니다. 김교수는 표본 샘플을 만들 때 인구보정을 했을까요? 안했을까요? 총인구가 영남>호남이고 그 차이가 크기 때문에 인구보정을 했을겁니다. 첫번째, 호남->영남 경우 빼고, 그리고 인구보정을 한 후 다시 계산해보세요.
2017.01.08 19:03:50
안티노님/그러니까요. 중언부언하지 마시고 아래 제가 쓴 알파오류나 베타 오류 좀 보고 말씀하세요.
방향성이 왔다갔다 하는데다가 표본샘플 중 특이샘플(출신지를 숨기는 호남인)의 비율이 높아질수록 통계의 신뢰성은 떨어진다고요.
저걸 정확하게 하려면, 직종별로 나누고 미래에 권력층이 될만한 직업(아래 님께서 졸업 직후가 졸업 후 3년 이내라고 했으니까 검사, 판사, 변호사 신입도 해당 사항이 있고 의사들도 해당사항이 있겠죠? 그리고 서울대 경영학과 나온 친구들도 해당사항이 있겠고요) 과 그렇지 않은 직업으로 나누어야 한다,
수치 상으로는 님의 계산이 맞다. 그런데 방향성에 따라 오차가 달리 나오니 통계의 툴이 틀렸다...라고 주장하는게 제 요지이고요.
2017.01.08 18:59:44
한마디 더하자면, 이 통계의 오류는 알파 오류인지 베타 오류인지를 구분하면 됩니다. 알파 오류면 님의 주장이 OK. 그런데 나는 지금 베타 오류라고 하는겁니다. 저도 처음 출발은 알파 오류 --> 그런데 베타 오류로 보인다 --> 실제 통계가 없으니까 나도 모르겠다.
그런데 님은 알파 오류도 아닙니다. 그냥 맞다...입니다. 김교수의 주장도 알파 오류도 그렇다고 베타 오류도 아닙니다. 가설의 방향성이 +인지 -인지도 모르는데 -라고 판단 내린 것에 불과하다는 것입니다. 제가 계속 선택편향효과의 방향성 이야기 했잖아요?
내가 처음에 제기한 선택편향측정의 예에서 다이어트 예를 들어드리죠.
임상실험대상자 : 1000명 (덜 뚱뚱한 사람 500명, 뚱뚱한 사람 500명 --> 인구보정하면 다르게 나오겠지만 인구보정한 결과라고 가정)
임상실험 중 탈락자 : (일반적으로 날씬한 사람의 인내력이 크므로) 덜 뚱뚱한 사람 열명, 뚱뚱한 사람 100명
최종 임상 실험 대상지 : 덜 뚱뚱한 사람 490명, 뚱뚱한 사람 400명 --> 이미 인구보정이 허물어진 상태
결과 : 자, 어떤 경우에 이 다이어트 약이 효과가 있다고 판단이 들까요?
2017.01.08 19:08:18
통계오차 수정방법
방법1.날씬한 사람이 뚱뚱한 사람보다 인내심이 낮은 확률을 구해서 계산하면 됩니다.
방법2. 뚱뚱한 사람이 더 많이 탈락했다면, 실험 이후 몸무게의 변환치 양극단값부터 날씬한 사람의 수를 뚱뚱한 사람의 수와 일치할때까지 줄이면됩니다.
방법3. 탈락할때까지의 시간이 있기 때문에 매 시간 혹은 8시간 단위의 몸무게 측정을 통해 시계열적 상관을 이용해 검증
방법4. 우선 인내심을 보인 그룹이 이번실험으로 구별 되었으니, 해당 그룹의 명단에서 작은 그룹의 절반 이하 수를 RNG를 활용하여 다시뽑아 재표본을 삼음. 의학적으로 유의미한 기간동안 자유롭게 본인 생활패턴을 유지할 기간을 주어 약효등으로 인한 효과를 제거
통계를 알면 오차를 수정할 수 있는 방법을 알 수 있어요. 님이 지금 오류라고 주장하는건 님이 김교수의 주장을 이해하지 못해서 우기고 계시는거에요. 전 지금 논리적 견지에서 방법 1로 통계치를 수정했을때 김교수의 주장대로 강화되나 아닌가에 대해서 입증해 주겠다는거에요.
그걸 보여줬더니 인구수 비율이 틀리다고 비판을 하잖아요. 비판에서의 입증책임을 누가 지는지 알려줄게요.
http://theacro.com/zbxe/5279000
여기서 제가 미투님의 말에 비판하면서 정확한 수치를 가지고 오죠? 님은 제 가정을 비판한거에요. 그럼 수치를 가지고 와야 하는것은 누구입니까?
얼른 수치 가지고 와요. 그리고 김교수의 주장은 출신지를 속이는 호남인이 많을수록 강화되요. 님은 지금 그걸 이해를 못하고 있는거에요. 이건 설명하려면 님이 수치를 가지고 온것에 기반해서 설명하는게 더 빠르거든요. 얼른 수치 가지고 오세요.
방법1.날씬한 사람이 뚱뚱한 사람보다 인내심이 낮은 확률을 구해서 계산하면 됩니다.
방법2. 뚱뚱한 사람이 더 많이 탈락했다면, 실험 이후 몸무게의 변환치 양극단값부터 날씬한 사람의 수를 뚱뚱한 사람의 수와 일치할때까지 줄이면됩니다.
방법3. 탈락할때까지의 시간이 있기 때문에 매 시간 혹은 8시간 단위의 몸무게 측정을 통해 시계열적 상관을 이용해 검증
방법4. 우선 인내심을 보인 그룹이 이번실험으로 구별 되었으니, 해당 그룹의 명단에서 작은 그룹의 절반 이하 수를 RNG를 활용하여 다시뽑아 재표본을 삼음. 의학적으로 유의미한 기간동안 자유롭게 본인 생활패턴을 유지할 기간을 주어 약효등으로 인한 효과를 제거
통계를 알면 오차를 수정할 수 있는 방법을 알 수 있어요. 님이 지금 오류라고 주장하는건 님이 김교수의 주장을 이해하지 못해서 우기고 계시는거에요. 전 지금 논리적 견지에서 방법 1로 통계치를 수정했을때 김교수의 주장대로 강화되나 아닌가에 대해서 입증해 주겠다는거에요.
그걸 보여줬더니 인구수 비율이 틀리다고 비판을 하잖아요. 비판에서의 입증책임을 누가 지는지 알려줄게요.
http://theacro.com/zbxe/5279000
여기서 제가 미투님의 말에 비판하면서 정확한 수치를 가지고 오죠? 님은 제 가정을 비판한거에요. 그럼 수치를 가지고 와야 하는것은 누구입니까?
얼른 수치 가지고 와요. 그리고 김교수의 주장은 출신지를 속이는 호남인이 많을수록 강화되요. 님은 지금 그걸 이해를 못하고 있는거에요. 이건 설명하려면 님이 수치를 가지고 온것에 기반해서 설명하는게 더 빠르거든요. 얼른 수치 가지고 오세요.
2017.01.08 19:14:40
안티노님/푸하하하. 그거 정확한 수치 아니예요. 윤장현이 3천만원이라고 했다고 하는데 실제 자동차 업계 연봉은? 성과급 포함 9천만원(토요타는 성과금 포함 안시키고 발표해서 현대차보다 낮은데 이걸 자유경제원 등이 정략적으로 '연봉 높다'라고 언론플레이 하는겁니다. 이런 사실, 모르시죠?)
그럼 그 윤장현의 3천만원 연봉이 성과급이 포함된건지 아닌지, 그거부터 거론했어야 합니다. 아시겠어요? 포함되어 있어요? 안되어 있어요? 비정규직인지 아닌지 보면 알겠죠. 비정규직이면 성과금을 안주니까 3천만원 맞고 정규직이면 윤장현이 뭘 모르고 떠든겁니다. 그런데 윤장현의 그동안 정책을 보면 그 정도도 모르지는 않았을 것이라는게 제 판단이예요.
그러니 님은 통계 수치 들이대고 내 말이 맞다...라고 주장하기 전에 정규직인지 비정규직인지부터 판단하셔야 했다는 것입니다. 이 논제로 말하면 출신지를 숨긴 인원수와 방향성을 미리 산정해야 했다는거죠. 그런데 김교수도 조사 후에 선택편향효과 이야기했잖아요? 그럼, 다시 따로 무언가를 조사했다는 말인가요?
2017.01.08 19:08:46
다이어트 예 결론? nobody know. 따라서 제약회사는 중도탈락할 사람까지 계산하여 가능한 한 표본샘플 수를 키워야 합니다. 그래서 중도탈락한 사람을 고려해도 결과치들이 신뢰 오차 범위여야 한다는 것입니다.
그럼, 제약회사가 알아야할 것은? 중도탈락할 사람. 그런데 현실적으로는 모르니까 (양심적이라면)표본샘플 수를 키워야 하고 (양심적이 아니라면)문제가 되지 않는 범위에서 약 효능이 있다고 판매하겠죠.
김교수는 지금 중도탈락할 사람 수도 모른 상태에서 표본샘플 수를 임의로 정한겁니다. 증거? 김교수 왈, 통계산출 후 선택편향효과 문제가 제기되었으니까요. 아시겠어요?
2017.01.08 21:01:02
자 보세요. 가정해 보자구요.
졸업직후 취업율이 동일하게 70% 입니다. 영호남 전부요.
근데,
영남출신은 대학 진학 인원이 1000명이에요
호남출신은 대학 진학 인원이 500명이에요.
그러면 지금 명수에 기반해서 이야기하는 님과 저는 취업률만 가지고 이야기 하면 어디가 다수이고 어디가 소수인지에 대해서 오차가 발생하죠? 그래서 물어보는거에요.
아니, 이런 기본적인것 까지 말해줘야되요? 숫자의 경향성을 가지고 비율관계 구축해서 김교수의 가설을 검증하면 되는 겁니다. 딱 물어보면 우리가 공통적으로 동의하는 것에서 미싱고리가 있고 그걸 서로 합의해야지 동의 할 수 있는 가설 모델을 만들 수 있다는게 느낌이 안와요?
졸업직후 취업율이 동일하게 70% 입니다. 영호남 전부요.
근데,
영남출신은 대학 진학 인원이 1000명이에요
호남출신은 대학 진학 인원이 500명이에요.
그러면 지금 명수에 기반해서 이야기하는 님과 저는 취업률만 가지고 이야기 하면 어디가 다수이고 어디가 소수인지에 대해서 오차가 발생하죠? 그래서 물어보는거에요.
아니, 이런 기본적인것 까지 말해줘야되요? 숫자의 경향성을 가지고 비율관계 구축해서 김교수의 가설을 검증하면 되는 겁니다. 딱 물어보면 우리가 공통적으로 동의하는 것에서 미싱고리가 있고 그걸 서로 합의해야지 동의 할 수 있는 가설 모델을 만들 수 있다는게 느낌이 안와요?
2017.01.08 21:21:12
안티노님/진짜 미치겠다.
1. 그래서 내가 이야기했잖아요? 표본샘플수가 작을수록 오차가 날 확률이 크다. 인정하죠?
2. 님의 예시는 영남의 표본샘플이 두배 더 커요. 그렇죠?
그래서 한명이 고향을 숨기는 경우 (영남이 고향을 숨기는 경우가 없겠지만 있다고 가정하고) 호남인 한명이 숨기는 경우와 영남인 한명이 숨기는 경우의 오차는 각각 다르죠?
3. 그런데 서로 숨기는 경우가 있으면 샘플을 인구보정을 해야 합니다. 그런데 나는 고향을 숨기는 사람은 호남인 밖에 없다고 가정하여 인구보정 안하고 한겁니다. 왜? 과연 툴이 맞나 틀리나를 확인하기 위해서죠.
4. 그리고 호남->영남의 경우가 있는지 (나는 없다)
5. 영남->호남의 경우가 있는지 (나는 없다)
1.~2. 그리고 5.~6.까지 대답을 해보세요. 그리고 진행하죠.
2017.01.09 05:24:25
안티노님/
영남, 호남, 영호남 외 모두 취업률/미취업률이 동일한데 호남출신이면서 아니라고 하는 비율이 10%일 때 | |||||||
취업자 | 미취업자 | ||||||
영남 | 1000 | 700 | 300 | 70% | 30% | ||
호남 | 1000 | 700 | 300 | 70% | 30% | ||
영호남 외 | 5000 | 3500 | 1500 | 70% | 30% | ||
영남 | 900 | 630 | 270 | 70% | 30% | ||
호남 | 1600 | 1120 | 480 | 70% | 30% | ||
영호남 외 | 4500 | 3150 | 1350 | 70% | 30% | ||
호남만 취업률이 떨어지는데 아무도 출신을 숨기지 않음 | |||||||
영남 | 1000 | 700 | 300 | 70% | 30% | ||
호남 | 1000 | 600 | 400 | 60.00% | 40.00% | ||
영호남 외 | 5000 | 3500 | 1500 | 70% | 30% | ||
호남만 취업률이 떨어지는데 호남 외 출신이 호남출신임을 숨기는 비율이 10%일 때 | |||||||
영남 | 900 | 630 | 270 | 70% | 30% | ||
호남 | 1600 | 1020 | 580 | 63.75% | 36.25% | ||
영호남 외 | 4500 | 3150 | 1350 | 70% | 30% | ||
호남만 취업률이 떨어지는데 호남 외 출신이 호남출신임을 숨기는 비율이 50%일 때 | |||||||
영남 | 500 | 350 | 150 | 70% | 30% | ||
호남 | 4000 | 2700 | 2050 | 67.50% | 51.25% | ||
영호남 외 | 2500 | 1250 | 750 | 70% | 30% |
안티노님은 취업자수만 조정을 하셨는데 미취업자도 출신을 숨기는 사람이 있다고 가정하고 분모를 바꿔줘야 되지 않나요?
비호남취업자 중 호남출신이 있더라, 그럼 비호남 인구수 바꿔줘야 하고 비호남 취업자수도 바꿔줘야 하고, 비호남미취업자 중 호남출신이 있더라, 그럼 비호남 인구수 또 바꿔줘야 하고 비호남 미취업자수도 바꿔줘야 하잖아요. 출신을 숨기지 않았다고 가정하고 영남, 호남, 비영호남의 취업률, 미취업률이 다 똑같으면 호남출신이면서 아니라고 하는 사람의 비율이 크든 작든 결과값은 변하지 않아요. 취업자 중 호남출신임이 뽀록난(?)만큼 비취업자도 호남출신임이 뽀록(?)나서 매치나 엎어치나 같다는.
그런데 출신을 숨기지 않았다고 가정하고 취업률을 비교했는데 영남이나 비영호남은 대체로 높고 호남만 낮게 나오면 비록 취업한 영남, 비영호남 사람들 중 호남사람이 숨어있다고 할지라도 미취업한 영남, 비영호남 사람들 사이에도 호남사람이 숨어 있고 그리고 취업잠복자들이 미취업잠복자들보다 많아서 뭐 그리 드라마틱하게 호남인들의 취업률이 증가하고 그러지 않아요. 그리고 호남출신이면서 아니라고 100% 출신을 부정하면 전국과 영남취업률인 70%를 따라잡는데 이딴 사회에서 살아야하는 이유가?! 이거 말 되나요?
2017.01.09 21:43:23
다즐링님///
다즐링님의 질문에 대해서 답을 하기 위해 편의살 질문 단위로 답을 나눴습니다. 질문을 읽어본 결과, 한그루님과 저의 토론 전체를 읽어보신 것은 아닌 것 같습니다.
<<<
1. 안티노님은 취업자수만 조정을 하셨는데 미취업자도 출신을 숨기는 사람이 있다고 가정하고 분모를 바꿔줘야 되지 않나요?
>>>
우선, 저 위의 인구는 진짜 인구라는 의미는 아닙니다. 대략 해당지역(서울) 4년제 대학 전년도 혹은 직전 졸업자의 수로 보면 됩니다.
저 표상의 취업률 공식은 해당지역 취업자/인구입니다.
이제 질문 1에 답해 보겠습니다.
호남쪽을 보면 첫 번째와 두 번째에서 인구는 10명이 늘고 취업자는 7.14명이 늘었습니다. 인구가 10명인대, 취업자가 7.14명이 는 것은 취업률을 반영했기 때문입니다. 바꿔말하면, 2.86명의 미취업자가 늘었다는 것과 같습니다.
분모는 위에서 말한대로 1000명에서 1010명으로 바뀌었습니다. 정리하자면 취업자와 미취업자 모두 반영이 되었습니다.
단, 영남과 영호남제외 전국에서 10명을 뽑을 때해당 집단의 취업과 미취업 여부는 해당지역의 취업률을 기준으로 계산하였습니다.
<<<
2. 비호남취업자 중 호남출신이 있더라, 그럼 비호남 인구수 바꿔줘야 하고 비호남 취업자수도 바꿔줘야 하고, 비호남미취업자 중 호남출신이 있더라, 그럼 비호남 인구수 또 바꿔줘야 하고 비호남 미취업자수도 바꿔줘야 하잖아요.
>>>
비호남 취업자중 호남출신이 있기에 첫 번째와 두 번째 표에서 영남은 1000->998명 영호남 제외 전국은 5000->4992명으로 변경이 있었습니다.
기타 다른 수 역시 가정에 맞춰 모두 변경하여 주었습니다. 이는 항목항목으로 보시면 전체셀이 변한 것을 볼 수 있습니다.
<<<
3. 출신을 숨기지 않았다고 가정하고 영남, 호남, 비영호남의 취업률, 미취업률이 다 똑같으면 호남출신이면서 아니라고 하는 사람의 비율이 크든 작든 결과값은 변하지 않아요. 취업자 중 호남출신임이 뽀록난(?)만큼 비취업자도 호남출신임이 뽀록(?)나서 매치나 엎어치나 같다는.
>>>
하지만, 표에서는 다릅니다. 해당 숫자중에서 영호남 취업률은
http://weekly.donga.com/List/Series/3/990436/11/526558/1
이곳에서 제시된 취업률을 사용하였기에 모든지역의 취업률이 동일하다는 가정은 의미가 없습니다.
<<<
4.그런데 출신을 숨기지 않았다고 가정하고 취업률을 비교했는데 영남이나 비영호남은 대체로 높고 호남만 낮게 나오면 비록 취업한 영남, 비영호남 사람들 중 호남사람이 숨어있다고 할지라도 미취업한 영남, 비영호남 사람들 사이에도 호남사람이 숨어 있고 그리고 취업잠복자들이 미취업잠복자들보다 많아서 뭐 그리 드라마틱하게 호남인들의 취업률이 증가하고 그러지 않아요.
>>>
해당 논쟁은 영남패권론을 가정했을 때, 김교수의 주장을 강화하느냐? 아니냐에 대한 질문입니다.
위 기사에서 취업률은 주어진 값입니다. 통계에서 어떤 표본에서 랜덤하게 뽑는다고 했을 때, 그 값은 표본의 성격을 그대로 가지고 있다고 가정하는 것이 합리적입니다.
주사위를 예로 들어보죠. 3을 기준으로 높은수가 나올 수가 있고 낮은 수가 나올 수도 있습니다.
제가 만약에 4이하면 제가 다즐링님에게 1만원을 받고, 5이상이면 1만원을 주는 내기를 하자고 하면 그 내기가 공평할까요?
지금 님은 통계의 오차를 넘을 편이를 가정하고 편이값이 나오면 통계가 그리 변하지 않는다고 주장하시는 겁니다.
영남이 취업자가 높은 집단이면, 일정 수 이상을 뽑았을 때, 그 집단은 호남의 취업률보다 높다고 보는게 통계적으로 합당합니다.
<<<
5. 그리고 호남출신이면서 아니라고 100% 출신을 부정하면 전국과 영남취업률인 70%를 따라잡는데 이딴 사회에서 살아야하는 이유가?! 이거 말 되나요?
>>>
이건 뭐 가치판단이겠습니다만, 주머니에 빨간구슬, 파란구슬 100개씩을 넣고 다즐링님이 눈을 감고 주머니에서 구슬 100개를 뽑았을 때. 그 결과가 항상 빨간구슬 50개 파란구슬 50개가 되지는 않습니다. 그게 님이 빨간구슬이나 파란구슬을 차별하기 때문일까요?
다즐링님의 질문에 대해서 답을 하기 위해 편의살 질문 단위로 답을 나눴습니다. 질문을 읽어본 결과, 한그루님과 저의 토론 전체를 읽어보신 것은 아닌 것 같습니다.
<<<
1. 안티노님은 취업자수만 조정을 하셨는데 미취업자도 출신을 숨기는 사람이 있다고 가정하고 분모를 바꿔줘야 되지 않나요?
>>>
우선, 저 위의 인구는 진짜 인구라는 의미는 아닙니다. 대략 해당지역(서울) 4년제 대학 전년도 혹은 직전 졸업자의 수로 보면 됩니다.
저 표상의 취업률 공식은 해당지역 취업자/인구입니다.
이제 질문 1에 답해 보겠습니다.
호남쪽을 보면 첫 번째와 두 번째에서 인구는 10명이 늘고 취업자는 7.14명이 늘었습니다. 인구가 10명인대, 취업자가 7.14명이 는 것은 취업률을 반영했기 때문입니다. 바꿔말하면, 2.86명의 미취업자가 늘었다는 것과 같습니다.
분모는 위에서 말한대로 1000명에서 1010명으로 바뀌었습니다. 정리하자면 취업자와 미취업자 모두 반영이 되었습니다.
단, 영남과 영호남제외 전국에서 10명을 뽑을 때해당 집단의 취업과 미취업 여부는 해당지역의 취업률을 기준으로 계산하였습니다.
<<<
2. 비호남취업자 중 호남출신이 있더라, 그럼 비호남 인구수 바꿔줘야 하고 비호남 취업자수도 바꿔줘야 하고, 비호남미취업자 중 호남출신이 있더라, 그럼 비호남 인구수 또 바꿔줘야 하고 비호남 미취업자수도 바꿔줘야 하잖아요.
>>>
비호남 취업자중 호남출신이 있기에 첫 번째와 두 번째 표에서 영남은 1000->998명 영호남 제외 전국은 5000->4992명으로 변경이 있었습니다.
기타 다른 수 역시 가정에 맞춰 모두 변경하여 주었습니다. 이는 항목항목으로 보시면 전체셀이 변한 것을 볼 수 있습니다.
<<<
3. 출신을 숨기지 않았다고 가정하고 영남, 호남, 비영호남의 취업률, 미취업률이 다 똑같으면 호남출신이면서 아니라고 하는 사람의 비율이 크든 작든 결과값은 변하지 않아요. 취업자 중 호남출신임이 뽀록난(?)만큼 비취업자도 호남출신임이 뽀록(?)나서 매치나 엎어치나 같다는.
>>>
하지만, 표에서는 다릅니다. 해당 숫자중에서 영호남 취업률은
http://weekly.donga.com/List/Series/3/990436/11/526558/1
이곳에서 제시된 취업률을 사용하였기에 모든지역의 취업률이 동일하다는 가정은 의미가 없습니다.
<<<
4.그런데 출신을 숨기지 않았다고 가정하고 취업률을 비교했는데 영남이나 비영호남은 대체로 높고 호남만 낮게 나오면 비록 취업한 영남, 비영호남 사람들 중 호남사람이 숨어있다고 할지라도 미취업한 영남, 비영호남 사람들 사이에도 호남사람이 숨어 있고 그리고 취업잠복자들이 미취업잠복자들보다 많아서 뭐 그리 드라마틱하게 호남인들의 취업률이 증가하고 그러지 않아요.
>>>
해당 논쟁은 영남패권론을 가정했을 때, 김교수의 주장을 강화하느냐? 아니냐에 대한 질문입니다.
위 기사에서 취업률은 주어진 값입니다. 통계에서 어떤 표본에서 랜덤하게 뽑는다고 했을 때, 그 값은 표본의 성격을 그대로 가지고 있다고 가정하는 것이 합리적입니다.
주사위를 예로 들어보죠. 3을 기준으로 높은수가 나올 수가 있고 낮은 수가 나올 수도 있습니다.
제가 만약에 4이하면 제가 다즐링님에게 1만원을 받고, 5이상이면 1만원을 주는 내기를 하자고 하면 그 내기가 공평할까요?
지금 님은 통계의 오차를 넘을 편이를 가정하고 편이값이 나오면 통계가 그리 변하지 않는다고 주장하시는 겁니다.
영남이 취업자가 높은 집단이면, 일정 수 이상을 뽑았을 때, 그 집단은 호남의 취업률보다 높다고 보는게 통계적으로 합당합니다.
<<<
5. 그리고 호남출신이면서 아니라고 100% 출신을 부정하면 전국과 영남취업률인 70%를 따라잡는데 이딴 사회에서 살아야하는 이유가?! 이거 말 되나요?
>>>
이건 뭐 가치판단이겠습니다만, 주머니에 빨간구슬, 파란구슬 100개씩을 넣고 다즐링님이 눈을 감고 주머니에서 구슬 100개를 뽑았을 때. 그 결과가 항상 빨간구슬 50개 파란구슬 50개가 되지는 않습니다. 그게 님이 빨간구슬이나 파란구슬을 차별하기 때문일까요?
정치/사회게시판 최신댓글