IQ 는 만능인가

 

타고난 지능 만들어지는 지능 : Scientific American 편집, 이한음.표정훈 옮김, 궁리 출판사, 2001 (원서 : Exploring Intelligence, A Search in the Human, Animal, Machine and Extraterrestrial Domains, 1998), Page 37~53

Robert J. Sternberg 

 

미국의 전형적인 청소년은 고등학교에서 5,000 시간 이상을 보내며, 도서관이나 가정에서 역시 수천 시간을 공부하는데 보낸다. 대학에 진학하고자 하는 학생이라면, SAT 나 ACT (미국 대학 시험) 를 치르는 서너 시간 동안 그 운명이 판가름 난다. 대학에서 4 년을 보낸 뒤 그들은 4 년 전과 비슷한 상황에 처하게 될 것이다. 그들이 의과 대학원, 법과 대학원, 경영 대학원, 혹은 대학원에 진학하고자 한다면 말이다.

불과 몇 시간 안 걸리는 시험들이기는 하지만, 그 결과의 중요성은 매우 크다. 분명 시험이 도박은 아니지만, 큰 판돈이 걸린 도박판에 견주어볼 수 있을지도 모른다. 1994 년 저작 『벨커브』에서 리처드 헌스타인과 찰스 머레이는 이러한 시험 점수와 직업적 성취를 비롯한 다양한 성공 기준 사이에 상관 관계가 있음을 지적했다. 그들은 미국 사회가 뛰어난 지적 능력을 지니고 평판이 높은 고소득 직종에 종사하는 사람들로 이루어진 '인지적 엘리트층' 과, 낮은 지적 능력을 지니고 낮은 수입의 직종에 종사하는 대다수 사람들로 점점 더 극명하게 분화되고 있다고 주장했다. 그들은 이러한 현상을 자연의 보이지 않는 손이 작용하고 있다고 설명했다.

그러나 그들이 말하는 손은 보이지 않는 것도, 자연적인 것도 아니다. 우리는 이런 저런 중요한 시험이나 검사에서 우수한 성적을 올린 사람들이 좋은 학교에 입학하고, 더 나아가 성공 가도를 달리는 것을 당연하다고 생각해왔다. 물론 시험 성적 이외에도 태어난 집안, 소속 정당, 종교적 성향 등 여러 다른 기준들도 어느 정도 영향력을 발휘하기는 한다.

사실 한 사회는 나름대로 그러한 기준을 설정, 운용할 수 있다. 예컨대 시험 성적이 아닌 키가 기준이 되는 사회라면, 중요한 직위나 좋은 직업에는 키 큰 사람들만 종사할 수 있을지도 모른다. 어떤 의미에서는 어처구니없는 일이기도 하지만, 실제로 미국을 비롯한 여러 사회의 사람들은 '비공식적', 암묵적으로나마 사람의 키를 중요한 평가 기준으로 인식하고 있다. 여하튼 미국을 비롯한 많은 나라들은 능력 평가 시험을 성공으로 들어가는 관문을 여닫는 기준으로 삼고 있다. 왜 그럴까? 이러한 시험은 그 목적에 합당한 수단일까?

검사의 역사

찰스 다윈의 사촌인 프랜시스 골튼은 지능을 측정하려는 최초의 과학적 시도를 한 사람이다. 1884 년 1890 년 사이에 골튼은 런던 소재 사우스켄싱턴 박물관에서 당시로서는 매우 이채로운 서비스를 시행했다. 사람들은 그곳에서 약간의 돈을 내고 자신의 지능을 검사할 수 있었던 것이다.

그러나 단 한 가지 결정적인 문제는 골튼이 마련한 검사 내용이 잘못 선택된 것이었다는 점이다. 예컨대 어떤 사람에게 신호음을 들려주고 그 사람이 들을 수 있는 가장 높은 음을 검사한다든가 하는 식이었다. 또 다른 검사는 여러 개의 탄약통에 각각 탄환, 양모, 솜뭉치 등을 넣어놓고 사람들로 하여금 그 탄약통들을 들어보게 한 뒤, 무거운 것과 가벼운 것을 구별하게 하는 것이었다. 그 밖에 장미 냄새를 얼마나 잘 맡는지 알아보는 검사도 있었다.

컬럼비아 대학의 심리학자 제임스 매킨 카텔은 골튼의 검사에서 깊은 인상을 받고, 1890 년에 미국에서 갈튼의 경우와 비슷한 일련의 검사를 고안해냈다. 청출어람이라고 했던가? 카텔의 제자 클라크 위슬러는 카텔의 지능 검사 점수가 실제로 어떤 의미가 있는 것인지 검토해보기로 했다. 위슬러는 특히 일련의 검사들간의 상관 관계는 물론, 검사 점수와 대학 성적과의 상관 관계를 검토했다. 결과는 부정적이었다. 학교에서의 학업 성취도 예측하지 못하고 심지어 일련의 검사들간의 상관 관계마저 없다면, 그 검사가 도대체 무슨 소용이란 말인가? 결국 위슬러의 검토 이후 골튼과 카텔의 검사에 대한 관심은 잦아들고 말았다.

한편 프랑스의 알프레드 비네는 출발부터 앞의 두 사람보다 한결 나았다. 학교에서의 학업 성취를 예측할 수 있는 수단을 찾아달라는 정부 당국의 요청에 응해, 그는 검사 항목을 궁리했다. 그는 동료인 시어도어 시몽과 함께 지능 검사를 고안하여 1905 년에 발표했다. 그 검사는 예컨대 어휘력 검사 문제로 'misanthrophe (사람을 싫어하는 혹은 사람과의 교제를 싫어하는 사람) 의 의미는 무엇인가?', 이해력 검사 문제로 '사람들은 왜 돈을 빌리곤 하는가?', 언어 연관력 검사 문제로 '오렌지, 사과, 배의 공통점은 무엇인가?' 등이 있었다.

비네의 검사는 학업 성취의 예측에서 성공적이었다. 오늘날에는 비네 검사의 개정판이라 할 수 있는 스탠퍼드-비네 지능 검사가 사용되고 있다 (스탠퍼드 대학으 루이스 터먼이 비네 검사를 미국에 도입, 확산시켰기 때문에 스탠퍼드라는 말이 붙었다). 그 밖에도 웩슬러의 지능 검사 역시 스탠퍼드-비네 검사와 비슷한 정신 능력을 검사한다.

비네의 임무가 학교에서의 학업 성취를 예측하는 데 있었다는 점을 각별히 염두에 둘 필요가 있다. 사실 1905 년 당시에는 아동의 초등학교 입학 여부를 결정하기 위한 검사였으며, 특히 정신 지체아를 식별해내는 것에 주안점을 두고 있었다. 구체적으로 말하면  행동에 다소 문제가 있지만 사고는 지극히 정상인 아동과, 정말로 정신 발달이 지체되어 있는 아동을 구별해내기 위한 것이었다. 이후 몇 차례에 걸쳐 문항 숫자도 늘리고 성인을 대상으로 하는 검사도 고안해내기에 이르렀던 것이다. 여하튼 출발 자체가 일종의 수학 능력 내지는 학업 성취를 예측하기 위한 것이었기 때문에, 이후로도 이 검사는 그러한 방향으로 발전하게 되었다.

제 1 차 세계 대전 기간에 지능 검사는 본격화되기 시작했다. 심리학자들은 병사들을 선발하기 위한 방법을 개발할 것을 요청받았다. 그 결과 육군 알파 검사 (언어 능력 검사), 육군 베타 검사 (동작 능력 검사) 등이 개인이 아닌 집단 단위로 시행되었다 (오늘날 심리학자들은 개인 혹은 집단 가운데 검사 단위를 택할 수 있다. 물론 개인 단위의 검사 결과가 신뢰성이 더 높다). 1926 년에는 오늘날의 SAT 의 전신이라고 할 수 있는 새로운 검사가 도입되었다. 프린스턴 대학의 칼 브링엄이 고안한 그 검사의 결과는 언어 및 수학 분야의 점수로 나타난다.

그 이후부터 IQ 검사, 진학 적성 검사 (scholastic aptitude) 를 비롯한 다양한 검사 혹은 시험이 속속 개발되어, 오늘날에 이르기까지 다소의 변화를 겪으면서 학업 성취나 정신 능력을 검사하는 데 사용되어왔다. 그 명칭도 다양하고 구체적인 검사 내용에도 차이가 있지만, 이러한 모든 검사의 점수들은 서로 높은 상관 관계를 보여주곤 한다. 따라서 나는 이하에서 그러한 검사들을 일반적인 지능 검사라는 말로 일컫고자 한다.

지능 검사가 예측할 수 있는 것

일반적인 지능 검사는 학교 성적과 보통 0.4 에서 0.6 정도의 (0부터 1 사이에서) 상관 관계를 지닌다. 그 정도라면 통계학적으로 의미 있는 수치이다. 그러나 0.5 의 상관 관계를 가지고 과업 수행을 예측하는 검사라면, 다양한 변수 가운데 25 퍼센트 정도를 설명할 수 있을 뿐이다. 나머지 75 퍼센트의 변수는 설명할 길이 없다 (통계학에서 변수는 상관 관계의 제곱에 해당한다. 이 경우에는 0.5 의 제곱, 즉 0.25 가 된다). 결국 학교에서 수행하는 과업에는 일반적인 IQ 검사의 범위를 넘어서는 것들이 많다는 뜻이 된다.

직무 수행, 급료, 직업의 유무 등과 같은 훗날의 성취 과업들을 예측하는 데 일반적인 지능 검사를 활용하게 되면 예측력의 타당성이 현저하게 떨어진다. 일반적으로 0.3 을 조금 넘는 정도의 상관 관계를 지니는데, 이 정도의 수치라면 과업 수행의 다양한 변수 가운데 10 퍼센트 정도만 설명할 수 있다. 더구나 시험 모집단, 검사 상황, 과업 내용 등이 변하게 되면 IQ 검사의 예측력은 무색해진다. 워싱턴 대학의 프레드 휘들러에 따르면, 검사 대상자들의 스트레스가 낮은 상태에서 검사를 시행하면 IQ 는 리더십 성공을 긍정적으로 예측해준다. 그러나 높은 스트레스 상태에서 검사를 시행하면 부정적으로 예측해준다. 요컨대 QI 와 리더십 성공의 상관 관계가 검사 상황에 따라서 정반대 방향으로 나타나는 것이다. 스탠퍼드-비네 검사를 비롯한 여러 지능 검사들은 여러 차례의 검사에서 같은 사람이 다른 점수, 그것도 차이가 제법 큰 다른 점수를 기록하곤 한다. 그렇다면 에측력을 향상시킬 수는 없을까?

미국을 비롯하여 전세계적으로 컴퓨터나 정보 통신 기술은 비약적으로 발전하고 있지만, 지능 검사만은 사실상 답보상태라는 사실에 대해서 나는 매우 이상하게 여기지 않을 수 없다. 지능 검사의 내용은 20 세기 초에 비해서 그다지 많이 바뀌지 않았다. 미국의 산업 심리학자 에드윈 기셀리는 1966 년에 쓴 논문에서, 지난 40 년 동안 지능 검사의 예측력이 거의 향상되지 못했다고 개탄한 바 있다. 그런데 기셀리 이후 30 년 이상이 지난 지금도 사정은 별로 다르지 않다.

예측력을 높인다

각별히 노력한다는 전제 위에서, 우리는 예측력을 높일 수 있다. 피츠버그 대학의 마이클 훼라리, 위스콘신 대학의 파멜라 클린켄비어드, 예일 대학의 엘레나 그리고렌코 등과 내가 함께 연구한 바에 따르면, 일반적인 기억력과 분석적 능력뿐만 아니라 창조적, 실천적 사고 능력 측정 검사가, 심리학 개론 과목을 이수하고 있는 고등학생들의 그 과목 점수에 대한 예측력을 높여준다는 것을 발견했다 (이 검사와 일반적인 지능 검사를 직접적으로 비교하기는 곤란하다. 이 검사에 참여한 학생들이 제한되어 있기 때문이다. 그들은 학교 측에서 선발한 우수한 학생들이었다).

그 검사에서 학생들은 보통의 수학 교재와는 다른 새로운 방식으로 정의된 연산자들을 가지고 수학 문제를 풀거나, 지도상에서 목표 지점에 도달하기 위한 효율적인 경로를 찾거나, 일상 생활에서 겪을 수 있는 실천적인 문제를 해결해야 하는 과제를 요구받았다. 여기에 그 한 예가 있다.

  다음 질문에서는 어느 고등학교 학생이 처해 있는 상황이 제시됩니다. 지문을 주의 깊게 읽으십시오. 그리고 주어진 특정 상황 속에서 바람직한 결과를 낳을 수 있는 최선의 해결책을 선택하십시요.

  고등학교 2 학년인 존의 가족은 애리조나에서 아이오와로 이사했다. 존은 새로 이사한 지역의 고등학교로 전학한 지 두 달이 지났지만, 아직까지 친구를 사귀지 못해 외로워하며, 학교 생활이 재미없다고 느낀다. 그런 존이 가장 좋아하는 활동은 글을 쓰는 것, 특히 줄거리가 있는 이야기를 글로 쓰는 것이다. 현재 존이 처한 상황에서 가장 좋은 대처 방안은 무엇일까?

    1) 학교 신문 편집부에 자원한다.

    2) 교지에 실릴 글을 쓰면서, 집에서 더욱 많은 시간을 보낸다.

    3) 애리조나로 다시 돌아가자고 부모를 설득한다.

    4) 성탄절 방학 기간에 애리조나에서 친하게 지내던 친구를 집으로 초대하여 함께 지낸다.

가장 유망한 해결책은 1) 이다. 창조성도 비슷한 방식으로 측정할 수 있다. 현재 파리 제 5 대학에 재직중인 토드 루바르와 나는, 검사 대상이 된 사람들에게 몇 가지 창조적인 과업을 수행할 것을 요구했다. 예컨대 '문어의 고무창 운동화', '3853' 등과 같은 아무 의미도 없고 조금은 이상 야릇해 보일 수도 있는 제목을 제시하고, 짧은 이야기를 지어 써보라고 했다. 그리고 곤충의 관점에서 바라본 지구, 시간의 끝 등과 같은 주제를 그림으로 표현해보라고 했다. 그뿐이 아니었다. 나비 넥타이, 문 손잡이, 그 밖의 여러 일상 용품을 선전하기 위한 광고 문안을 작성해보라고 했다. 그리고 발각되지 않으려고 애쓰고 있는, 인간과 비슷한 외모를 지닌 외계인을 색출해내는 방법을 생각해보라고 했다. 마지막 과제는 일종의 유사 과학적 문제를 해결하는 과제라고 할 수 있다.

검사 결과를 검토해보니, 창조적 지능은 어느 한 분야에 특화되어 있는 경우가 많았다. 즉 어느 한 영역에서 창조적인 사람이 반드시 다른 영역들에서도 창조적이지는 않았다. 그리고 일반적인 IQ 검사 점수와 창조적 과업 수행 능력이 정비례하지는 않았다. 다만 느슨한 상관 관계를 보여주었을 뿐이다.

이러한 결과는 학습 과업에서도 의미를 지닌다. 각자 자신의 특기에 해당하는 능력을 집중적으로 극대화시키도록 가르친 학생들의 성취는, 일반적이고 전통적인 방식으로 가르친 학생들에 비해서 월등했다. 여기서 말하는 일반적이고 전통적인 방식이란 암기를 강조하는 것을 뜻한다. 내가 호프스트라 대학의 브루스 토프, 예일 대학의 그리고렌코와 함께 연구한 바에 따르면, 주어진 학습 자료를 놓고 분석적, 창조적, 실천적으로 생각하도록 가르친 학생들의 학업 성취는 전체적, 평균적으로 향상된다. 심지어 암기 능력만을 검사해도 다른 집단 학생들에 비해서 평균적으로 높은 점수를 획득했다.

무척 흥미로운 사실 하나가 있다. 일반적으로 중시되는 암기와 분석적 능력에서 높은 점수를 보이는 사람들은 주로 백인 중산층 혹은 중상층이었으며, 상대적으로 좋은 학교 학생들이었다. 그리고 창조적, 실천적 능력에서 높은 점수를 보이는 사람들은 인종적, 사회 경제적, 교육적 측면에서 더욱 다양했다. 요컨대 집단간 차이가 그다지 두드러지지 않았다. 결국 일반적인 지능 검사 점수 - 백인 학생들이 평균적으로 높은 - 에서 나타나는 집단간 차이는, 지능 검사 자체가 여러 능력 가운데 일부 능력을 검사하는 데 한정되어 있다는 것을 보여준다.

직무 수행 예측도를 높이는 검사도 고안할 수 있다. 플로리다 주립대의 리처드 와그너와 나는 근로 현장에서의 실천적 지능을 검사한 결과가 IQ 검사 못지 않게 혹은 그보다 더 직무 수행을 예측하는 데 효과적임을 발견했다. 실천적 지능 검사 결과는 일반적인 IQ 검사 결과와는 상관 관계가 거의 없었다. 예컨대 기업의 관리자들에게 이후 3 주에 걸쳐 처리해야 할 많은 업무들이 있지만, 그것을 모두 다 처리할 시간은 없다는 상황을 제시한다. 그리고 어떤 일을 우선적으로 처리해야 할 것인지 순위를 정하도록 한다.

우리는 이와 비슷한 검사를 세일즈 업무 종사자, 학생, 최근에는 장교들을 대상으로 (웨스트 포인트 사관 학교의 심리 학자들과 공동으로) 시행한 바 있다. 물론 그런 검사들이 일반적인 지능 검사를 대체할 수는 없고, 그것을 보완하는 역할을 할 수 있다. 지능 검사 역시 어느 정도까지는 직무 수행을 예측하도록 고안되어 있기도 하다.

자연 약초로 지능 검사하기

문화적 요인 역시 일반적인 지능 검사 점수에 무시할 수 없는 영향을 미친다. 그리고렌코와 나는 옥스퍼드 대학의 케이트 녹스와 루스 프린스, 코펜하겐의 덴마크 주혈흡충병 연구소의 웬젤 게이슬러, 나이로비의 케냐타 대학의 프레드릭 오카차, 케임브리지 대학의 돈 번디 등과 함께 케냐 농촌 어린이들을 대상으로 케냐 고유의 지역성에 적합한 지능 검사를 고안, 시행했다.

그 검사에서 우리는 어린이들에게 그 지역 고유의 풍토와 습속에 바탕을 둔 과업을 수행하도록 요구했다. 예컨대 우리는 자연 약초를 활용하는 방법을 제대로 아는지 여부와 같은 것을 검사했다. 검사 대상이 된 마을 어린이들은 그런 약초를 많이 알고 있었고, 실제로 최소한 매주 한 번 정도씩은 약초를 가지고 스스로를 치료하고 있었다. 물론 서구 어린이들은 듣지도 보지도 못한 약초들이다. 우리는 같은 어린이들을 대상으로 일반적인 IQ 검사도 시행했다.

서구식 지능 검사의 언어 부문 점수와 지역성에 적합한 검사 사이의 상관 관계는 매우 긴밀했다. 그러나 그 관계는 일종의 반비례 관계였다. 바꾸어 말하면 지역성에 적합한 지능 검사 점수가 높은 어린아이일수록 서구식 일반적인 IQ 검사 점수가 낮았고, 그 반대의 경우도 분명히 나타났다. 그런 결과가 나온 까닭은 부모들이 전통적인 교육과 서구식 교육을 동시에 중시하기보다는, 어느 한 쪽에 주안점을 두고 있기 때문이다. 그러한 부모의 태도가 자녀들에게 지대한 영향을 미친 것은 두말할 필요도 없다.

서로 다른 문화권 출신의 사람들은 검사 문항 자체를 다르게 해석할 가능성이 높다. 현재는 캘리포니아 대학 (샌디에이고) 에 재직중인 마이클 콜과 동료 연구자들은, 1971 년에 서부 아프리카의 크펠레 부족을 연구했다. 크펠레 사람들은 분류하는 문제에 대한 대답에서 서구인들과는 완전히 달랐다. 그들이 올바른 대답이라고 생각한 것들은 서구인의 입장에서 보면 정말 어처구니없는 대답이었던 것이다. 예컨대 주어진 여러 대상을 과일과 채소 등의 범주로 분류하는 문제에서 크펠레 사람들은 철저하게 기능적인 분류 방식을 보여준다. 서구인들은 사과와 오렌지를 과일 항목으로 분류하지만, 크펠레 사람들은 사과를 단순히 '먹는다' 와 관련 지을 뿐이다.

서구인들이 학교에서 배운 분류 방식에 따르는데 비해, 크펠레 사람들은 일상 생활 속에서 익숙해져 있는 방식을 따른다고 할 수 있다. 기초적이라도 식물 분류학에 따른 분류 항목을 접해보지 않았다면, 사과를 과일이니 하는 범주로 분류하기보다는 그냥 먹는 것으로 분류하는 편이 훨씬 더 자연스럽다.

서구에서 시행되는 일반적인 지능 검사는 현재 전세계적으로 번역, 유포되어 시행되고 있다. 번역된 서구식 지능 검사 문항으로 다른 문화권 사람들이 지능을 검사하는 것이 과연 의미가 있을까? 심각하게 질문을 던지지 않을 수 없다.

보다 나은 검사를 위하여

보다 나은 검사를 위해서는 기존 검사에 대한 우리의 태도를 새삼스럽게 살펴보지 않을 수 없다. 다음과 같은 몇 가지 요소들이 우리들로 하여금 기존의 일반적인 검사 점수에 무게를 두도록 만들고 있다.

    1) 정확성의 신화 : 분명하게 수치화되어 있는 검사 점수는, 사람들로 하여금 점수에 대해 부여해야 할 적합한 신뢰를 넘어서는 강한 신뢰를 부여하게 만들고 있다.

    2) 유사성 요인 : 사람들은 자신과 비슷한 사람에게 더 이끌리는 것이 보통이다. 이러한 원리는 개인적인 인간 관계에서 뿐만 아니라, 직장 혹은 직무 관계에서도 마찬가지이다. 유력한 지위에 있는 사람들은 자신과 비슷한 사람들을 찾는다. 그들은 자신의 현재 위치에 도달하기 위해 높은 점수를 필요로 했던 사람들이다. 이에 따라 그들은 자신들과 마찬가지로 높은 점수를 기록한 사람들을 찾는 경향이 있다.

    3) 출판 및 공표 요인 : 기관들에 점수를 부여하여 순위를 설정하는 것, 예컨대 <유에스 뉴스 앤드 월드 리포트 US News and World Report> 가 해마다 펴내는 대학 평가 순위 같은 것은, 정상에 근접해 있는 대학들간의 강도 높은 경쟁을 유발시킨다. 대학들로서는 순위 산정의 기준이 될 만한 모든 요소들을 통제하기 힘들다. 그런데 시험 혹은 검사 점수 같은 기준은 대학 교원들의 학술 출판물 같은 기준에 비해서 통제하기가 쉽다. 대학들은 결국 순위를 높이기 위해 시험 점수에 각별한 신경을 쓰게 된다. 미국은 각 주 단위로 시행되는 학력 시험 결과를 공표하기 때문에, 공립 학교들로서는 그 시험에 대비하는 수업 과정을 강화해야 한다는 무언의 압력에 직면하게 마련이다.

    4) 확신이 함정 : 일단 검사의 타당성을 신뢰하게 되면 사람들은 자신의 신념을 확증해주는 상황을 설정하려는 경향이 있다. 예컨대 대학의 입학 사정 담당자가 특정 점수 이하의 학생들은 자기 대학에서 제대로 수학할 능력이 없다고 확신하게 되면, 그 사람은 그 점수 이하의 학생들은 선발하지 않으려 할 것이다. 그 결과 그 대학은 해당 점수 이하의 학생들 가운데 성공적으로 대학 과정을 이수할 수 있는 능력을 갖춘 학생들을 선발할 수 없게 된다.

일반적인 지능 검사의 단점에 각별히 주목한 나머지, 표준화된 지능 검사를 전면적으로 무시하는 사람들도 있다. 나는 이런 태도가 바람직하지 못하다고 생각한다. 표준화된 검사 점수를 무시하면, 덜 중요하거나 아예 별 의미가 없는 요인들에 지나친 비중을 두게 될 위험이 있다. 이것은 정치적 견해에 대한 여론 조사든, 사회 경제적 지위에 대한 조사 통계든, 심지어 시력 검사든 마찬가지라고 할 수 있다. 특정 조사 통계 혹은 검사가 어차피 모든 요인을 충분히 감안하기 힘들다면, 표준화된 수치를 우선적으로  중요시하지 않을 수 없다.

어떤 사람들은 구체적인 과업 수행에 바탕을 둔 측정만을 선호하기도 한다. 예컨대 어린이들로 하여금 과학 실험을 수행하게 하고 그 과정과 결과를 측정하는 것 따위이다. 그런 측정 방법은 일반적인 지능 검사에 비해서 분명히 매력적이기는 하다. 그러나 문제점도 분명하다. 우선 문화적 편향성의 측면에서 일반적인 검사보다 나을 것이 별로 없다. 더구나 통계학적 신뢰성과 타당도에 심각한 문제가 있기 십상이다.

결국 일반적인 검사 방법을 계속 사용하되, 이미 개발되어 있거나 개발중인 좀더 나은 혁신적인 검사 방식으로 보완하는 것이 바람직하다. 기술이 중요한 비중을 차지하는 대부분의 기업과는 달리, 검사 업체들은 기본적인 조사 연구에 별로 투자하지 않거나 아예 관심을 두지 않기까지 하며, 때로는 다분히 이기적인 모습을 보여준다. 소수의 기업들이 능력 검사 업계를 사실상 독점하고 있는 현실과 검사의 중요성을 감안하면, 검사 업체들이 접근 방식을 개선하도록 직접적이든 간접적이든 요구할 필요가 있다. 각종 검사가 지니는 공공성을 감안하면, 공적 부문에서 관련 연구를 지원할 수도 있을 것이다.

컴퓨터를 이용한 검사처럼 검사 수단만이 혁신의 대상은 아니다. 오히려 검사의 구체적인 내용이야말로 혁신의 주요 대상이 되어야 한다. 자동차 도로에서 이륜 마차를 끌고 다녀서는 곤란하지 않겠는가? 다행히도 혁신을 위한 가장 강력한 수단은 의외로 우리 가까이에 있다. 다름아니라 혁신하려는 우리의 의지이다.

출처: http://www.aistudy.co.kr/cognitive/IQ_Sternberg.htm

profile