요즘 '고립어, 교착어, 굴절어'라는 식으로 언어를 분류하는 경우를 많이 보게 됩니다. 당장 다음 기사만 봐도 상식 수준으로 사용하고 있네요.

“나랏말싸미 '미쿡'에 달아”

세상이 좋아진 건지 어떤지는 모르겠는데, 아마 제가 이 분류를 중학생 때였던가 고등학생 때였던가 국어 시간에 처음 접했던 걸로 기억합니다. 그때는 꽤 전문적인 분류라고 생각하며 신기해하면서 받아들였죠. 근데 사실 이 분류가 전문적이고 아카데믹한 분류냐, 하면 그렇지도 않습니다. 그 기준이 꽤 모호하거든요.

국립국어원 홈페이지에서 제공하는 '표준국어대사전' 서비스로 이 용어들의 의미를 찾아 봐도, 이것만으로는 무엇이 고립어이고 교착어이며 굴절어인지 알기 어렵습니다. '고립어'는 '접사나 어형 변화가 없고, 실현 위치에 따라 문법관계가 정해지는 언어'이며, '교착어'는 '실질적인 의미를 가지는 단어 또는 어간에 문법적인 기능을 가진 요소가 차례로 결합함으로써 문법관계를 나타내는 언어'이고, '굴절어'는 '어형과 어미의 변화로써 문법관계를 나타내는 언어'라고 하는데, 만약 익숙하지 않은 언어를 하나 주고 이것이 어느 유형에 속하는지 골라 보라고 한다면, 제대로 이 분류를 적용시킬 수 있을까요?

이 분류가 명확하지 않음은 언어학자들 사이에서도 이미 오래 전부터 인지되고 있었습니다. 최근에는 이 유형을 좀 더 세분해서 프라하 학파 쪽에서 다루었던 내부재귀어 등의 유형을 추가하기도 하고, 아랍어 등의 셈족 언어 특성을 반영해서 형판어라는 유형을 추가하기도 하며, 포합어와 종합어라는 유형을 추가하기도 합니다. 그래도 여전히 기준이 모호하다는 것은 변함이 없습니다.

애초에 이 분류를 처음 제시한 사람은 19세기의 슐레겔(Schlegel) 형제였습니다. 용어가 좀 다르긴 해도(접사형, 굴절형, 무변형 - L. J. Whaley, Introduction to Typology 2장에서 인용) 3분법의 원형을 제시한 데 공로가 있죠. 다만 이 분류는 언어진화론자인 슐라이허(Schleicher) 등의 해석에 의해 언어의 진화 유형을 '고립어 → 교착어 → 굴절어'의 직선 도식으로 파악하게 해 주어서, '고로 굴절어인 우리 유럽 언어가 언어 진화의 최종 형태라능' 식의 논리를 제시했다는 문제가 있었습니다. 이 문제는 나중에 사피어(Sapir)가 저 도식에 '굴절어 → 고립어'의 방향을 추가해 순환 도식으로 바꾸고, 언어의 시계열 변화를 통계적으로 다루는 방법론들이 하나둘씩 생겨나면서 해결됩니다.(*)

하지만 이런 오해가 사라지고 나서도, 이 분류법 자체에 대해 연구자들이 품은 의심은 사라지지 않았습니다. 좀 더 실증적인 측면에서, 도대체 이걸 어떻게 써 먹을지 명료하게 계획을 짜기가 곤란했던 것입니다. 게르만어 중에서도 현대 독일어나 고 노르드어, 아이슬란드어, 페로어 등은 명백히 굴절어라고 할 수 있겠지만, 굴절형이 많이 사라진 현대 영어, 북게르만어 대언어들(스웨덴어, 노르웨이어, 덴마크어), 네덜란드어, 아프리칸스어 등은 고립어라고 볼 수 있지 않은가? 아니면 네덜란드어 정도는 굴절어로 봐야 할까? ― 이런 당혹스러운 문제들 때문에, 20세기 초의 프랑스 언어학자 앙투안 메이예(Antoine Meillet)는 "이것은 너무 유명한 분류(trop fameuse classification)"라고 이 도식을 비꼬기도 했습니다.(**)

이런 상황은 1960년대에 미국의 언어학자 그린버그(Greenberg)가 형태유형론에 통계적 기법을 대대적으로 도입하면서 반전되게 됩니다. 그린버그는 현대 미국 언어유형론의 선구자 격으로 대접받는 사람인데요, 이 사람은 사실 통계적 기법 도입보다는 1966년 논문에서 언어 간 비교 연구를 통해 45개의 '언어 보편성' 테제를 제시한 것으로 유명하죠.(***) 하여튼 그린버그는 고립어, 교착어, 굴절어라는 식의 주먹구구식 분류를 통계적으로 세련되게 개선하기 위해 두 개의 지표를 제시했습니다.(물론 이 외에 다른 유형론 지표도 많이 제시했고요) 바로 이 두 개의 지표가 오늘날 '통합성 지표(index of synthesis)'와 '융합성 지표(index of fusion)'라 부르는 것입니다.

간단히 말해서 통합성 지표는 '어떤 언어에서 얼마나 많은 의미요소가 한 단어 안에 들어 있는지'를 말해 주는 지표이고, 융합성 지표는 '어떤 언어에서 한 단어가 변이할 때 첨가되는 구조가 얼마나 분리 가능한지'를 말해 주는 지표입니다. 오늘날 이 지표를 계산하는 방법은 그린버그식 외에도 다양합니다. 수많은 연구자들이 그린버그식의 문제점을 개선시킨 여러 방식의 계산법을 발전시켰기 때문이죠. 하지만 그 개념만은 그린버그식에서 크게 벗어나지 않습니다. 여기서는 다른 방식은 제끼고, 60년대에 그린버그가 처음 제시한 지표 계산법만을 짤막하게 설명하겠습니다.(다른 방식을 보고 싶으시다면 Comrie 등의 유형론 책을 참조하세요)

- 통합성 지표(IS) := M / V
(M은 형태소의 수, V는 표본 낱말의 수)
- 융합성 지표(IF) := A / J
(A는 첨가구조의 수, J는 접합의 수)

위에서 통합성 지표는 이해하기에 그리 어려움이 없어 보이지만, 융합성 지표에 대해서는 추가 설명이 좀 필요할 것 같습니다. 어떤 단어가 주어졌을 때, 접합이란 대략 말해서 형태소 간 경계로 이해하면 크게 무리가 없습니다. 그러니까, '죽었다'라는 단어는 '죽-/-었(았)-/-다'의 세 개 형태소로 분리할 수 있으므로 이 단어에서 J = 2가 되죠.

여기서 단어를 어떤 형태든 좋으니 다른 형태로 변화시킬 때, 위의 두 접합 위에서 주어진 두 쌍의 구조가 변화하는지를 생각해 보겠습니다. '죽었습니다' 형태에서 '죽-/-었-/-습니다'가 되므로 '죽-/-었(았)-' 쌍은 변화하지 않지요? 마찬가지로 '먹었다' 형태에서 '-었(았)-/-다' 쌍 역시 변화하지 않습니다. 이렇게 접합 좌우에서 함께 '불변이거나 혼자서만 변화하는 쌍'을 '첨가구조'라고 정의하는데, 이 경우 A = 2가 되는군요. 따라서 '죽었다'라는 단어를 놓고 생각해볼 때 IF = 1입니다.(실제 계산에서는 단어를 대량으로 가져와서 모든 접합에 대해 계산해야 하죠. 아, 그리고 첨가구조는 '의미소'에 대해 정의된 것이므로, 문법적으로 항상 융합된 것이 아니라면 두 개 이상의 의미소가 섞인 형태소를 가질 수 없습니다.)

이 두 지표를 사용하면, 다음과 같이 고립어, 교착어, 굴절어를 깔끔하게 연속적인 이차원 공간 위에서 분석할 수 있게 됩니다!
- 정의에 따라 IS ≥ 1. 어떤 두 언어 L1과 L2의 IS를 비교할 때, IS(L1) < IS(L2), iff,  'L1은 L2보다 고립적이고, L2는 L1보다 통합적이다.'
- 정의에 따라 0 ≤ IF ≤ 1. 어떤 두 언어 L1과 L2의 IF를 비교할 때, IF(L1) < IF(L2), iff,  'L1은 L2보다 융합적이고, L2는 L1보다 교착적이다.'

실제로, 적당한 표본을 가지고 계산한 예를 들어 보겠습니다.(****) 이 값들은 그린버그가 위 정의를 가지고 직접 계산한 값이라고 합니다.

IF(스와힐리어) = 0.67, IF(고대 영어) = 0.11, IF(야쿠트어) = 0.51, IF(산스크리트) = 0.09
IF(페르시아어) = 0.34, IF(이누이트어) = 0.03, IF(현대 영어) = 0.30, IF(베트남어) = 0.00
(베트남어가 0인 이유는, 변형이 아예 불가능하므로 이 경우 0을 할당받기 때문입니다.)

IS(스와힐리어) = 2.55, IS(고대 영어) = 2.12, IS(야쿠트어) = 2.17, IS(산스크리트) = 2.59
IS(페르시아어) = 1.52, IS(이누이트어) = 3.72, IS(현대 영어) = 1.68, IS(베트남어) = 1.06
(*****)

보통, IS가 1과 2 사이이면 '전형적 고립어 유형', 3 이상이면 '전형적 포합어 유형'이라고 할 수 있습니다. IF에 대해서도 비슷한 기준이 적용될 수 있는데, 대략 0.6 이상이면 '전형적 교착어 유형', 0.3 이하이면 '전형적 굴절어 유형' 쯤 되겠지요. 뭐 이런 건 제가 임의로 붙인 명칭이니 크게 신경쓰실 필요는 없습니다.


* 요즘 언어학자들은 진화적으로 모든 인간 언어가 적어도 생물학적으로는 동일한 종류의 언어 능력을 반영하는 것이라 보고 있습니다. 그렇지 않고 어떤 언어가 다른 언어보다 생물학적으로 더 복잡하거나 덜 복잡한 정신 능력의 산물이라면, 언어 간 비교나 범언어적 보편 논리를 구축하는 기획들의 기초가 의심받게 되기 때문이죠. 단적으로 말해, 내재적으로 더 우월하거나 열등한 언어는 없다는 것입니다.

** J. C. Wells, 『에스페란토의 언어학적 연구』, 한신문화사, 1990, 66쪽. 제가 알기로 이 글에서 다루는 통계적 형태유형론에 대해 쓰여 있는 한국어 책은 지금 구할 수도 없는 이 책 뿐입니다. 거기다 중점적으로 유형론적 탐구를 하는 것도 아니고 곁다리 식이죠. -_-;;

*** 예컨대 명제 몇 개를 들어 보면 이렇습니다.

- 전치사 유형 언어에서 속격은 거의 언제나 지배 명사에 후치하고, 후치사 유형 언어에서 속격은 거의 언제나 지배 명사에 전치한다.
- 동사가 가장 우선하는 어순(VSO, VOS)을 갖는 언어는 항상 전치사 유형이다.

**** 같은 책, 75쪽, 79쪽에서 재인용. 아쉽게도 계산 결과만 가져다 놓았고, 표본의 크기는 이 책에서 인용하질 않았습니다. ㅠㅠ

***** 위에서 볼 수 있는 것처럼, IS의 값이 1보다 커서 보기가 좀 안 좋은데, 2차원 그래프를 그리기 위해서는 역수를 취해 주는 것이 좋습니다. 그린버그 이후의 다른 연구자들은 통상 IF와 맞추기 위해 0과 1사이의 값을 사용하지요. 아, 그리고 베트남어 IF의 경우.. 다음에 출처를 확인하게 되면 덧붙이겠습니다만, 저는 0이 아니라 1을 할당해야 하는 것 같은데 말이죠..