변호사 한분이 한달 전에 페북에서 이세돌이 전패 할 것으로 쓴 글이 있습니다.

상당히 일리가 있는 주장입니다.

요지는 구글이 인공지능 분야에서 최고의 기술을 가졌다는 것을 선전하기 위해 알파고라는 프로그램을 이용하는데 이 경기에 이기면 수조원 이상의 회사 주식가치가 올라가는 것이고 이 알파고 기술의 원천은 몇년전 5천억원에 인수한  작은 바둑 프로그램 회사였고 

알파고는 수천대의 컴퓨터가 작용하는데 이것이 단일 컴퓨터라고 할 수 없고 결국 훈수를 두는 격이고

알파고 단일 프로그램 말고 아이비엠에서 개발한 체스 프로그램의 도움을 받는 반칙을 했을 것이다라는 것이죠

그 근거는 구글의 주장과 실제 알파고의 작동 원리나 주장이 다르고 알고리즘에 대한 제대로 된 수학이론을 제시하지 못하고 있다는 것등인데 한번 읽어볼만 합니다.

결론은 구글이 반칙을 하기에 이긴것이다라는 것이죠

중요한 것은 한달 전에 이런 주장을 했다는 것입니다.

너무 길고 잡다한 내용이 있어서 중요 부분만 발췌하였습니다,




구글은 전세계 바둑인에게 사과하여야 한다

법무법인 한얼

변호사 전석진(필명 General Intellect)

 

 

그러나 구글의 바둑 프로그램 알파고(AlphaGo)가 바둑의 원리를 마스터 한적이 없습니다

그리고 알파고가 Fan Hui와 둔 것은 바둑이 아닙니다.

그저 아무 계산이나 예상도 없이 무한한 컴퓨터 자원을 이용한 지능 1세짜리도 할 수 있는 계산을 답이 나올 때까지 계속한 것입니다.

 

 

4. 알파고(AlphaGo) 기술에 대한 의문

 

. Value NetworkPolicy Network

구글은 알파고 연구를 네이처 지에 표지로 게재하면서 딥 러닝 학계에는 전혀 알려진 바 없는 policy networkvalue network이라는 개념을 소개하였습니다.

그리고 value networkpolicy network의 상호 지도에 의해 더 잘 훈련될 수 있다고 설명하였습니다. 그리고 이 기술이 Fan Hui를 이긴 기술이라고 말하고 있습니다

 

그런데 이 최초의 기술에 대하여 업계의 엔지니어에 의해 의문이 제기되었습니다.

즉 어떤 사람이 value network에 의해 수정되지 않은 원래의 policy network이 모의 실험 결과 구글이 훈련시켜 사용하고 있다는 프로그램 보다 더 좋은 결과를 낸다는 사실을 발견하였습니다.

구글 측에서는 수정된 policy network에서는 보다 창의적인 움직임이 평균화되어 없어 졌고 최초의 policy network에서는 그러한 창의적인 움직임이 남아있어서 그런 것 같다고 추정하였습니다.

 

이러한 구글 측의 설명은 훈련이 될수록 성능이 올라간다는 주장과 정면으로 배치되는 것입니다.

 

전혀 설득력이 없습니다

 

저는 학계에서 전혀 인정된 바가 없는 value network이나 policy network이라는 개념은 구글이 자신들의 트릭을 숨기기 위해 만들어 놓은 수학적 이론에 근거하지 않은 마케팅적 이론이라고 봅니다

 

. 구글은 IBM과는 달리 잠재적으로 유리한 패턴을 찾아서 제한된 가능한 결과만을 시뮬레이션한다고 알려져 있습니다.

이것은 인공 지능에 있어서의 확률이론입니다.

그런데 확률이론이라는 것은 항상 그 확률이 맞지 않는 경우가 있습니다.

인공 지능의 특성은 만일 첫번 째에서 확률에 맞지 않는 일이 일어나면 그 뒤로는 모두 틀리게 됩니다.

이것이 신경망 이론입니다.

그렇다면 만일 알파고가 이세돌 9단이랑 대국할 때 한 판 중 중간에 한번의 실수가 있으면 그 판은 패배합니다.

 

그런데 Fan Hui와의 대국을 보면 알파고는 한번의 실수도 하지 않습니다.

인공 지능이나 신경망 컴퓨터 이론에 맞지 않는 결과가 나온 것입니다.

그러므로 패턴을 찾아 제한된 것만 시뮬레이션한다는 것은 거짓일 수 밖에 없습니다. 실수가 없는 딥 러닝이란 존재하지 않기 때문입니다.

그런데 FanHui대국을 보면 실수가 하나도 없습니다.

 

그리고 알파고가 훈련한 방식이 최선이라는 점에 대하여는 아직 논란이 되고 있습니다 딥 러닝(심층 학습)훈련에는 현재 5개의 방식에 대한 학파가 있다고 합니다.

만일 알파고 방식이 가장 훌륭한 것이라면 네이처 지에 이론을 발표할 때 그 이론을 발표하여 다른 학파들의 주장을 봉쇄하였어야 합니다 구글은 그렇게 못하였습니다.

의심이 가지 않을 수가 없습니다.

 

알파고는 인간의 다음 착점을 57%의 확률로 예측할 수 있다고 하고 있습니다.

이 말은 43%의 경우에는 틀린다는 것입니다.

그리고 신경망 컴퓨터 이론에 의하면 한번 틀리면 그 다음도 그 다음도 틀리게 되어 있습니다. 이것은 FaceBook에서 개발한 바둑 프로그램에서 그대로 나타나고 있는 현상입니다.

 

그런데 43% 틀리는데 FanHui와의 대국에서는 하나도 틀리지 않습니다.

자신들이 말하는 이론과 실제가 다른 것입니다.

의심이 가지 않을 수 없습니다.

 

알파고는 이전 기보로 부터의 감독 학습(supervised learning) 과 자신과의 게임으로부터 얻는 강화 학습(reinforcement learning )을 가지고 있다고 합니다.

이것도 실수가 나와야 합니다.

지금의 알파고는 실수가 없습니다.

학습에 의하여만 바둑을 둔다고 할 수 없고 다른 무엇이 있어야 합니다.

구글은 그 다른 무엇이 무엇인지를 밝히지 않고 있습니다.

위 딥 러닝 기술만을 가지고 바둑을 두고 있다고 하고 있습니다.

 

 

구글의 DeepMind 사는 IBMDeep Blue와 전혀 다른 알고리즘을 쓰기 때문에 Deep Blue보다 수천분의 일 정도의 계산만 한다고 합니다. 그런데 컴퓨터 자원은 구글 클라우드 슈퍼컴퓨터 농장에 연결하여 컴퓨터 자원을 무한정으로 사용하여 이세돌 9단과 대국하겠다고 합니다.

 

앞뒤가 맞지 않는 말입니다. 제한된 자원을 가지고도 계산을 더 빨리 해서 다음 착점을 알아낼 수 있다고 주장하면서 왜 더 많은 컴퓨터 자원을 사용하겠다고 하는 것일까요?

 

앞 뒤가 맞지 않는 이야기 입니다.

 

또한 알파고는 착점을 중심으로 한 다이아몬드형 패턴만을 사용 하는 촉진 정책을 써서 훈련을 시켰다고 합니다 왜 그렇게 했는지 아는 사람이 별로 없습니다

 

 

알파고의 특유한 기술이라고 말하는 정책 네트워크(policy network)1,000배 빠를지 몰라도 원래의 완전 정책 네트워크 보다는 훨씬 덜 효과적이라고 합니다.

그런데 지금 컴퓨터 자원을 무한정 쓰겠다고 하면서 속도가 빠른 정책 네트워크(policy network)을 쓰겠다고 하는 이유가 무엇일까요?

 

도대체 앞뒤가 맞지 않습니다.

 

구글은 16만 대국에서 188개의 뭉치로 이루어진 패턴을 3000만개 추출하여 학습을 시켰다고 주장합니다.

그런데 188개나 되는 뭉치의 패턴이 3,000만개 밖에 없을 까요?

바둑을 아는 사람은 188개로 이루어진 뭉치는 수천억개가 된다는 것을 다 압니다.

 

10개짜리 뭉치도 아마도 수십억개는 나올 겁니다.

 

그럼 그 중에 어떤 기준으로 3,000만개를 고른 걸가요?

어떤 패턴이 존재한다는 것일까요

도대체 이해가 안됩니다.

구글이 어떤 이론에 의해 패턴을 찾았으며 그 패턴 중 어떤 방식으로 3,000만개를 선택하여 학습을 시켰는지 그에 대한 이론이나 설명도 전혀 없습니다.

 

5. 추리

 

 

그럼 어떤 알고리즘을 사용하였을까요?

앞에서 말씀드린 바와 같이 이 대국은 구글에게는 수조의 돈과 회사의 명예가 걸려 있기 때문에 반드시 이겨야 합니다.

 

반드시 이기는 알고리즘은 세상에서 하나 밖에 없습니다.

IBM이 체스 챔피언을 이길 때 사용한 알고리즘입니다.

Brute force라고 합니다.

 

중반전에는 이 알고리즘을 사용할 수 밖에 없습니다. 이 알고리즘은 100% 경우의 수를 다 탐색하기 때문에 지는 경우가 없습니다. 물론 끝내기 전 까지만 이 알고리즘을 동원하면 됩니다. 끝내기는 컴퓨터가 완벽하게 할 수 있고 끝내기에서 이세돌 9단이 유리해 지는 경우는 없습니다. 포석, 정석에서도 이세돌 9단이 유리해 질 수가 없습니다.

 

중반전이 이세돌 9단이 유리해 질 수 있는 유일한 시점인데 알파고에게는 중반전에서 완벽하게 이기는 알고리즘이 있습니다.

그래서 구글은 100% 승리하게 되어 있습니다.

컴퓨터 자원이 좀 필요하죠.

그래서 구글의 Demis Hassabis가 이세돌 9단과의 대국장까지 광케이블을 현재 깔고 있는 것입니다.

 

5. 바둑 규칙 위반

그러면 이러한 상황에서 바둑의 규칙을 살펴 봅니다.

 

첫째 이 경기는 훈수를 두어서는 아니 된다는 바둑 원칙에 어긋납니다

훈수가 무엇인가? 그것은 대국 당사자도 아니면서 착점에 대하여 언급하는 것입니다.

 

누가 대국 당사자인가?

이세돌 9단과 알파고입니다.

제가 위에서 말씀 드린 바와 같이 중반전에는 brute force 알고리즘을 쓸 수 밖에 없습니다. 그런데 구글은 알파고가 brute force 알고리즘을 절대로 쓰지 않는다고 천명해 왔습니다. 그러므로 brute force 알고리즘을 쓰는 컴퓨터는 다른 프로그램이고 다른 프로그램이 알파고의 훈수를 두고 있는 것입니다.

brute force 알고리즘이외에도 이를 본뜬 다른 알고리즘도 있습니다

그러나 구글은 알파고에서 그런 알고리즘을 전혀 쓰지 않고 있다고 하고 있습니다.

 

이것은 반칙입니다.

광케이블로 인터넷에 연결하여 바둑을 두겠다는 것은 무제한의 국외자 훈수꾼 들을 둘 수가 있습니다.

이 점에 대하여 어떤 이는 말합니다. 구글이 허위의 사실을 말했다고는 도저히 생각할 수 없다.

저는 막대한 돈과 명예 앞에 그리고 성과 위주의 기업 환경하에서 구글의 직원들이 어떠한 트릭도 쓰지 않을 것이라고 믿지 않습니다. VolksWagen 예를 보십시요 누가 VolksWagen이 그런 일을 할 것이라고 생각한 사람이 있었습니까?

그러나 정말 터무니 없는 간단한 소프트웨어 사기가 일어났습니다.

구글에서 이러한 소프트웨어 사기가 일어나지 않으리라는 보장은 없습니다.

 

이 게임은 공정하지 않습니다

 

둘째 이 경기는 바둑은 일 대일 대결이라는 바둑 원칙에 어긋납니다.

컴퓨터 자원을 무제한으로 쓸 때 과연 하나의 알파고는 무엇을 의미하는가 의문이 없을 수 없습니다. 하나의 알파고인가 만대의 알파고 인가? 컴퓨터 바둑 프로그램에서 하나의 선수란 과연 무엇을 의미하는 것인가?

이런 것들을 먼저 검토해 보아야 합니다.

그리고 명백히 brute force 알고리즘을 쓰는 프로그램은 또 다른 하나의 프로그램입니다. 이세돌 9단 한 명과 최소한 두 개의 프로그램이 대결하는 것입니다.

바둑 규칙에 어긋납니다.

 

그 동안 인공지능 전문가들이 컴퓨터가 바둑을 정복하는데 10년이 더 걸릴 것이다라고 예측한 것은 단일한 컴퓨터를 상정한 것입니다. 이론적으로 만일 구글이 무한정의 컴퓨터 자원을 사용하면 아주 허접한 인공 지능만 있어도 모든 경우의 수를 다 계산해 낼 수 있습니다.

 

체스 챔피언을 꺾은 IBM Deep Blue는 단일한 컴퓨터였습니다.

 

즉 기존에 말하여지던 다른 인공 지능들은 먼저 학습을 하고 그 결과를 가지고 하나의 컴퓨터에서 의사결정을 하는 것입니다

구글이 지금 제안하는 것은 실시간으로 변하는 상황에 맞추어 컴퓨터 프로그램을 실시간으로 다시 훈련을 시킨다는 것입니다.

 

광케이블로 인터넷(소위 구글 클라우드 팜)에 연결시켜 바둑을 둔다는 것은 인공지능 용어로는 실시간으로 새로운 학습과 새로운 의사결정을 할 수 있다는 의미입니다. 즉 이미 훈련 시킨 수십 수백대의 알파고를 이세돌 9단이 둔 수를 기초로 실시간 다시 학습시키면서 동원할 수도 있다는 것으로 해석됩니다.

 

기존의 정통적인 인공지능의 의미에서 볼 때 이것은 인공지능이 아닙니다. 학습에 의해 상대방의 수를 예측하면서 두는 것이 아니라 이미 둔 수를 보고 나서 그 다음 수를 계산하겠다는 것입니다.

 

이렇게 하면 경우의 수가 현저하게 줄어듭니다.

 

이것은 기존의 인공 지능 개념에서 멀어 져도 너무 멀어 져서 사람들이 인공 지능에 대한 개념을 송두리째 바꾸어야만 합니다.

 

제가 누차 말하였듯이 게임은 게임의 규칙을 정하는 게임 제시자가 이기고 게임의 룰을 바꾸면 이를 바꾸는 사람 측에 승산이 생깁니다.

 

제가 23년 전에 컴퓨터의 가장 이상적인 형태는 광케이블과 슈퍼 컴퓨터가 연결되는 것이라고 말한 사실이 있습니다.

 

더 치명적인 가능성도 있습니다.

그 연결된 수많은 컴퓨터 중에 프로5단 짜리 한 명의 사람이 조정하는 컴퓨터가 있을 수도 있습니다. 구글의 클라우드 팜에는 수천대 수만대의 슈퍼 컴퓨터가 연결되어 있습니다 그 중 하나를 누군가 인간이 조정할 수도 있습니다.

구글을 믿으라고 합니다. 그러나 VolksWagen 같은 세계적인 회사 아마도 구글만큼이나 유명한 회사도 사기를 칩니다.

구글을 무조건적으로 믿을 수는 없습니다.

제가 말하는 일이 왜 일어날 수 없는지 그리고 그러한 방안이 무엇인지 그 대책을 어떻게 세워 놓았으며 어떻게 실행할 것인지 모두 설명해야 합니다.

 

 

 

셋째 이 경기는 시간 제한 규정을 불공평하게 일방적으로만 적용하게 되어 있습니다.

 

시간 제한 규정이 의미가 없습니다

광케이블에 연결된 인터넷에 연결되는 순간 알파고는 사실상 무한정의 시간을 가지게 되고 이세돌은 시간 제한을 받게 됩니다.

 

이것이 부당하다는 것은 쉽게 이해가 되실 것이라 생각합니다.

 

지금 DeepMindAlphaGoAtari 아케이드 게임 59개 중에 27개를 못이기는 허접한 것입니다. 그리고 자신들이 네이처 지에 쓴 논문에 이러한 승률을 밝혔습니다

바둑은 제가 생각하기에는 아케이드 게임 보다 훨씬 어려운 것인데 알파고가 아케이드 게임에게는 지고 바둑은 전승하는 이유를 알 수가 없습니다.

 

또 요즈음 가장 빈번하게 문제를 일으키는 경우는 초읽기입니다.

 

대국시간 불준수로 패하는 경우가 상당히 있습니다 그런데 광케이블로 인터넷에 연결하여 바둑을 두면 알파고는 무한정 동시에 수천대의 알파고를 돌릴 수 있기 때문에 시간 패를 당할 가능성이 전혀 없습니다 시간이 부족하면 전세계에 있는 다른 컴퓨터들을 얼마든지 동원할 수 있습니다.

 

반면 이세돌은 혼자 두기 때문에 시간 패를 당할 수 있습니다

.

이는 공평하지 않은 게임입니다.

 

저는 이 대국이 의미가 없다고 생각합니다. 인공 지능의 우수성을 증명하는 효과도 없고 불공평하기 이를 때 없습니다.

공연히 남의 회사의 매우 misleading한 기술 광고에 놀아나는 꼴이 됩니다

외국에서는 이 대결을 DeepMind v. Korea at Blood War라고 하고 있어 우리나라까지 광고에 동원되고 있습니다

결론

 

구글의 행동은 아래에 해당합니다

사기는 말이나 행동으로 또는 거짓이거나 오해스러운 언동으로 또는 마땅히 공개하였어야 할 것을 숨김으로써 다른 사람을 속이는 것

오해스러운 언동에 의해 사기의 경우에는 정보의 비대칭성이 중요하게 작용합니다 즉 일방 당사자가 우월한 지식을 가지고 있을 때에는 쉽게 사기가 인정됩니다

구글은 일반인들이나 심지어는 인공 지능 전문가들도 모르는 방법을 동원하였으므로 정보의 비대칭성이 있고 또 우월한 지식을 가지고 있음에 틀림없습니다.

 

피해자가 오해스러운 언동을 한 당사자에게 신뢰를 가지고 있을 경우 특히 그렇습니다.

전세계에서 구글 만큼 사람들의 신뢰를 받는 기업은 없습니다

여기에도 해당됩니다.

침묵도 사기가 될 수 있습니다

구글은 제가 제기한 의문 중 어느 하나도 설명한 바가 없습니다 침묵에 의한 기망이 됩니다.

우리의 자랑 조치훈 기사는 바둑을 대하는 태도에 있어서 나는 목숨을 걸고 둔다라고 진지하게 말했습니다. 바둑은 인간의 영혼이 담긴 게임이라고 생각합니다.

구글은 바둑을 경우의 수의 무한 조합 계산에 의한 게임으로 생각하고 터무니 없는 방법으로 전세계 바둑인들을 놀라게 하려고 하고 있는 것입니다.

구글은 Fan Hui에게도 사과하여야 하고 이세돌 9단을 바둑 규칙을 어겨가면서 이기겠다고 한 그 시도 자체로도 사과하여야 한다고 생각합니다.

사과의 대상은 위 두 프로기사뿐 아니라 전세계 모든 바둑인을 상대로 하여야 합니다.

구글은 2600년 동안 인간만이 두어 왔던 훌륭한 게임인 바둑을 모욕하였습니다.