1. 486 세대 중에서 쌍팔년도 당시 DIY 형태의 컴퓨터를 만들어본 경험이 있는 분이라면 당시 DRAM 모듈을 70nS(나노 세컨드. 1나노는 10억분의 1)로 선택할 것인지 60nS를 선택할 것인지를 고민해보신 경험이 있을 것이다.

여전히 그렇겠지만, 당시의 DRAM의 속도는 컴퓨터 동작 속도를 좌우하는 것으로 70nS보다 60nS가 access time(컴퓨터에서 Memory 등 장치들을 호출하는 시간)이 짧은만큼 빨라진다. 뭐, 지금은 사라진 Compaq이라는 컴퓨터 회사에서는 삼성의 60nS를 독점하다시피 해서 그나마 생산 수량이 적은 60nS DRAM 모듈은 가격이 훨씬 비싸기 때문이었다.

그런데 60nS의 DRAM은 70nS의 DRAM과 같은 생산라인, 같은 공정에서 생산되는 것이다. 단지, Q/C(Quality Control) 과정에서 이 DRAM의 access time은 70nS, 저 DRAM의 access time은 60nS로 분류되는 것이다. 정규분포 곡선으로 해석하자면 70nS의 DRAM은 합격의 마지노선이다. 예를 들면, DRAM 생산 공정에서 65nS를 평균값(Mean)으로 놓으면 70nS는 표준편차(σ)가 -5nS이고 60nS는 표준편차가 +5nS라는 것이다. 따라서, 표준편차가 -5nS 미만인 것은 폐기하고 표준편차가 +5nS인 60nS 이상인 제품은 따로 모아 60nS DRAM으로 판다는 것이다.


삼성의 메모리 산업은 지금은 설계기술이 경쟁회사에 비해 넘사벽이지만 초기에 대성공을 거두었던 것은 바로 이렇게 표준편차가 -5nS 미만인 DRAM의 비율을 당시 경쟁업체였던 일본 유수 반도체 업체들보다 훨씬 낮춘 것에 기인한다. 즉, 새로운 생산라인에 투자를 꺼려했던 일본반도체 업체들에 비해 삼성은 생산라인에 공격적으로 투자를 했고 이런 공격적 투자는 수율(yield)을 높였으며 따라서 DRAM 단위 가격을 압도적으로 낮출 수 있었다는 것이다.


2. "이 세상에 버그 없는 소프트웨어는 없다"

빌 게이츠의 말로 나의 체험적 부분에서 그리고 통계학 측면에서도 빌 게이츠의 주장은 '참'. 


체험적 부분에서는 개발하여 베스트셀러가 되었던 제품이 버그가 발견되어 개고생을 했으니까. 다행히도 판매 초기에 발견되었고 해외출장을 가야 했던 A/S 파트 직원들은 신이 났지만 판매 정점에서 버그가 발견되었다면 '회사 말아 먹었을지도'. ㅜ.ㅜ;;;


작성 완료된(또는 작성 중에) 소프트웨어 테스트 과정에서 통계적 기법이 도입되는데 PC 환경에서는 소비자들에게 'excuse'되는 버벅거림이 독립된 하드웨어 장치에서는 치명적인 버그로 되는 경우가 있다. 버벅거림은 각 테스크에서 (윈도즈 환경에서는 멜티 태스킹) 할당된 시간(윈도즈 환경에서는 쓰레드 타임(Thread Time)) 이상을 소비하는 경우로 독립된 하드웨어 장치에서는 특정 이벤트를 놓치는 경우가 발생한다.


이를 방지하기 위하여 간단한 검증 장치를 만들어 팀원들에게 소프트웨어 개발 시작부터 이 검증 장치를 활용할 것을 강제하는데 검증 장치는 별거 없다. 귀로 인식할 수 있는 '부저 하나 달고' 숫자 표시 LED로 각 태스크 별로 부여된 번호를 표시하게 하여 할당된 쓰레드 시간을 초과하는 경우에 부저가 삐삑 울리고 해당 태스크 번호가 표시된다.


이런 경우 해당 태스크는 할당된 쓰레드 시간을 초과한 것이니 해당 태스크를 쪼개는 수 밖에. 이렇게 '걸린' 태스크는 통계적 기법에 의하여 정밀 분석되고 태스크를 분할 시킨다. 내가 개발과정에서부터 양산 전 과정까지 bug free 소프트웨어를 수시로 만들어냈던 이유는 이런 간단한 기법들을 동원한 결과이다. 이 방법은 윈도즈 프로그램을 작성하던 시절에도 활용되어 PCI 카드 형태로 개발하여 내 컴퓨터에는 이 카드가 항상 꽂혀 있었다.



3. 야구 세이버 매트릭스

야구 선수들의 성적을 통계적으로 분석하여 야구 선수들의 'performance'를 정확히 산출해내는 세이버 매트릭스는 신뢰할만한 데이터인데 한국 프로야구 감독들은 이런 세이버 매트릭스를 통째로 무시한다. 

예를 들어, 득점을 올리는데 확률적으로 타율>출루율(안타 등으로 출루하는 비율과 볼넷 또는 사구로 출루하는 비율을 합한 수치)>OPS(출루율과 장타율을 합친 수치. 장타율은 안타의 경우 0.25, 2루타의 경우 0.5, 3루타의 경우 0.75 및 홈런의 경우에는 1로 산출된다) 타율<출루율(안타 등으로 출루하는 비율과 볼넷 또는 사구로 출루하는 비율을 합한 수치)<OPS(출루율과 장타율을 합친 수치. 장타율은 안타의 경우 0.25, 2루타의 경우 0.5, 3루타의 경우 0.75 및 홈런의 경우에는 1로 산출된다)

이는 세이버 매트릭스에서 증명된 수치이다.


그리고 번트의 경우에도 승리로 이끄는 비율이 0.5 미만이다. 단지, 7회 이후의 번트는 승리로 이끄는 비율이 0.7 정도로 번트는 경기 후반에 승패를 가름할 수 있는 변수이지만 경기 초반의 번트는 투수에게는 말 그대로 쌩큐이다.

이 역시 세이버 매트릭스에서 증명된 수치이다.


그런데 한국 프로야구 감독들은 이런 증명된 수치를 철저히 무시한다. 그나마 이런 수치를 이해하고 실천하는 감독은 SK 와이번즈의 힐만 감독 정도.


단체 경기들 중에 특정 포지션의 선수에게 '승패를 적용하는' 스포츠는 야구가 유일하다. 축구의 경우 스트라이커인 호날두에게 '너 몇 골 넣었으니까 몇 승이야'라고 이야기하지 않는다. 농구의 전설적인 황제라는 조단 역시 그 압도적인 활약에도 불구하고 '너 압도적인 활약을 했으니까 몇 승이야'라고 하지 않는다. 단지, 프로야구에서만 10승 투수, 20승 투수 등 승패를 부여하고 그걸 투수의 평가 기준으로 삼는다.


류현진이 MLB에 진출했을 때 기자들의 '몇 승이 목표냐?'라는 질문에 '방어율 3점대에 150이닝 이상 투구'라고 대답한 것은 한국의 기자들 역시 세이버 매트릭스에 얼마나 무지한지를 보여준다. 기자들은 야구의 전통적인 '투승타타' 그러니까 투수는 몇승을 올렸는지가 투수의 가치 평가 기준이고 타자는 타율이 얼마인지가 타자의 가치를 평가하는 방식으로 질문한 것이고 류현진은 세이버 매트릭스에 기반한 대답을 한 것이다. 뭐, 특정 감독은 'OPS가 뭔지 모른다'라고 대답했을 정도니까 말 다했다.


그나마 요즘은 여전히 일부 신문에서만 언급되지만 세이버 매트릭스에 기반한 경기 분석 및 선수 가치 평가를 하고 있는게 실정이다.

극명한 예로, 완투한 두 투수 A와 B가 있는데 A 투수는 8:7로 팀이 승리한 반면 B 투수는 1:0으로 팀이 패배한 경우 A 투수는 1승을 올린 반면 B 투수는 1패를 떠앉았다. 이 경우 투수 a가 투수 b보다 더 낫다라고 이야기할 수 있을까?


4. 야구 세이버 매트릭스의 함정

그러나 세이버 매트릭스에는 함정들이 도사리고 있는 것들도 사실이다. 그 중 대표적인 것이 득타율. 타자의 가치를 평가하는 기준인 '타점'은 세이버 매트릭스 상에서는 철저히 부인되는 스탯이다. 위에서 예를 든 A투수와 B투수의 비교와 같은 것으로 타자들이 타점을 올릴 수 있는 환경이 얼마나 주어졌는지에 대하여 고려가 되어 있지 않기 때문이다.

또한, 1:0으로 지고 있을 때 1타점을 올리는 경우와 7:0으로 이기고 있을 때 3타점을 올리는 경우에 3타점을 올린 것이 더 가치가 있는 것일까?

예를 들어, 작년까지 한화에서 외인 타자로 활약했던 로사리오는 타점을 많이 생산했다. 그러나 소위 '영양가' 부분에서 로사리오는 낙제 수준이었다. 왜냐하면, 그가 타석에 들어섰을 때 주자가 득점권에 있던 상황이 비슷한 타점을 올린 선수들에 비해 압도적이었으니까. 


물론, 로사리오는 한국프로야구의 대표적인 똥차인 김태균 뒤 타석이기 때문에 타점을 손해본 것도 있다. 최형우나 하다 못해 또 다른 똥차라는 이대호인 경우에도 2루에서 충분히 홈으로 올 수 있는 2루타를 치는 경우에도 김태균은 겨우 3루에 도착하여 로사리오가 타점을 올리지 못한 경우만 3번 있었으니까.


로사리오나 김태균을 비난하려는게 아니라 '타점'이라는 수치가 얼마나 허망한 것인지를 이야기하고자 하는 것이다.


그래서 '타점'이라는 것은 세이버 매트릭스에서 철저히 무시되는 선수 평가 기준인 반면 '득타율'이라는 평가 기준은 철저히 분석이 되었다. 득타율이라는 것은 주자가 득점권 즉, 2루 또는 3루에 있을 때 안타 이상을 치는 비율을 산정한 수치이다. 여기서 주자가 똥차인 경우를 가정하여 실제 득점권에 있는 주자가 득점을 했는지 여부는 고려하지 않는다.


그리고 득점권 타율을 고찰한 경우 '통산 득점권 타율은 통산 타율에 수렴한다'라는 결론을 얻었다. 그러니까 흔히 이야기하는 '클러치 타자'라는 것은 허상이라는 것으로 잘치는 타자는 누상에 주자가 있건 없건 잘치고 못치는 타자는 누상에 주자가 있건 없건 못친다는 것이다. 물론, 아웃라이어들이 있다. 흔히 '천재'라고 불리며 통계학상으로는 '이상점' 또는 '특이점'이라고 불리는 선수들이 있는 것은 사실이다. 그러나 대부분의 타자들의 통산 득점권 타율은 통산 타율에 수렴비례한다는 것이다.


그런데 이게 사실일까?


우선 첫번째, 득점권 타율은 타율에 반영이 된다는 것이다. 간단한 예를 들어보자.

한 선수의 타율은 0.500(이 정도면 신급인데 계산 상의 편의를 위하여) 그리고 득점권 상황에 놓였을 때 비율은 타율의 0.500. 즉, 타석수로 비교한다면 두 타석마다 한번은 안타를 친다는 것이고 네 타석마다 한번은 득점권 상황에 놓인다는 것이다.

이 경우 이 선수가 득점권에서 안타 등을 친다면 그의 득점권 타율은 타율에 비하여 더 크게 반영이 된다. 

예로 타석 수가 1000타석이고 새로운 타석에 들어서면 타석 수가 1001. 이 때 안타를 치면 타율은 0.5005가 되지만 득점권 타율은 0.500998이 된다는 것이다. 


이런 반영의 편차는 동일한 타율을 가정한 경우 득점권 타율이 낮은 경우에 더 커진다.

예로, 타율이 0.500로 동일하고 득점권 상황이 0.250인 상태에서 타자가 타석에 들어서서 안타 등을 치는 경우 타율은 0.001 상승하지만 득점권 타율은 0.002로 상승한다는 것이다.


이론적으로 득점권 타율은 타율을 절대 넘지 못하며 타율의 최대 수치인 1.000에 비선형으로 수렴한다는 것이다. 매타석에 나설 때마다 득점권 상황에 위치한다면 그 득점권 타율은 1차 함수가 아닌 로그나 지수 함수 등의 궤적을 그린다는 것이다.


결국, 투승타타가 무의미한 이유처럼 설사 타율이 팀 승리 공헌도와 관계없이 타자의 절대적인 능력을 평가하는 수치라고 가정해도 득점권 타율은 투승타타처럼 환경에 의한 변수가 반영된다는 것이다.


득점권 타율을 정확히 산출하려면 득점권 상황에서의 타율과 비득점권 상황에서의 타율을 비교해야 한다. 이는 아래에 서술하는 '야구는 멘탈 게임이다'라는 속설에 부합되는 것으로 타자의 절대적 능력을 나타내는 타율과 득점권 상황에서 얼마나 부담감을 느끼지 않고 자기 능력을 발휘하는가를 비교해야 한다는 것이다. 당연히 득점권 상황에서의 타율과 비득점권 상황에서의 타율이 비슷할 수록 부담감을 느껴야 할 상황에서 이를 극복하는 우수한 타자이며 팀 공헌도가 높은 좋은 타자라는 것이다.



그리고 두번째, 야구는 멘탈 게임이라는 야구의 속설이 반영되지 않았다는 점.

"Ninety percent of this game is half mental." 

위의 말은 메이저 리그의 짐 월포드 발언이다. 그는 야구 경력의 대부분을 내외야 백업 선수로 채웠지만 야구가 멘탈이 큰 작용을 한다는 것을 최초로 말한 것이다.

그리고 한국의 메이저 리거 박찬호의 심리적 안식처라고 불리는 메이저리거 스포츠 심리학자인 '하비 도프만'은 '야구의 심리학'이라는 책에서 야구에서 멘탈이라는 요소가 차지하는 비중이 적지 않음을 역설했다.


여기서 이야기하는 멘탈이란 한국의 저 후진 '헝그리 정신'을 이야기하는 것이 아니다. '부담감'이라는 이야기다. 즉, 부담감이 없는 경우 결과가 상대적으로 낫다는 것이고 같은 상황에서 부담감을 낮추는 것을 심리학적으로 교정한다는 의미이다.


한국프로야구 현장에서는 (2017년 기준)10개 구단 감독 전부가 '선취점이 경기 흐름에 영향을 준다'라고 대답을 했으며 해설가들은 무사 만루 상황에서 첫번째 타자가 어떻게 하느냐에 따라 무득점으로 그치는 경우가 있고 빅이닝으로 가는 경우가 있다라고 설명한다. 뭐, 그들이 세이버 매트릭스에 대하여는 놀랄 정도로 무지하지만 오랫동안 현역으로 뛴 경험이 있는 현실에서 '부담감' 그러니까 멘탈이라는 것이 야구에서 차지하는 비중이 높다는 것을 경험학적으로 체험, 이구동성으로 이야기한다는 것이다.



흔히, 프로야구 팬들이 특정 선수를 비야냥 댈 때 '저 선수는 스탯 쌓는데는 명선수'라고 한다. 즉, 선취점을 낼 수 있거나 동점인 경우 리드를 할 수 있는 상황, 또는 지고 있는 상황에서 동점 또는 역전을 만들 수 있는 득점권 상황에서는 삼진이나 범타로 물러나지만 크게 리드하고 있는 경우에 장타나 홈런을 친다는 것이다.


이런 프로야구 팬들이 특정 선수들에 대한 비야냥은 대부분 집중이 되는데 이런 프로야구 팬들의 특정 선수들에 대한 비야냥에 관계없이 과연 역전 적시타와 크게 리드하고 있을 때 안타 등을 생산하는 '가치'가 같을까?


이 두 상반되는 상황에서의 타율은 통계적으로는 오차를 내지 않겠지만 선수의 가치 평가로는 적절하지 않다. 두 상황에서의 가치가 동일하게 평가받으려면 '야구는 멘탈 게임이다'라는 주장이 파해되어야 한다.


"득점권 타율은 통산 타율에 수렴한다"라는 세이버 매트릭스 항목은 각 상황에서의 득점권 타율로 세분하여 선수를 평가하는 것이 적절하다고 생각한다. 


예를 들어, 불펜투수들의 '분식회계' 그러니까 먼저 등판한 투수가 만들어낸 책임주자들은 득점을 허용하고 자신이 만든 주자에게는 득점을 허용하지 않아서 극단적인 경우 이 불펜 투수의 방어율은 0이 되는 허점을 방지하기 위하여 승계주자실점율(IRA)과 평균실점율-평균자책점(R-E)이라는 수치가 고안되어 불펜투수의 가치를 평가하는데 득점권 상황에서의 득점권 타율도 이렇게 상황별로 나뉘어 세분되어야 한다는 것이다.


백이숙제는 "以暴易暴"를 남겼고 한그루는 "以"를 남기고 간다.