한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2017.07.17 Data Science

    야구 데이터 분석 #4 세이버메트릭스의 오늘과 내일

    다년간 쌓인 통계 자료를 이용해 야구 기록을 분석하는 ‘세이버메트릭스’.

    지난 편에서는 세이버메트릭스의 어원과 세이버메트릭스를 유행시킨 주인공들을 만나 보았는데요, 이번에는 인터넷을 통해 세이버 메트릭스가 널리 알려지게 된 과정을 소개하겠습니다.


    메이저리그 여러 구단이 이미 1980년 무렵부터 데이터 분석 전문가들을 고용하여 구단 운영에 활용하고 있었고, 빌 제임스와 같은 사람들의 노력으로 보다 많은 팬들이 세이버메트릭스에 관심을 가지게 되었습니다만, 아직은 개별적인 흥미와 연구의 차원에 머무르고 있었습니다.

    세이버메트릭스가 오늘날과 같이 널리 퍼지게 된 것에는 인터넷의 역할이 결정적이었지요.

    지금처럼 월드 와이드 웹(WWW)이 대중화 되기 이전에, 게시판과 유사한 형태로 유즈넷(USENET)이라는 인터넷 시스템이 있었습니다.

    1994년에 유즈넷 뉴스그룹 RSBB(rec.sport.baseball)가 탄생합니다.

    이 뉴스그룹에 당시 주류 야구 저널리즘에 불만이 많던 젊은 야구 분석가들이 대거 모이면서, RSBB는 세이버메트릭스 반란군 본부(!)의 역할을 하게 됩니다.

    사람들은 매일같이 여기에 모여 주류 야구 언론을 비판하고, 당시 메이저리그 구단들의 전근대적인 운영을 지적하곤 했습니다.

    토론토 블루제이스를 거쳐 ESPN에 합류한 키쓰 로(Keith Law)를 비롯하여 대체수준(Replacement Level) 개념을 발명하고 클리블랜드 인디언스에 고용된 키쓰 울너(Keith Woolner), 투수가 인플레이 타구의 운명에 별로 영향을 주지 못한다는 DIPS 이론의 보로스 맥크라켄(Voros McCracken), 마이너리그 유망주 전문가인 존 시켈스(John Sickels), ZiPS 예측 시스템을 고안한 댄 짐보스키(Dan Szymborski) 등의 유명 인사들이 모두 RSBB에서 왕성하게 활동하던 사람들입니다.

    이 뉴스그룹은 아직도 살아 있답니다.(https://groups.google.com/forum/#!forum/rec.sport.baseball)

    RSBB에서 활동하던 개리 허카베이(Gary Huckabay)는 뜻이 맞는 사람들과 함께 1996년 베이스볼 프로스펙터스 Baseball Prospectus (www.baseballprospectus.com)를 만들어서, 이제 웹사이트를 통해 주류 야구 저널리즘에 대해 독설을 퍼붓기 시작합니다.

    역시 RSBB의 핵심 멤버이자 수학 교수였던 션 포먼(Sean Forman)은 2000년 야구 스탯을 제공하는 베이스볼 레퍼런스 Baseball-Reference(http://www.baseball-reference.com/)를 만들었는데요. 베이스볼 레퍼런스는 야구 데이터에 목마른 팬들에게 지금까지도 방대한 스탯을 무료로 제공해 주고 있지요.

    더 많은 데이터를!

    한편, 션 포먼은 짐 퍼타도(Jim Furtado)와 함께 2001년 베이스볼 프라이머 Baseball Primer (http://web.archive.org/web/20010405111444/http://www.baseballprimer.com/articles/about.shtml) 사이트를 설립하기도 했는데요, 이후 베이스볼 씽크 팩토리 Baseball Think Factory(http://www.baseballthinkfactory.org/) 로 이름을 바꿉니다.

    이 사이트는 유즈넷이 쇠퇴하면서 자연스럽게 침체되어 가던 RSBB 뉴스그룹을 대신하여 2000년대 초반 세이버메트릭스 대표 커뮤니티의 역할을 했습니다.

    ZiPS의 댄 짐보스키, MGR이라는 필명으로 더 유명한 UZR의 미첼 리트먼(Mitchel Lichtman), 현재 세계에서 가장 영향력 있는 세이버메트리션인 탐 탱고(Tom Tango) 등이 모두 이곳에서 활동했답니다.

    머니볼: 불공정한 게임을 승리로 이끄는 과학

    한편, 2003년에는 마이클 루이스(Michael Lewis)가 빌리 빈 단장과 오클랜드 구단의 성공 스토리를 담은 책 <머니볼 Moneyball>을 출간하였는데요. 이 책이 큰 반향을 불러일으키면서 야구계 내에서나 팬들 사이에서 세이버메트릭스에 대한 흥미와 관심이 더욱 고조되었습니다.

    이러한 분위기 속에서 마침 2004년에 더 하드볼 타임즈 The Hardball Times(http://www.hardballtimes.com/)가, 2005년에는 팬그래프 Fangraphs (http://www.fangraphs.com/)가 각각 탄생합니다.

    부분 유료 사이트인 베이스볼 프로스펙터스와는 달리 더 하드볼 타임즈와 팬그래프는 완전 무료였기에, 세이버메트릭스의 대중적인 확산에 결정적인 공헌을 하게 되었지요.

    무료 사이트 오픈했다고!

    현재는 메이저리그의 모든 구단이 데이터 분석 전문 인력을 고용하고 있습니다. 많게는 데이터 분석 전문 인력이 20명 가까이 되는 구단들(다저스, 탬파베이)도 있을 만큼 많은 데이터 분석 전문가들이 구단에서 일을 하고 있지요.

    또한, 야구 데이터에 대한 팬들의 이해도와 요구 수준이 높아지면서 미디어에서도 활발히 세이버메트릭스를 활용하기 시작했습니다.

    2000년대 중반 이후에는 인터넷에서 활발히 활동하던 세이버메트릭스 논객(?) 들이 결국 메이저리그 구단에 취업하거나 메인스트림 저널리즘에 합류하는 일도 잦아졌습니다.

    구단 내 분석 인력은 확대일로에...

    국내 프로야구에도 잘 알려지지는 않았지만 초창기부터 세이버메트릭스를 활용하려는 노력이 있어 왔습니다.

    80년대 일부 구단에서는 빌 제임스의 연구 방법들을 적용하여 시즌 예측이나 선수 연봉 산정에 활용하기도 했고요.

    야구 기록에 관심 있는 분들이 한국야구기록연구회(SKBR)와 같은 단체를 만들어 활발한 상호 교류와 연구를 했답니다.

    인터넷이 없던 시절에 어떻게 이런 연구가 가능했는지 정말 놀랍기만 합니다!!

    한국야구기록연구회 자료

    사진: Patrick Bourgo (NC다이노스 데이터팀 외국인 코디네이터)

    오늘날 메이저리그는 물론이고 국내의 중계 방송이나 야구 기사에서도 WAR과 같은 세이버메트릭스 지표를 흔히 접할 수 있습니다.

    인터넷 커뮤니티에서 세이버메트릭스 이야기를 하시는 팬들도 무척 많아졌습니다.

    세이버메트릭스가 대중화된 만큼, 한편으로는 오해도 많이 받고 있는 것 같고요, 심지어 잘못된 정보가 유통되는 경우도 있는 것 같습니다.

    세이버메트릭스는 모든 질문에 답을 주지는 못합니다. 또한 세이버메트릭스가 항상 옳은 것도 아닙니다.

    다만 야구를 객관적이고 합리적으로 이해하고자 하는 노력으로서, 궁극적인 답을 향해 계속 접근해 가는 과정이라고 할 수 있겠습니다.

    답을 찾아서...

    어쩌면 지금 우리가 널리 사용하는 WAR과 같은 계산 방식들이 몇 년 뒤에는 모두 폐기되고 새로운 스탯들이 나올지도 모릅니다.

    새로운 방식이 더욱 합리적이라면, 내가 틀렸음을 인정하고 새로운 방식을 받아들일 수 있어야 합니다.

    객관적, 합리적인 근거를 가지고 이야기하는 한, 누구나 자기 주장을 펼칠 수 있고, 동시에 상대방의 의견에 경청할 수 있는 것이지요.

    이러한 열린 마음가짐이야말로 세이버메트릭스를 즐기기 위한 필수 조건이라고 하겠습니다.

    마지막으로 한 가지. 야구를 숫자로 바라보는 것이 “비인간적”이거나 “부적절”하다고 생각하시는 분들께 드리고 싶은 말씀은, 세이버메트릭스는 오히려 야구를 더 재미있게 즐길 수 있는 방법이라는 것입니다.

    알고 보면 더 재미있습니다. 장담합니다. 그래도 안 믿기신다면, 앞으로 이 연재를 계속 읽어 보세요. ^^


    임선남

    대기업 사무직 직원으로 살다가
    엔씨소프트 데이터정보센터(DIC)를 거쳐
    현재 NC다이노스 데이터팀 팀장으로 재직 중입니다.
    스스로 야구 덕후라고 생각해 본 적이 없습니다.
    그냥 야구를 좋아하고 데이터를 좋아하다보니
    자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
    세이버메트릭스는 야구를 합리적, 객관적으로
    잘 이해하기 위한 노력으로 이러한 이해가
    야구를 더 재미있게 해 줄 수 있다고 믿습니다.

    대기업 사무직 직원으로 살다가
    엔씨소프트 데이터정보센터(DIC)를 거쳐
    현재 NC다이노스 데이터팀 팀장으로 재직 중입니다.
    스스로 야구 덕후라고 생각해 본 적이 없습니다.
    그냥 야구를 좋아하고 데이터를 좋아하다보니
    자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
    세이버메트릭스는 야구를 합리적, 객관적으로
    잘 이해하기 위한 노력으로 이러한 이해가
    야구를 더 재미있게 해 줄 수 있다고 믿습니다.