한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2018.04.09 Data Science

    야구 데이터 분석 #13 야구 지표 계산법 (타구 비율 지표 편)

    세이버메트릭스를 기반으로 야구 경기를 더 재미있게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’!

    오늘은 타구와 관련된 비율 지표들을 살펴보겠습니다.


    1. GO/AO – 땅볼아웃/뜬공아웃 비율 (Ground Out Per Air Out)

    흔히 ‘땅뜬비’라고 언급되는 비율 지표입니다.

    KBO 공식 홈페이지에서는 ‘기록실’의 ‘투수 세부기록’에서 보실 수 있습니다. (링크: https://goo.gl/KP6cQP)

    2018 KBO 정규시즌 투수 세부기록 중 GO/AO

    국내에서는 아웃된 타구에 대해서만 집계하여 비율을 계산하고 있습니다.

    KBO리그의 시즌별 평균 GO/AO는 주로 1.0 ~ 1.1 사이로 나타납니다. 특정 투수의 GO/AO가 이 값보다 크면 땅볼 성향이 강한 투수로, 이 값보다 작으면 뜬공 성향이 강한 투수로 볼 수 있습니다.

    2. GB/FB – 땅볼/뜬공 비율 (Ground Ball Per Fly Ball)

    메이저리그 데이터를 제공하는 사이트 팬그래프(Fangraphs)를 보면, GO/AO 대신 GB/FB를 제공합니다.

    이 지표는 아웃뿐 아니라 모든 타구에 대하여 ‘땅뜬비’를 구한 것입니다.

    류현진 선수의 메이저리그 통산 GB/FB를 보면 1.55로 나옵니다. (링크: https://goo.gl/1aw318)

    류현진 선수의 GB/FB 기록

    이 링크에 등장하는 지표들을 계속 설명 드리겠습니다. 국내에는 타구 관련 지표가 아직 부족한 편입니다.

    3. GB%, LD%, FB%, IFFB% – 땅볼 비율, 라인드라이브 비율, 뜬공 비율, 내야팝업 비율

    메이저리그에서는 타구를 보통 땅볼/라인드라이브/뜬공으로 분류합니다.

    IFFB는 In Field Fly Ball의 약어로 내야 뜬공, 즉 팝업 타구를 의미합니다. 이것은 뜬공의 일종이므로, 다음과 같이 계산합니다.

    류현진 선수의 메이저리그 통산 기록을 보면, GB%가 47.9%로 땅볼의 비율이 약간 높은 편임을 알 수 있습니다. 메이저리그의 평균 땅볼 비율은 44% ~ 45% 정도입니다.

    4. HR/FB – 뜬공 중 홈런 비율 (HR per Fly Ball)

    말 그대로, 뜬공 중에서 담장을 넘어간 비율을 의미합니다.

    5. IFH%, BUH% – 내야안타(Infield Hit), 번트안타 비율

    전체 땅볼 중 내야안타의 비율, 번트 시도 중 내야안타가 된 비율을 의미합니다.

    6. Pull%, Cent%, Oppo% – 타구 방향의 비율(당겨친 비율, 가운데 비율, 밀어친 비율)

    이 세 스탯은 타구 방향이 어느 쪽이었는지의 비율을 나타냅니다. 투수보다는 타자의 성향을 잘 보여주므로, 타자를 분석할 때 좀 더 의미가 있습니다.

    예를 들어, 이치로 선수의 커리어 타구 방향 비율을 보면, Pull 31.4%, Cent 35.2%, Oppo 33.3%로 세 방향이 골고루 분포하고 있음을 알 수 있습니다. 야구장 전역을 골고루 사용하는 타자인 것이죠. (링크: https://goo.gl/dafeKp)

    이치로 선수의 Pull%, Cent%, Oppo% 기록

    반면 데이비드 오티스(David Ortiz)와 같은 타자의 커리어 타구 방향 비율을 보면, Pull 45.4%, Cent 30.6%, Oppo 24.1%로, Pull 즉 당겨친 비율이 훨씬 높은 것을 볼 수 있습니다. (링크: https://goo.gl/5Kzs9S)

    데이비드 오티스 선수의 Pull%, Cent%, Oppo% 기록

    메이저리그에서는 이런 유형의 타자들에 대하여 수비수의 위치를 한 쪽으로 치우치게 배치하는 수비 시프트(Defensive Shift)가 유행하고 있습니다. 최근에는 KBO리그에서도 내야수들이 과감한 시프트를 하는 모습을 보이곤 합니다.

    7. Soft%, Med%, Hard% – 타구 강도의 비율(약한 타구 비율, 중간 타구 비율, 강한 타구 비율)

    이 세 스탯은 타구의 강도에 따른 분포를 보여 줍니다. 다만 어디까지가 약한 타구이고 어디부터가 강한 타구인지에 대한 합의된 기준은 없습니다.

    팬그래프(Fangraphs) 사이트에서 제공하는 자료는 BIS(Baseball Info Solution)사의 알고리즘에 따라 분류한 결과이며, 자세한 분류 기준은 공개하지 않고 있습니다.

    그밖에, SIERA, xFIP-, xFIP 등은 추청 평균자책점(ERA Estimator)이라는 범주에 속하는 지표들인데요. 이는 매우 긴 설명이 필요하므로 나중에 별도의 코너를 마련해 설명드리도록 하겠습니다.

    다음 시간에는 타구 분석에서 많이 언급되는 BABIP에 대해 알아보겠습니다.


    임선남

    대기업 사무직 직원으로 살다가
    엔씨소프트 데이터정보센터(DIC)를 거쳐
    현재 NC다이노스 데이터팀 팀장으로 재직 중입니다.
    스스로 야구 덕후라고 생각해 본 적이 없습니다.
    그냥 야구를 좋아하고 데이터를 좋아하다보니
    자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
    세이버메트릭스는 야구를 합리적, 객관적으로
    잘 이해하기 위한 노력으로 이러한 이해가
    야구를 더 재미있게 해 줄 수 있다고 믿습니다.

    대기업 사무직 직원으로 살다가
    엔씨소프트 데이터정보센터(DIC)를 거쳐
    현재 NC다이노스 데이터팀 팀장으로 재직 중입니다.
    스스로 야구 덕후라고 생각해 본 적이 없습니다.
    그냥 야구를 좋아하고 데이터를 좋아하다보니
    자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
    세이버메트릭스는 야구를 합리적, 객관적으로
    잘 이해하기 위한 노력으로 이러한 이해가
    야구를 더 재미있게 해 줄 수 있다고 믿습니다.