한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2017.12.18 Data Science

    야구 데이터 분석 #9 야구 지표 계산법 (타격 지표 편)

    세이버메트릭스를 기반으로 야구 경기를 더 재밌게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’!

    그 동안 세 번에 걸쳐 소개해드린 야구 용어 및 약어는 잘 기억하고 계신가요? ^^

    이제부터는 기본적인 야구 지표들을 직접 계산해 보는 시간을 갖겠습니다. 오늘은 타격 지표를 먼저 볼게요!


    1. AVG, BA – 타율 (Batting Average)

    타율은 가장 기본적인 공격 지표입니다. AVG라고 많이 쓰며, BA 라고도 쓰며, 다음과 같이 계산합니다.

    즉, 안타수를 타수로 나눈 것입니다. H, AB 모두 기억나시죠? 잘 생각나지 않으시면 복습하세요. ^^

    2. OBP, OBA – 출루율 (On Base Percentage, On Base Average)

    타율은 사사구를 반영하지 않으므로, 타자의 출루 능력을 평가하는 지표로 출루율이 개발되었습니다. 초창기에는 OBA라고 썼으나 요즘은 주로 OBP라고 씁니다.

    타율과 비교하면, 분자와 분모에 모두 사사구가 추가되었고요. 분모에는 희생플라이도 포함되어 있음을 알 수 있습니다.

    하지만 희생번트는 제외입니다. 희생번트는 의도된 희생이지만, 희생플라이는 반드시 그렇다고 볼 수는 없기 때문이죠.

    3. SLG – 장타율 (Slugging Percentage)

    타율은 1루타와 홈런을 똑 같은 안타로 간주하므로, 장타력을 측정하기 위한 지표로 장타율이 개발되었습니다.

    2루타에 2, 3루타에 3, 홈런에 4의 가중치를 주어서 계산합니다.

    두 번째 식과 세 번째 식이 같다는 것은 6회 연재에서 설명드렸습니다. ^^

    타율과 출루율, 장타율을 AVG/OBP/SLG의 형식으로 많이 표기하는데요. 대략적인 타격 능력을 한 눈에 알아볼 수 있는 장점이 있답니다.

    이런 표기법을 슬래시 스탯(Slash Stat), 슬래시 라인(Slash Line), 트리플 슬래시(Triple Slash) 등으로 부르기도 합니다. 우리말로 타/출/장이라고 쓰는 경우도 종종 볼 수 있지요.

    4. OPS – (On-Base Plus Slugging)

    OPS는 가장 흔하게 쓰이는 단일 공격 지표인데요.

    계산이 비교적 쉬우면서도 타자의 가장 큰 공격 기여 항목인 출루와 장타를 섞어서 실제 공격 기여 수준과 높은 상관관계를 보이는 것이 장점입니다. OPS는 3회 연재에서 소개해 드린 바와 같이, 피트 팔머가 고안하였답니다.

    스탯의 어원에서 드러나듯 출루율과 장타율을 단순히 더해주면 됩니다.

    2017 시즌 KBO리그의 평균 타율 및 출루율, 장타율은 .286/.353/.438이었고, 리그 평균 OPS는 0.791이었습니다.

    5. ISO, IsoP – 순장타율 (Isolated Power)

    SLG는 단타를 아주 많이 쳐서 타율이 올라가도 자동으로 같이 올라가므로, 순수하게 장타력만을 평가하기는 어려운 부분이 있습니다. 그래서, 이러한 단점을 보완하기 위해 고안된 스탯입니다.

    이 스탯은 앨런 로스와 브랜치 리키가 개발하였고, 이후 1977년 빌 제임스가 다시 소개하여 널리 알려지게 되었습니다.

    계산 방법은, 장타율에서 타율을 빼주면 됩니다.

    이렇게 하면, SLG의 계산식에서 분자의 계수를 하나씩 빼 준 것과 동일한 효과를 얻게 되지요. 다음과 같이 계산해도 결과는 같습니다.

    출루율에 대해서도 같은 방식으로, 안타로 인한 출루의 효과를 제거하고 사사구로 인한 출루의 비율만 계산하는 순출루율(EOBP, Extra On-Base Percentage)을 계산할 수 있습니다만, 이 스탯은 널리 쓰이고 있지는 않아요!

    2017 시즌 NC 다이노스에서 규정타석(=경기수 x 3.1)을 채운 타자들 중 OPS TOP 3은 나성범, 스크럭스, 박민우 선수입니다.

    스크럭스 선수는 나성범 선수에 비해 타율이 낮지만 순장타율과 순출루율이 더 높지요. 다소 떨어지는 정확도를 볼넷을 고르는 능력과 장타력으로 상쇄하고 있음을 알 수 있습니다.

    박민우 선수는 두 선수에 비하면 순장타율이 많이 떨어지지만 대신 안타를 만들고 출루하는 능력이 발군이지요! ^^

    다음 시간에는 기본적인 투수, 수비 지표를 계산하는 법에 대하여 소개해 드리겠습니다.


    임선남

    대기업 사무직 직원으로 살다가
    엔씨소프트 데이터정보센터(DIC)를 거쳐
    현재 NC다이노스 데이터팀 팀장으로 재직 중입니다.
    스스로 야구 덕후라고 생각해 본 적이 없습니다.
    그냥 야구를 좋아하고 데이터를 좋아하다보니
    자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
    세이버메트릭스는 야구를 합리적, 객관적으로
    잘 이해하기 위한 노력으로 이러한 이해가
    야구를 더 재미있게 해 줄 수 있다고 믿습니다.

    대기업 사무직 직원으로 살다가
    엔씨소프트 데이터정보센터(DIC)를 거쳐
    현재 NC다이노스 데이터팀 팀장으로 재직 중입니다.
    스스로 야구 덕후라고 생각해 본 적이 없습니다.
    그냥 야구를 좋아하고 데이터를 좋아하다보니
    자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
    세이버메트릭스는 야구를 합리적, 객관적으로
    잘 이해하기 위한 노력으로 이러한 이해가
    야구를 더 재미있게 해 줄 수 있다고 믿습니다.