세이버메트릭스를 기반으로 야구 경기를 더 재미있게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’!
이번 글에서는 야구 데이터 분석의 근간이 되는 24가지의 상태(24 States)와 상태를 변화시키는 사건(Events)에 대해 알아봅니다.
2019.07.18 Data Science
세이버메트릭스를 기반으로 야구 경기를 더 재미있게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’!
이번 글에서는 야구 데이터 분석의 근간이 되는 24가지의 상태(24 States)와 상태를 변화시키는 사건(Events)에 대해 알아봅니다.
야구가 유난히 다른 스포츠에 비해 데이터 분석이 발달한 이유는 무엇일까요?
여러 가지 이유가 있겠지만, 가장 큰 이유는 경기가 연속적이지 않다는 것이 아닐까 싶습니다.
농구나 축구의 경우 파울이나 부상이 발생하는 순간을 제외하면 계속해서 경기가 쉼 없이 진행되지요. 하지만 야구는 아웃 카운트가 세 개가 되면 이닝이 종료되고 공수교대가 됩니다.
또한 타석과 타석 사이에도 경기의 흐름이 정지되는 순간들이 존재합니다. 한 타석의 결과가 정리되고 나면 다음 타석이 시작될 때까지는 경기 상황으로 인정되지 않죠.
예를 들어 2루타를 친 타자가 보호 장비를 풀어서 손에 들고 2루에서 1루 쪽으로 걸어가는 행위가 허용되는 것입니다. 이렇게 정지된 상황들이 존재하기에, 변화의 정도와 원인을 파악하여 분석할 수 있게 됩니다.
물론 타석과 타석 사이에도 코치와 선수들이 사인을 주고 받고, 수비수들이 위치를 옮기거나 주자가 리드 폭을 조정하는 등 여러 움직임이 있습니다.
수비 시프트로 1루와 2루 사이에 모여 있는 수비수들(출처: SPOTV2)
하지만 야구 경기에서 가장 중요한 것은 아웃 카운트 3개로 공격 기회를 잃어버리기 전에 주자를 홈까지 진루시켜 득점하는 것(수비 입장에서는 실점을 막고 아웃 카운트 3개를 확보하는 것)이므로, 보통은 아웃 카운트와 주자 유무, 득점 여부를 가지고 야구 경기의 상태(State)를 정의합니다.
아웃 카운트와 주자 유무를 고려할 때, 한 이닝 안에서는 어떤 상태들이 있을 수 있을까요? 수학 시간에 배운 경우의 수를 생각해 봅시다.
아웃 카운트가 3이 되면 공수 교대가 되어 이닝이 종료되므로, 진행 중인 이닝의 아웃 카운트는 0, 1, 2의 세 가지가 가능합니다.
아웃 카운트 세 가지 경우의 수
주자가 위치할 수 있는 누(Base)는 1루, 2루, 3루의 세 개가 있고요. 각각의 누에 주자가 있거나 없거나 두 가지의 경우가 있습니다.
주자 유무 경우의 수
따라서, 아웃 카운트와 주자 유무에 의한 모든 경우의 수는 3 x 2 x 2 x 2 = 24가 됩니다. 그래서 모두 24 가지의 상태(24 States)가 존재하는 것입니다.
설명을 덧붙이자면, 간혹 특수한 분석을 위해서는 아웃 카운트 3인 경우가 필요할 때도 있습니다. 하나의 플레이에서 득점과 동시에 세 번째 아웃이 발생하는 경우인데요.
예를 들어 2사에서 선행 주자가 득점에 성공하였으나 후속 주자가 주루사하여 이닝이 종료되는 경우입니다. 이런 경우를 별도로 분석할 필요가 있을 때에만 분리해서 봅니다.
그리고 이 상태를 변화시키는 행위를 사건(Event)이라고 합니다. 여기에는 점수 변동이 포함됩니다. 예를 들어 보겠습니다.
무사 주자 없음 상황에서 선두타자가 2루 땅볼로 물러났다.
→ 아웃 카운트가 0에서 1로 증가하였으므로 상태가 바뀌었습니다. 사건입니다.
1사 1루 상황에서 타자가 안타를 쳐서 1사 1, 3루가 되었다.
→ 주자 상황이 1루에서 1, 3루로 바뀌었으니 사건입니다.
2사 만루에서 투수가 볼넷을 허용하여 밀어내기로 득점했다.
→ 아웃 카운트와 주자 상황은 변함이 없으나 득점이 있었으므로 사건입니다.
투수가 1루에 견제구를 던졌다. 주자의 귀루가 빨라서 아웃되지 않았고, 1루수가 공을 다시 투수에게 던졌다.
→ 아무런 상태 변화가 없으므로 사건이 아닙니다. 만약 견제구가 1루수의 글러브를 벗어나서 주자가 2루로 진루했다면, 주자 상황이 바뀌어서 사건이 되겠지요.
다음 글에서는 ‘상태’와 ‘사건’을 활용해 어떻게 분석하는지 살펴보겠습니다.