타율을 넘어 OPS·ERA·WHIP로 득점을 예측하는 데이터 분석
야구는 모든 종목 중 기록이 가장 풍부한 스포츠입니다. 타석마다, 투구마다 데이터가 쌓이죠. 세이버메트릭스는 이 방대한 기록을 통해 "어떤 지표가 실제 승리에 기여하는가"를 통계로 밝혀낸 분석 방법론입니다.
오랫동안 타자의 대표 지표는 타율(AVG)이었습니다. 하지만 타율은 안타만 셀 뿐, 볼넷으로 나가는 능력이나 장타력을 반영하지 못합니다. 단타 3개와 홈런 1개를 같은 무게로 보는 셈이죠.
그래서 현대 야구는 OPS(출루율 + 장타율)를 봅니다.
OPS는 팀 득점과의 상관관계가 타율보다 훨씬 높아, 타선의 폭발력을 가늠하는 핵심 지표입니다. 여기에 홈런·도루를 더하면 장타력과 기동력까지 보정할 수 있습니다.
득점을 막는 것은 투수의 몫입니다. 세 가지 지표를 함께 봅니다.
| 지표 | 의미 | 좋을수록 |
|---|---|---|
| ERA(평균자책점) | 9이닝당 내준 자책점 | 낮을수록 실점 억제 우수 |
| WHIP | 이닝당 출루(피안타+볼넷) 허용 | 낮을수록 주자 자체를 덜 내줌 |
| K/BB | 삼진/볼넷 비율 | 높을수록 위기 자초가 적음 |
ERA가 결과라면 WHIP와 K/BB는 과정에 가깝습니다. 볼넷을 남발하지 않고(K/BB 우수) 주자를 덜 내주는(WHIP 우수) 투수는 운이 나쁜 날에도 대량 실점 위험이 낮습니다. 또 한 경기는 선발(약 60%)과 불펜(약 40%)이 나눠 던지므로, 두 영역을 가중 평균해 팀 전체의 억제력을 계산합니다.
실책(Error)은 투수 기록에는 자책점으로 남지 않지만 실제로는 추가 실점을 부릅니다. 팀 평균 실책이 많을수록 상대의 기대 득점을 올리는 패널티로 반영해야 정확합니다.
타선의 생산력(OPS 중심)에서 출발해 상대 투수진의 억제력으로 깎고, 수비 실책으로 보정하면 양 팀의 기대 득점이 나옵니다. 야구의 득점은 "횟수" 데이터라 포아송 분포 기반 시뮬레이션이 잘 들어맞습니다. KBO 데이터는 전력 대시보드에서 한눈에 볼 수 있습니다.