운이 섞인 득실점과 진짜 경기력을 구분하는 축구 데이터 분석 입문
축구는 90분 동안 골이 두세 번밖에 나지 않는 저득점 종목입니다. 그래서 단 한 골의 행운이나 불운이 승패를 통째로 바꿉니다. 데이터 분석의 출발점은 바로 이 "운"을 걷어내고 팀의 근본적인 실력을 보는 것입니다.
스코어보드의 득실점은 결과일 뿐, 그 경기에서 어느 팀이 더 잘했는지를 항상 보여주지는 않습니다. 한 팀이 슈팅 20개를 때리고도 0골에 그치고, 상대가 단 한 번의 역습으로 이기는 일은 흔합니다.
이때 등장하는 지표가 기대 득점(xG, Expected Goals)입니다. xG는 각 슈팅이 들어갈 확률을 슈팅 위치·각도·상황(예: 페널티킥 0.76, 박스 밖 중거리 0.03 등)에 따라 매긴 뒤 모두 더한 값입니다. "이 정도 기회를 만들었다면 평균적으로 몇 골을 넣었어야 하는가"를 뜻합니다.
그래서 Pro-Analyzer는 한 가지만 믿지 않고 실제 득실점과 기대 득실점(xG·xGA)을 혼합합니다. 결과(40%)와 경기력(60%)을 섞어, 운에 휘둘리지 않으면서도 실제 흐름을 반영한 "순수 공격력·수비력"을 추정합니다.
같은 xG라도 경기를 지배한 팀과 운 좋게 기회를 잡은 팀은 다릅니다. 이를 구분하기 위해 주도권(Dominance) 지표를 봅니다.
| 지표 | 의미 | 해석 기준 |
|---|---|---|
| 평균 점유율 | 공을 소유한 시간의 비율 | 50% 초과 시 경기를 끌고 간다는 신호 |
| 유효슈팅(SOT) | 골문 안으로 간 슈팅 수 | 경기당 4개를 넘기면 실질 위협이 큼 |
다만 점유율은 함정이 있습니다. 수비 후 역습을 노리는 팀은 일부러 점유율을 내주기도 하죠. 그래서 점유율은 유효슈팅과 함께 봐야 합니다. 공만 돌리고 슈팅이 없다면 그 점유율은 위협적이지 않습니다.
같은 팀이라도 핵심 선수의 결장은 전력을 크게 흔듭니다. 선발 평균 평점이 높을수록, 결장이 적을수록 전력이 강합니다(평점 1점 차이는 대략 ±12%, 핵심 결장 1명은 약 −6% 수준의 영향). 또 통계적으로 홈 팀은 원정 팀보다 약 5% 정도 유리한 경향이 있어 이를 보정합니다.
이 값들을 넣으면 분석기는 양 팀의 기대 득점을 산출하고, 1만 번의 시뮬레이션으로 승·무·패 및 총득점(언오버) 확률을 계산합니다. 원리가 궁금하면 시뮬레이션·확률 기초를 참고하세요.