DIPS

덤프버전 :

파일:다른 뜻 아이콘.svg
FIP은(는) 여기로 연결됩니다.
고양이 복막염(Feline infectious peritonitis)에 대한 내용은 고양이 복막염 문서
고양이 복막염번 문단을
고양이 복막염# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
참고하십시오.





1. 개요
2. 배경
3. 등장
4. 근거
5. 투수의 인플레이 제어
6. 과거를 설명하는 지표
7. ERA와의 비교
8. 스탯캐스트와 xwOBA
9. 요소별 분석 방식
10. 메인스트림 진출
11. 태생적 한계
12. 의문과 설명
12.1. 뛰어난 투수들은 BABIP를 어느 정도 낮출 수 있다
12.2. 맞혀잡는 유형의 투수를 저평가한다
12.3. 위기 관리 능력을 무시한다
12.4. ERA를 예측하기 위한 종속적인 보조 지표로 개발되었다
12.5. 통계적 아웃라이어가 존재할 수 있다
13. 보완
14. 평가
14.1. 오늘날 DIPS의 위치와 의의
15. 계산 방법
15.1. 보로스 맥크라켄의 DIPS
15.2. 톰 탱고의 FIP
16. 관련 문서



1. 개요[편집]


'DIPS'는 'Defense Independent Pitching Statistics (수비 무관 투구 기록)'의 약자로, 보로스 맥크라켄이란 사람이 만든 투수 평가를 위한 세이버메트릭스 기록의 하나다. 이것은 수비수들의 수비와 무관하다 볼 수 있는 기록인, 삼진, 사사구, 홈런만을 통해 투수의 기록을 재구성한 것이다. 또한 수비를 완전히 배제한다는 이 개념을 공유하는 모든 지표들에 대한 통칭이다.

비교적 익숙한 'FIP'이란 지표는 톰 탱고에 의해 고안된 DIPS 기반 평균자책점의 한 종류로, 'Fielding Independent Pitching(수비 무관 투구)'의 약자다.


2. 배경[편집]


투수의 승패와 평균자책점은 매우 오래 전부터 투수를 평가하는 대표적인 지표로 자리잡아왔으며, 현재까지도 그 위상을 (과거만큼 절대적이지는 않으나) 유지하고 있다. 하지만 동시에, 일찍부터 눈썰미 있던 일부 사람들은 해당 기록이 가지는 단점을 알아채고 비판해왔다.

투수를 평가하는 클래식 스탯 중 승패는 투수의 기량과 상관없는 팀 타선의 득점력이 큰 요인으로 작용한다는 명확한 단점을 가지고 있는만큼, 오랜 기간 동안 강한 비판의 대상이 되어왔다. 그 결과, 최근에 접어들어선 평가 지표로서의 가치는 거의 상실해 그 상징성만 유지하고 있는 상태이다.

그렇지만 평균자책점만은 여전히 강한 영향력을 유지하고 있다. 그러나, 평균자책점 역시 큰 문제를 내포하고 있다는 점은 승패와 마찬가지다. 평자점이 도입된 배경은 다음과 같다. 실점을 많고 적게 하는 것은 투수의 책임이 크긴 하다. 하지만 이걸 투수 혼자만의 책임으로 볼 순 없다. 수비는 투수와 동료 수비수들이 함께 하는 것이기 때문이다. 그렇기에 온전한 투수의 능력을 평가하기 위해선 동료 수비수들의 영향을 배제할 필요가 생긴다. 이를 해결하기 위해 도입된 개념이 자책점이다. 자책점은 수비수들이 평균 이하의 플레이, 즉, 실책을 저질렀을 때 해당 상황을 재구성해 투수에게 타당하다 여겨지는 점수를 부여한다.

언뜻 생각해보면 평균자책점이 합리적으로 보이지만 실상은 그렇지 않다. 문제는 실책이 기록자의 주관에 의해 결정된다는 것이다. 기록관의 실력과 무관하게 수비를 평가하는 일은 매우 어려운 일로, 평가가 기계적으로 이뤄질 수 있었다면 수많은 사람들이 오랜기간 고민해 올 필요가 없었을 것이다. 기록관이 판단하는 것은 그저 수비수의 실수가 있었는가 뿐이다.즉 수비수가 공을 실수없이 포구했는가, 송구와 그에 대한 포구가 실수없이 이뤄졌는가 정도에 그친다. 수비 범위가 좁아서 자연스럽게 무수한 안타를 허용하는 것이나, 반대로 중견수가 외야를 휘저으며 타자의 안타를 막아내는 것들은 고려하지 않는다.

그리고 2아웃 이후 실책이 나왔을 경우, 이후 투수가 해당 이닝에 몇 점을 더 내주건 그건 투수의 자책점이 아니게 된다는 점도 지적받는다. 실책이 없었다는 가정 상 해당 이닝은 이미 종료됐으므로 이후에 준 점수는 투수의 책임이 아닌 것으로 계산되는 것이다. 이런 방식은 엄연한 투수의 투구 내용을 표본에서 배제하는 것으로 적절하다고 보기 어렵다. 야수 실책 후에 계속해서 얻어터지는 투수와 침착하게 후속타자를 바로 잡아내는 뛰어난 투수가 똑같게 취급받는 것이다. 또한 주자를 남겨놓고 마운드에서 내려갔을 경우, 투수 본인과 상관이 없는 후속 투수의 능력에 의해 자책점이 달라질 수 있다는 점 또한 문제로 지적되고 있다.[1]

이렇듯 투수를 평가하기 위한 기존 지표들의 한계는 명확했고, 이를 극복하기 위한 많은 시도들이 있어왔다. 하지만 그럼에도 불구하고 '투수의 투구'와 '수비수의 수비'를 분리하는 일만큼은 난제에 가까웠는데, 이 둘은 매우 밀접하게 관련돼 있었기 때문이다.


3. 등장[편집]


그러던 1999년 11월 18일, 세이버메트리션들의 오랜 숙원이었던 투구와 수비의 분리에 대한 하나의 답이 세상이 나왔다. 보로스 맥크라켄이 당시 유즈넷 커뮤니티를 통해 DIPS를 발표했던 것이다.

이때 맥크라켄이 내놓은 답은 아예 무시하라는 것이었다. 그는 볼 인 플레이 상황이 됐을 때 그것이 안타가 되는 비율, 즉, 'BABIP(Batting Average on Ball In Play)'[2]는 투수의 능력과 무관하다. 그러므로 투수의 능력을 평가함에 있어 이를 배제해야 한다는 주장을 폈다.

이 내용은 당시로선 말도 안 되는 이야기처럼 여겨졌다. 이 때까지만 해도 야구계 전반은 물론, 세이버메트리션들 사이에서도 인플레이된 공이 범타가 되느냐 안타가 되느냐의 여부는, 투수의 기량이 크게 영향을 미친다는 것이 상식이었으니 당연한 일이었다. 이후 맥크라켄은 빌 제임스를 비롯한 많은 세이버메트리션들의 반발을 겪었고, 심지어 일부로부터는 조롱까지 받기도 했다. 그러나 얼마 지나지 않아 우연찮게 여러가지 요인이 맞아떨어지며 혁신적인 발견이라는 평을 듣게 되었다. 왜 그런 평을 들었고 그런 평가가 뒤집혔는지는 후술.[3]

현재는 '투수가 BABIP에 30% 정도 영향을 미친다'는 연구결과가 나온 상황이다.[4] 즉, DIPS 개념은 대전제부터 잘못되었다. 다만 수비의 비중을 줄이고 투수를 평가한다는 관점 정도는 여전히 유효하다.


4. 근거[편집]


맥크라켄이 그런 황당해보이던 주장을 한 것은 근거가 있었다. 맥크라켄의 연구 결과에 따르면, 삼진, 사사구, 홈런은 매년 투수 나름의 고유한 값을 유지하는 경향이 있었던 반면, BABIP는 그렇다고 볼 수 없었다. 투수의 BABIP는 매년 크게 변동했고,[5][6] 투수 고유의 값을 가지기 보단 리그 평균에 근처에서 머무르는 경향을 보였다. 그리고 투수의 BABIP가 높거나 낮은 경우는 팀 동료들의 기록 역시 비슷한 양상을 보였다. 또한 DIPS에 기반해 투수의 미래를 예측하는 편이 평균자책점을 이용하는 것보다 훨씬 정확했다.[7]

바로 이런 결과를 통해 맥크라켄은 투수의 BABIP에는 투수 기량 외적 요인, 즉 팀의 수비력과 구장, 그리고 운이 매우 큰 영향을 미친다는 결론에 도달했던 것이다.

왜 이런 결과가 나오는지 정확히 설명할 순 없었지만, 이런 결과가 나온다는 것만은 사실이었다. 처음 이 의견에 반대했던 세이버메트리션들도 시간이 흐를수록 맥크라켄의 주장에 동의하는 입장으로 변해갔다. 빌 제임스 역시 이후 이것을 일찍 깨닫지 못한 자신이 어리석었다며 입장을 철회했다.

이 설명에 따르면 랜디 존슨이 안타를 적게 맞은 것은, 그가 허용했던 타구들이 약해서라기보다는 애초에 그가 볼 인 플레이 상황을 적게 만들었기 때문인 것이다. 하지만 후술하겠지만 이는 후속 연구결과에서 뒤집혔다. 오히려 2010년대 후반부터는 높은 K/BB(K-BB%)와 함께 약한 타구 유도가 세이버메트릭스적 투수 분석의 양대 산맥이 되었을 정도이다(타구의 질에 대한 분석은 자연스럽게 HR% 같은 요소 역시 포함하게 된다.). 맥크라켄이 분석한 99, 00년의 데이터가 하필이면 랜디 존슨의 BABIP이 리그 평균에 수렴한 시기였던 것이 원인이다.[8] 맥크라켄이 왜 이런 결과가 나오는지를 정확히 설명 할 수 없었던 이유는 단순한 우연이기 때문이었다. 우연을 논리적으로 설명 할 수는 없으니... 세이버메트리션들도 맥크라켄의 입장에 반대 → 동조 → 수정으로 태도가 지속적으로 바뀌어갔다.[9]


5. 투수의 인플레이 제어[편집]


투수는 분명 BABIP를 결정하는 변인 중 하나다. 이건 보로스 이후 수많은 연구를 통해 밝혀진 사실이다. BABIP는 어느 시점에서 분명 안정화(stabilize)된다. 탱고, MGL, The Kitchen Utensil Guy 등 세이버메트리션 다수가 연구 결과에 근거해 이를 증명해왔다. 문제는 안정화되기까지 너무 오래 걸리며[10], MLB 레벨 투수 사이에서 그 재능의 표준 편차가 너무 작다는 점이다. <The Book: Playing the Percentages in Baseball>의 공저자이자 UZR로 유명한 세이버메트리션 MGL에 따르면, 리그 평균 BABIP가 .300[11]이라 가정했을 때, 실질적인 극단인 3 SD에 해당하는, 즉 BABIP 제어란 측면에서 시대를 대표할만큼 뛰어난[12] 투수가 있다면, 그의 진정한 실력(True Talent)에 의한 BABIP 추정값은 .279 수준이라고 한다.

한편, Russell A. Carleton[13]이란 세이버메트리션 또한 투수는 그 자신의 BABIP에 유의미한 영향력을 가진다며 자신의 연구 결과를 공개한 바 있다. 다음은 그가 제시한 타구별로 각 변인이 갖는 영향력과 다음 시즌 BABIP을 예측하는 근사식이다.

Batted Ball Type
Batter
Pitcher
Defense
League Mean
Ground Ball
47%
29%
13%
11%
Fly Ball/Pop Up
39%
26%
21%
13%
Line Drive
46%
28%
13%
13%

BABIP = 291 + .143 * BABIP * GB_rate – .057 * K_per_PA – .630 * BB_per_PA + 1.765 * BABIP * BB_per_PA

그리고 세이버메트릭스 커뮤니티에서 이와 관련해 많은 논의가 오고 갔다.

우선 톰 탱고는 타구 유형에 따른 차이를 고려할 거라면 BABIP보다는 wBABIP(BIP당 wOBA 또는 득점 가치)로 접근하는 게 더 나을 거란 점을 짚고 넘어갔다. 땅볼이 뜬공에 비해 BABIP가 높다는 건 주지의 사실이지만 단타의 비율이 높고 병살 유도가 가능하다는 득점 가치 측면에서의 상쇄 요소가 존재하기 때문.

논란이 됐던 부분은 "(지난 100번의 BIP 상황에서 .240을 기록했다면) 리그 평균(.300)보다 .240이 그 투수를 더 잘 설명한다"는 Carleton의 발언이다. 그간 많은 연구 결과들이 일관적으로 투수의 BABIP는 안정화까지 천 단위 수준의 큰 표본이 필요하다고 이야기해왔다. 저 발언을 그대로 받아들인다면 투수의 BABIP는 100 BIP, 대략 5번의 선발 등판만으로 안정화된다는 뜻이 된다. BABIP가 볼넷 비율처럼 빠르게 안정화된다는 다소 황당한 결과에 많은 이들이 회의적인 반응를 보였고, MGL은 결과 이전에 이 연구가 줄 수 있는 새로운 정보나 통찰이 무엇이냐며 반문했다. 이미 보로스의 발견 이후 10년이 넘는 기간 동안 수많은 연구가 있어왔고 투수가 BABIP의 변인이란 건 진작에 밝혀진 마당이었다.[14]


6. 과거를 설명하는 지표[편집]


톰 탱고에 의하면 FIP는 과거에 일어난 일을 설명하기 위해 만들어졌다. FIP가 홈런, 4사구, 탈삼진에만 집중하는 것은 출루율이 유형별 구분 없이 출루 여부 자체에만 집중하는 것, 장타율이 4사구를 무시하고 루타수에만 집중하는 것과 마찬가지다. 탱고는 FIP가 어느 정도 예측력을 가지는 건 맞지만 그런 목적으로 만든 지표가 아니라는 걸 매번 강조하고 있다.[15]


7. ERA와의 비교[편집]


ERA(또는 RA9)는 승계 주자 문제를 제외하면 실점 억제에 대한 투수의 모든 능력을 포함하고 있다. 하지만 거기에는 투수 본인의 능력 외에 동료 야수들의 수비를 포함한 엄청난 불규칙 변동이 섞여 있다.

결국 FIP를 선호한다는 건 일부 정보의 손실을 감수하더라도 불순물을 크게 덜어내자는 입장인 셈이고, 반대로 ERA 쪽은 모든 걸 취하기 위해 그것까지 감수하자는 입장인 셈이다.

수비 지표를 활용해 ERA를 보정하고자 해도 야수들의 수비력이 모든 경기에서 균등할 것이란 다소 비현실적인 가정이 필요하기에 도리어 왜곡을 불러올 가능성이 있다.[16] (흔히 위기 관리라 불리는) 시퀀싱[17]도 이 문제를 심화시킨다. 가령 똑같이 안타성 타구 하나를 건져내는 호수비가 나와도 만루 상황과 주자 없음 상황은 ERA가 받는 영향의 정도가 다르다.

보정에 의한 문제는 수비 지표가 올바르다는 전제 하에 표본이 쌓일수록 해결될 수 있는 문제다. 따라서 ERA vs FIP는 표본 크기의 문제로 볼 수 있다. 톰 탱고는 작은 표본에선 FIP가 우위지만 표본이 풀타임 선발 투수 기준 3시즌쯤 쌓이면 엇비슷해지고, 5시즌을 넘어가면 ERA가 낫다고 이야기한 바 있다.[18]


8. 스탯캐스트와 xwOBA[편집]


2015년 스탯캐스트의 등장은 고여있던 DIPS 연구에 새로운 동력을 불어넣었다. 스탯캐스트는 주관이 배제된 타구 속도(Exit Velocity)와 발사 각도(Launch Angle)란 완전히 새로운 정보를 제공했고, 이에 기반한 xwOBA(Expected Weighted On-base Average, 기대 가중 출루율)와 이를 ERA로 환산한 xERA는 이론적인 관점에서 이상적인 DIPS라 할 만하다.

하지만 실용적인 관점에선 이야기가 좀 달랐다. Baseball Prospectus가 제공한 연구 결과를 참고해 xwOBA와 FIP를 비교하면 다음과 같다.

Statistic
Correlation to same-year wOBA
Margin of Error (plus/minus)
xwOBA
0.83
0.014
FIP
0.81
0.014

같은 시즌의 성적, 즉 표준 wOBA[19]와의 상관 관계를 통해 지표의 타당성을 검증할 수 있다. 단, 누가 wOBA와 더 닮았는지 그 우열을 따지려는 목적이 아니라, wOBA가 추구하는 방향성(평균 득점 가치)을 공유하는지 확인하는 것이 목적이다. 여기서 두 지표는 유의미한 차이가 없다.

Statistic
Correlation to Y+1 wOBA
Margin of Error (plus/minus)
FIP
0.36
0.045
xwOBA
0.35
0.047

비교 대상을 당해가 아닌 이듬해 wOBA로 바꿀 경우 지표의 예측력을 평가할 수 있다. 두 지표 모두 미래 성적을 예상하기 위한 지표가 아니란 건 개발자인 톰 탱고가 분명히 한 바 있다. 다만, 전년도에 A보다 B의 기량이 더 뛰어났다면 이듬해에도 B의 기량이 더 뛰어날 가능성이 높다. 뛰어난 예측력은 선수 본연의 기량을 잘 반영하는 지표가 갖는 대표적인 수반 효과다. 1999년 발표된 DIPS가 당대의 통념을 정면에서 반박했음에도 지지를 얻을 수 있었던 이유이기도 하다. 어쨌든 여기에서도 무승부다.

결국 모든 타구를 완벽하게 측정해 평가에 반영한 xwOBA가 모든 타구를 완전하게 무시하는 FIP를 누르지 못한 것이다. FanGraphs의 연구톰 탱고의 연구도 비슷한 결론을 내렸다.

원인은 스탯캐스트로 측정되는 투수의 타구 억제 능력이 유지하기 힘든 스킬이거나 운에 가까운 것이었기 때문이다. 타자들은 분명 본인들의 타구질을 제어할 수 있었지만 투수들의 허용 타구질은 연도별로 심하게 널뛰었다. 전년도 타구 억제가 매우 뛰어났던 투수들, 형편 없던 투수들을 그룹화하여 이듬해 기록을 확인해보면 두 그룹 모두 평균으로 강하게 회귀하는 경향을 보인다.

물론 그럼에도 xwOBA와 FIP 둘 중 하나만을 선택해야 한다면 답은 xwOBA일 것이다. 이론적으로 완벽한 xwOBA가 기대와 달리 기존 DIPS 지표들을 압도하지 못하는 건 그것이 불완전하거나 흠결이 있어서가 아니다. 애초에 DIPS 이론이 추상적인 바탕에서 나온 게 아닌 경험으로 깨달을 직관이기 때문이다. 현실을 객관적 숫자로 반영한 xwOBA인데 현실의 경험에서 영감을 얻어 만들어진 DIPS와 호응하는 건 예견된 결과다. 톰 탱고는 xwOBA, FIP, wOBA 모두 볼 가치가 있다는 의견을 제시했다.


9. 요소별 분석 방식[편집]


DIPS는 세이버메트리션들에게 대상을 적절하게 요소별로 나눠 분석하는 일의 중요성을 알려줬다.

제프 파산(Jeff Passan)이 톰 탱고(Tom Tango)에게 DIPS에 관해 물었을 때 탱고는 피트 파머(Pete Palmer)의 선형 가중치(Linear Weights), 기대 득점(Run Expectancy)과 함께 DIPS를 세이버메트릭스의 가장 큰 발견으로 평했다.


10. 메인스트림 진출[편집]


톰 탱고의 FIP는 득점 가치(Run Value)를 이용해 보로스 맥크라켄의 DIPS ERA 계산 절차를 간단한 수식 하나로 줄여버렸다. 덕분에 대중성이란 측면에서 큰 강점을 갖게 됐다. 사실 탱고가 처음 고안했을 당시의 FIP는 상수가 없는 9이닝당 득점 가치였으나, 훗날 상수를 통해 ERA 스케일로 보정함으로써 득점 가치의 개념을 모르는 사람들도 직관적으로 이해할 수 있는 지표가 됐다. FanGraphs에선 FIP를 주된 투수 지표로 활용하며 WAR 계산에도 사용한다. Baseball-Reference.com은 2014년부터 표준 피칭 기록에 FIP를 포함해 보여주고 있으며, 코빈 번스의 사례 등 미디어에서 FIP를 인용하는 일은 이제 대수로운 일이라 보기 어려워졌다.


11. 태생적 한계[편집]


DIPS는 태생적으로 지나치게 급진적이어서 한계가 명확한 이론이었다. 모든 논리가 BABIP 투수 통제불가론에 기반을 두고 있는데, 그 논리적 기반이 잘못되면 이론 자체가 신뢰를 잃을 위험성이 너무 컸다. 상식적으로 한가지 지표만으로 투수의 성적을 평가 할 수 있다는 발상 자체가 비정상적이었다.

애초에 세이버메트릭스는 클래식 스탯만으로 선수의 성적을 평가할 때 발생하는 문제점을 통계를 이용해서 다각도에서 분석하려는 목적에서 시작한 것이다. 그런데 DIPS는 세이버메트릭스의 기존 접근과는 달리 투수의 성적을 획일적으로 한가지 지표만으로 평가하자는 상반된 이론이었다. 지금까지 그 주장이 당연하게 받아들여져 온 것이 오히려 더 신기한 상황이었다. 페드로 마르티네스, 랜디 존슨, 그렉 매덕스와 같은 특급 투수들의 BABIP이 패전처리 투수와 차이가 없다는 급진적 발상과 제시된 자료가 마침 자료 부족과 우연이 묘하게 겹친 결과로 그럴싸하게 맞아떨어졌고, 한가지 지표로 모든 투수의 성적을 평가할 수 있을 것이라는 근거없는 믿음이 불러온 결과였다.

12. 의문과 설명[편집]


DIPS 이론은 급진적인만큼 매력적인 부분이 많아서 많은 추종자와 반발자를 만들어냈다. 특히 투수의 미래 성적을 예측할 수 있다는 DIPS 속성은 추종자들을 열광시켰다.[20] 그 결과 FIP 주장에 대한 반론이 제시될 때마다 통계적 오차, 아웃라이어, 근거 없는 몇몇 사례라는 식으로 무시했다.

현재 DIPS 이론은 많은 부분에서 문제가 발견되어 수정되고 있으며 그만큼 위상도 많이 낮아진 상태이다.

12.1. 뛰어난 투수들은 BABIP를 어느 정도 낮출 수 있다[편집]


삼진 능력이 뛰어난 투수의 BABIP가 낮은 경향이 있긴 하다. 하지만 이는 무시할만한 수준이다.

스트라이크 존 가장자리로 잘 제구된 공의 BABIP가 낮은 것도 사실이다. 하지만 항상 보더라인으로만 공을 던질 수는 없기에 유의미한 차이를 낸다고 보긴 어렵다.

무엇보다 리그의 규격을 초월한 것처럼 보여지던 전설적인 투수들이 좋은 반례다. 이들은 대부분은 거의 매년 훌륭한 DIPS를 꾸준히 유지한 반면, BABIP에서 만큼은 꾸준하지 못했고, 특별하지 못했다.

-

이 주장은 거짓으로 드러났다. 전설적인 투수들 중 BABIP이 유의미하게 낮은 선수는 적지 않다.


상기 주장에 대한 반박이 BABIP 항목에 적혀 있다. 클레이튼 커쇼 같은 플러스 피치급 패스트볼을 보유한 투수는 BABIP을 낮출 수 있다. 삼진을 많이 잡는 선발 투수와 마무리 투수의 BABIP은 유의미하게 낮다. 초기에는 위 주장은 맞는 것처럼 보였지만, 후속 연구로 자료가 축적되면서 뛰어난 투수들은 BABIP을 유의미하게 낮출 수 있음이 밝혀졌다.

12.2. 맞혀잡는 유형의 투수를 저평가한다[편집]


삼진은 적지만 좋은 성적을 내는, 소위 '맞혀잡는 투수'들을 저평가한다는 의문을 가지는 사람이 많다. 하지만 DIPS는 단순히 삼진을 최고로 여기는 게 아니다. 볼넷과 함께 홈런도 평가에 포함된다. DIPS는 삼진을 많이 잡지 못하더라도 볼넷과 홈런을 억제할 수 있다면 훌륭한 투수가 될 수 있다는 것을 보여준다.[21]

'FIP가 땅볼투수를 저평가한다'고 말하고 싶다면, 땅볼 비율이 높은 투수들이 BABIP가 낮은 경향이 있다(또는 ERA가 FIP보다 낮은 경향이 있다)는 걸 보여줘야 하는데, 당연히 그런 결과는 안 나온다.

대체로 그런 주장을 하는 사람들은, 땅볼 비율이 높으면서 BABIP가 유독 낮았던 케이스를 몇 개 들고와 이야기하는 게 전부다. 찾자면 삼진을 많이 잡으면서 BABIP가 낮았던 경우도 찾을 수 있고, 같은 방식으로 'BABIP은 삼진을 많이 잡는 투수를 저평가 한다'고 주장할 수도 있을 것이다. 물론 어느 쪽이든 제대로 조사하면 유의미한 경향은 안 나온다.

덧붙이자면, 땅볼투수들에게선 ERA가 낮아보이는 '착시현상'을 포착할 수 있는데, 이 부분이 저러한 통념에 기여했을 수도 있다. 똑같은 수비지원 하에서 똑같은 이닝, 똑같은 실점을 기록한 땅볼투수와 뜬공투수가 각각 있을 경우, 자책점이 더 적은 쪽은 땅볼투수일 공산이 크다. 땅볼투수들은 속된말로 자책점을 '세탁'해 비자책점으로 만드는 일이 다른 투수들에 비해 잦기 때문이다. 뜬공에 비해 땅볼 에러가 많은 건 수비의 능력과 별개로 당연한 현상이다. 보통 리그 평균의 자책점/실점 비율은 0.93 정도지만, 땅볼투수들의 평균은 그보다 더 낮다.

다만 1사 1, 3루 등 어떤 상황에서는 삼진보다 땅볼유도가 병살을 만들어내기에 좋기 때문에 일부러 땅볼을 유도하는 경우가 많은데, 이런 것은 FIP가 반영하지 못하는 부분이다. 또한 이렇게 땅볼유도를 하는 상황들은 보통 투수에겐 위기상황인 경우가 많기 때문에 바로 아래의 항목과도 연관이 있다.


상기 주장에 대한 반박이 BABIP 항목에 적혀있는데, 요약하자면 '땅볼이 된 타구는 장타가 될 확률이 낮다'는 것이다. 역시 BABIP 항목에 있지만, 땅볼로 맞춰잡는 투수들은 수비가 쉬운 땅볼을 유도할 수 있고 그렇게 한다. 수비가 쉬운 타구를 유도하는 것도 투수의 능력이며, 이것조차 수비빨이라고 한다면 다른 구기 스포츠와 마찬가지로 야구도 팀 플레이라는 사실을 잊어버린 것이다. 투수의 능력을 제대로 평가한다는 명분을 핑계로 야구를 개인 스포츠화 시켜서는 안된다. 야구는 한 명의 타자와 아홉 명의 야수가 교대로 겨루는 팀 스포츠이며 축구의 승부차기와 같이 1:1로 대결하는 같은 룰 같은 것은 애초에 없다. 팀 스포츠에서 동료의 능력을 활용하는 것도 그 투수의 능력이다.

12.3. 위기 관리 능력을 무시한다[편집]


DIPS도 각각의 이벤트들의 가치를 종합한 컴포넌트 ERA로 볼 수 있으므로 이 말은 맞는 말이다. 세이버메트릭스 스탯에서는 위기관리 능력을 평가하는 것에 대해 비관적인 입장이다. 이는 클러치 히터 논쟁이 좋은 참고가 될 것이다.


상기 주장에 대한 반박이 클러치 히터 항목에 적혀 있다. 아직까지는 투수의 위기 관리 능력을 평가하는 설득력 있는 평가 지표가 없는 것은 맞다. 하지만 모든 투수의 위기 관리 능력이 동일하다는 이야기는 아니다. '평가 지표가 없다'는 것과 '그런 능력은 없다'는 같은 의미가 아니다. 주자 유무에 따른 투수의 피장타율 차이만 보더라도 무시하기에는 투수별 편차가 상당히 큰 편이며, 땅볼투수의 경우 피장타율이 유의미하게 낮은 경향을 보였다. 투수의 위기 관리 능력이란 존재하지 않는다고 주장하는 것은 위험한 발상이다.

12.4. ERA를 예측하기 위한 종속적인 보조 지표로 개발되었다[편집]


사람들이 DIPS의 미래 예측력이 뛰어나다는 점을 잘못 받아들여, DIPS가 미래를 예측하기 위해 설계됐다고 생각하는 경향이 있다. DIPS의 목적은 미래 예측이 아니라 이미 일어난 일에 대한 평가이고, DIPS가 예측력이 뛰어난 건 그저 기량 외적 노이즈를 제거해서 투수의 기량을 더 잘 파악한 결과일뿐, 그걸 위해 설계됐기 때문이 아니다.

DIPS는 '무엇이 일어날까?'에 대한 답이 아니라 '무엇이 일어났어야 했는가?'에 대한 답이라고 볼 수 있다.


위쪽 문단에서 DIPS의 예측성을 이야기하던 추종자들이 뒤늦게 주장을 바꿨다. 한마디로 비겁한 변명이다. 이 말대로라면 그동안 ERA-FIP 격차가 많이 나던(특히 FIP가 더 높게 나오던) 투수들을 폄하한 것은 자기모순적인 행위가 되어버린다. 미래를 예측하기 위해 만든 스탯이 아닌데, ‘격차가 많이 나네? 올해 뽀록이었으니 내년에는 성적 나빠질 것이다!’ 라며 미래를 예측했었으니 말이다.

DIPS는 ERA를 대체하기 위한 목적으로 만들어졌다. 투수가 BABIP을 통제 할 수 없기때문에 현재의 성적이 좋거나 나쁘더라도 결국 FIP로 수렴할 것이라는 예측성이 DIPS 이론의 핵심이었다. 따라서 세이버메트리션들은 투수의 성적이 뛰어나더라도 DIPS를 근거로 플루크 시즌이라고 폄하하거나, 반대로 성적이 나쁘더라도 DIPS를 근거로 결국 회복될 것이라는 낙관론을 펼쳐왔다. 그런데 지금에 와서 예측성이 아니라 '무엇이 일어났어야 했는가?'로 후퇴하는 포지션을 선택한 것은 어딜 어떻게 보더라도 도망내지 말바꾸기이다.[22]

DIPS는 투수가 BABIP을 통제 할 수 없다는 급진적 이론을 바탕으로 '수비무관 평균자책점'이란 개념으로 탄생하였다. 투수가 30% 정도 BABIP을 통제 할 수 있다면 이는 결코 적은 수치가 아니며, 더 이상 DIPS 성적만을 근거로 어떤 투수의 성적을 판단하는 것은 위험하게 됐다. 즉, DIPS는 투수를 평가하는 클래식 스탯인 ERA를 대체해야 할 지표로 화려하게 등장했지만, 지금은 투수를 다른 관점에서 분석하는 종속적 보조 지표로까지 위상이 떨어진 것이 현실이다.

12.5. 통계적 아웃라이어가 존재할 수 있다[편집]


DIPS 역시 완벽할 순 없다. 실제 후속 연구에 의해 BABIP에 투수가 전혀 영향을 줄 수 없는 것은 아니라는 결론이 나온 바 있다.#

||<table width=350px><rowbgcolor=#3D414D> 타구 종류 || 타자 || 투수 || 수비 || 리그 평균 ||

||<rowbgcolor=#ffffff> 땅볼 || 47% || 29% || 13% || 11% ||

||<rowbgcolor=#ffffff> 플라이볼 || 39% || 26% || 21% || 13% ||

||<rowbgcolor=#ffffff> 라인드라이브 || 46% || 28% || 13% || 13% ||

대부분 아웃으로 연결되는 내야뜬공을 많이 양산한다던가, 투수 본인의 수비력이 뛰어나다던가, 투수 역시 BABIP에 영향을 줄 수 있다. 앞서 언급했듯이 위기 관리 능력을 아예 무시한다는 점 또한 아웃라이어를 만드는 요인으로 작용한다.

명예의 전당에 입성한 300승 투수 톰 글래빈이 대표적인 예라고 할 수 있다. 그는 극단적인 경계선 투구와 자기 자신의 뛰어난 수비력, 그리고 위기 관리 능력을 통해 DIPS에 비해 더 좋은 결과를 낸 대표적인 투수였다. 또한 맷 케인제러드 위버, 그리고 크리스 영도 DIPS의 아웃라이어로 꼽힌다. 이 투수들은 내야뜬공을 많이 양산함으로써 오랜 기간 평균에 비해 BABIP를 낮게 유지해왔다. 그리고 필 니크로, 찰리 허프, 팀 웨이크필드 같은 너클볼러들도 빼놓을 수 없다.[23]

위의 긍정적인(?) 아웃라이어들과 반대로 커리어 내내 평균자책점이 DIPS보다 높은 투수도 있다. 예를 들어 리키 놀라스코. 누적이닝이 1,800이닝을 넘는 데도 양쪽의 차이가 0.6에 달해서 DIPS의 취약점을 거론할 때 자주 (부정적) 예시로 나온다.

이렇듯 DIPS 역시 완전할 순 없고, DIPS가 놓치는 부분에서 뛰어난 모습을 보이는 투수들이 종종 있는 것이 사실이다. 하지만 주의해야할 점은, 근래의 세이버메트리션들이 DIPS 외에 우리가 놓칠 수 있는 부분을 무시하자는 입장인 것은 결코 아니란 점이다. 팬그래프에서 제공하는 투수 WAR이 철저하게 DIPS에만 기반해 투수를 평가하는 것을 두고, 세이버메트릭스는 DIPS 외의 부분을 완전히 무시한다고 생각하는 것은 착각이다.[24]

그럼에도 투수를 평가함에 있어 DIPS만 보는 것은 한 두 시즌 단위의 표본에서 DIPS가 훨씬 우수하면서도, 커리어 전체의 관점에서의 정보 손실도 크지 않기 때문이라고 할 수 있다.

그리고 팬그래프의 WAR은 하나의 기준일 뿐이지 그들이 주장하는 절대적인 가치가 아니다. 위키나 기록을 활용해 가치 판단을 내리는 건 결국 보는 사람에 달려있다. 실제 팬그래프는 기본 DIPS 기반 WAR과 함께 BIP-Wins와 LOB-Wins라는 DIPS 외의 요소를 설명하는 지표를 함께 제공함으로써 이용자들의 판단을 돕고 있다.


상기 주장이야말로 DIPS 이론의 문제점을 극명하게 드러내주는 사례인데, BABIP 항목에 들어가보면 '900 이닝 이상 투구한 투수 중에서 BABIP이 유의미하게 낮은 경우가 1/3에 달한다'는 자료가 있다. 전체 대상의 1/3을 통계적 아웃라이어라고 부르지는 않는다. 이 숫자는 BABIP에 투수가 영향을 준다는 비율과 유사한 수준이다.[25] 톰 글래빈을 DIPS를 반박하는 사례로 들었을 때, 세이버메트리션들은 아웃라이어라고 주장했었고, 지금은 그 아웃라이어의 숫자가 30%를 넘고 있다. 즉, DIPS가 나머지 70% 투수를 평가하는데 유의미한 지표가 될 수 있지만, 30%의 아웃라이어(?)[26]에 대해서는 오히려 평가를 왜곡시키게 된다.


12.6. KBO 리그와 FIP[편집]


KBO 리그에서는 FIP 같은 스탯이 크게 작용하지 않으며 FIP와 ERA 사이의 확연한 차이를 커리어 내내 유지하는 투수가 적지 않다. 이를 분석하기 위해서 2009년~2018/9/8에 500이닝 이상 투구한 투수를 기준으로 RA9와 FIP-ERA의 회귀분석을 해보면 R제곱이 0.3164가 나온다. 큰 값은 아니지만 무시할 수 있을 정도의 값도 아니다.

이러한 이유는 현재 사용하는 DIPS가 MLB를 기준으로 만들어졌기 때문이다. 각 항의 계수가 KBO 리그에서는 다를 수 있는데 똑같이 사용했기에 이러한 현상이 발생했다는 것. 물론 최근 10년간 500이닝 이상이라는 기준은 빠른 계산을 위해 범위를 조금 좁혀서 선택한 것으로 자의성이 포함되어 있고 스탯티즈는 데이터 export를 지원하지 않기 때문에 더 많은 표본으로 계산을 하는데 어려움이 있으나 어느 기간이든 일정 이상 이닝으로 기준을 잡을 경우 RA9가 낮은 투수들은 FIP-ERA가 양수거나 작은 음수값을 가지고 RA9가 높은 투수들은 FIP-ERA가 음수거나 작은 양수값을 가지는 경향을 일정하게 나타낸다는 점에서 KBO 리그에서 공통적으로 나타나는 현상으로 볼 수 있을 것 같다.

사실 KBO에서 잘 안 맞네 어쩌네 할 것도 없는게, 현재는 MLB에서도 의미를 거의 상실한 스탯이다. 몇 년 전만 해도 중계에서 FIP를 언급하고 사이 영 상 투표도 FIP 기반으로 했다는 기자들이 있었지만 이제는 중계에서 거의 언급도 되지 않으며 저걸 기반으로 사이영 상 투표를 하는 기자도 없다. 말하자면 KBO라서 안 맞았던 게 아니라 처음부터 대전제가 틀린 이론을 갖다 적용했으니 KBO에서 맞지 않았던 것. 애초에 FIP 자체가 ERA를 설명하고 예측하는데 이제는 설사 단기간이라고 해도 더 이상 그리 유용한 지표가 아니다. 보다 진보된 DIPS 스텟을 보거나, 라이트 팬들의 경우는 RA9를 보는 것이 가장 확실할 듯 하다.[27]


13. 보완[편집]


당연히 DIPS 또한 부족한 부분을 보완하기 위한 여러 노력이 있어왔다. 내야 뜬공을 양산하는 투수들을 평가하기 위해 그것을 계산에 포함한 'IFFIP(In Field Fly Fielding Independent Pitching)'란 지표가 소개되기도 했고, 아예 타구의 유형을 반영한 'tRA(True Runs Average)' 같은 지표도 있다.

그러나 이런 지표들 역시 DIPS의 또 다른 갈래일 뿐으로, DIPS의 불완전함을 극복했다고 보긴 어렵다. IFFIP은 특정 유형을 표적으로 삼은 지표에 가깝고, tERA는 타구 분류가 완벽하지 않을 뿐더러 라인드라이브 비율은 투수의 능력이라고 보기 애매한 구석이 있다.

결국 가지고 있는 정보가 거기서 거기라면, 앞서 언급했던 표본에 따라 DIPS 외의 영역을 적절히 섞어보는 것이 좋은 선택이 될 것이다. 캐머런 외에도 톰 탱고는 7-8년 정도의 장기간의 투수들을 대상으로 기량을 평가하기에는 DIPS보다 실점이 더 좋다는 취지의 말을 했고, ZiPS 프로젝션의 개발자인 Dan Szymborski 또한 자기는 투수를 평가함에 있어 3200타석(이닝으로 대략 800이닝)을 기준으로 DIPS와 수비를 보정한 실점를 50%씩 보는 것을 선호한다고 한 바 있다.[28]


14. 평가[편집]


승과 더불어 투수의 능력을 나타내는 대표적인 지표로 여겨졌던 ERA에 대한 패러다임을 바꾸는 기폭제였으나, 정작 그 자신은 자리잡지 못했다.[29] 현 시점 DIPS의 위치는 상당히 떨어졌고, 오히려 BABIP이 운과 실력을 분리해서 보려는 시도에 더 적합한 상황이다.[30]

해당 스탯이 한창 각광받았던 시기에는 맥스 슈어저, 잭 그레인키 등의 현역 투수들이 해당 지표에 호의적인 의견을 피력하기도 했으며, 2010년 무렵부터는 사이 영 상 투표에서 DIPS를 근거로 표를 던지는 기자들이 늘어나기도 했다. 특히 2014년 AL 사이 영 상 투표에선 코리 클루버펠릭스 에르난데스를 제치고 수상할 수 있었던 원동력 중 하나로 작용했다고 볼 수 있다.[31]

그러나 시간이 지나면서 세이버매트리션 사이에서도 예전만큼의 위상은 없는 스탯이 되어버렸다. 사실 FIP 자체가 간편함을 위해 쳐낸 잔가지가 제법 많은 스탯이고, 표본이 충분한 배테랑 투수의 전체 커리어 평가는 오히려 ERA가 더 낫다라고까지 여겨진다.[32] 시즌 별 변동성이 커서 FIP에서 쳐낸 요소들이 수 년의 커리어가 쌓이면 안정화(stabilize)되기 때문.[33]

이제 세이버매트리션들은 "이 투수는 ERA와 FIP의 차이가 크니 운빨! 수비빨!" 같은 소리 더 이상 못 한다.[34] 이제 FIP는 ERA를 대체하는 개념이라기보다 다른 각도에서 분석하는 보조지표일 뿐이다. 어떤 투수의 ERA와 FIP가 유의미하게 차이가 난다면 그 원인을 분석해야하며, 예전처럼 ERA를 무시하고 FIP가 옳다는 식으로 접근해서는 안된다. ‘BABIP 투수 통제불가론’이란 대전제가 무너졌으니 당연한 것인데, 투수가 BABIP을 어느 정도 통제 할 수 있다면 수비를 무시하는 것이 오히려 통계를 왜곡하는 결과가 되어버리기 때문이다.

참고로 코빈 번스가 2021년 사이영상 위너가 될 수 있었던 이유가 FIP였으며 여전히 강력한 지표라는 일부 주장이 있는데, 전혀 사실이 아니다. 그들이 주장하는 코빈 번스와 잭 휠러의 성적을 상세히 비교해보면 다음과 같다.

대상
승패
이닝
탈삼진
ERA
FIP
fwar
bwar
코빈 번스
11승(14위) 5
167(19위)
234(3위)
2.43(1위)
1.62(1위)
7.5(1위)
5.6(6위)
잭 휠러
14승(5위) 10패
213⅓
247(1위)
2.78(5위)
2.59(2위)
7.3(2위)
7.5(1위)
차이[35]
-3승 -5패
-46
-13
-0.35
-0.97
+0.2
-1.9

한 눈으로 보기에도 두 선수의 성적차이는 어느 한 쪽이 큰 폭의 우세가 아님을 알 수 있다. 코빈 번스가 ERA, 이닝에서 잭 휠러가 각기 큰 폭으로 우세하며, 탈삼진은 미세하게 잭 휠러가 우세한 정도일 뿐이다.[36] 코빈 번스가 사이영상 위너가 된 주된 요인은 FIP 옹호론자들의 주장과는 달리 '피칭 세부 지표'였다는 주장이 있다.해당 기사

코빈 번스는 ①탈삼진과 볼넷 비율(6.88), ②탈삼진 비율(35.6%), ③FIP(1.63), ④95마일 이상 강습타구 비율(2.9%)에서 메이저리그 전체 1위였고, 시즌 개막 후 ⑤무 볼넷 58 탈삼진(역대 1위), ⑥10타자 연속 삼진처리(역대 타이) 등의 성적을 냈다. 세부 지표는 물론 상징적인 의미를 갖는 피칭의 임팩트가 훨씬 컸으며.

반면 잭 휠러는 20승과 같은 상징적 의미가 있는 성적을 거두지 못했다. 사이영상은 통산 511승을 거둔 사이영을 기리기위해 제정된 상이라서 아직도 최다승에 대한 남다른 의미가 있지만, 두 선수의 성적은 오십보 백보 수준의 차이였을 뿐이다. 즉, FIP 옹호론자들의 주장과는 달리 코빈 번스의 FIP 성적은 비슷한 스탯의 선수 중에서 사이영상 위너를 선택하는 한가지 참고 지표였을 뿐이고, 기존에 이 문단에서 주장했던 것처럼 FIP 1위이기 때문이 아니라는 것이다.

이는 상당히 모순된 주장으로 애초에 피칭 퀄리티가 좋으면 FIP도 좋을 수 밖에 없다. 높은 SO%로 인플레이 상황을 줄이고 볼넷도 적게 주는데 이 투수의 FIP가 나쁠 수 있을까? 번스가 휠러에게 크게 뒤떨어지는 5점대 bwar를 기록한 반면에 50이닝 가까이 차이나는 이닝 때문에 누적을 쌓기 힘들었지만 fwar에서 근소 우위를 점한 이유도 bwar은 RA9, fwar은 FIP기반이기 때문이다. 비슷한 성적의 선수 중에서 선택지를 고를 때 하나의 참고 지표였을 뿐이라는데 애초에 비슷한 fwar은 번스의 낮은 FIP 덕에 만들어 진 것이다.

FIP와는 상관없이 볼삼비랑 삼진율만 보고 투표했으니 FIP랑 투표 결과는 관계 없어요~ 하는 소리는 볼삼비랑 삼진율은 신경 안 쓰고 FIP만 보고 투표했어요~ 만큼이나 덜떨어진 소리이다. 둘은 전혀 독립적이지 않기 때문이다. 당해 번스의 FIP가 워낙 기록적인 수치였기에 모르기도 힘들었겠지만 만일 실제 FIP 수치를 눈으로 확인하지 않았더라도 좋은 피칭 퀄리티를 보인 투수에게 투표했다는 것은 간접적으로 좋은 FIP를 가진 투수에게 투표하였음을 의미한다.

삼진이 고평가를 받는 이유는 낫아웃을 제외하고는 무조건 아웃 카운트 하나가 올라가고 주자의 진루도 일어나지 않기 때문이다. 인플레이 상황을 만들지 않기에 변수가 없다. 여기서 볼넷 적게 줘서 확실한 출루 안 시키고 확실한 실점인 홈런 적게 쳐 맞는 선수를 피칭 퀄리티 좋은 투수라고 부른다.

그리고 그 투수는 낮은 FIP를 기록했을 것이다.


14.1. 오늘날 DIPS의 위치와 의의[편집]


DIPS는 '투수가 BABIP에 전혀 영향을 미칠 수 없다'는 전제하에 투수를 삼진, 볼넷(+사구), 홈런만으로 평가하자는 수비무관 평균자책점 개념으로 시작했는데, BABIP에 대한 투수의 일부 통제력이 재발견되면서 위상에 타격을 받았으며, ERA와 RA라는 클래식 스탯은 지금도 여전히 주요한 스택이다.

물론 그렇다고 DIPS 스탯을 '이도 저도 아닌 것', '필요 없는 것'으로 보는 반대쪽 극단도 잘못된 것이다. BABIP을 투수의 완전한 통제 영역으로 보는 것이나, 완전히 투수의 통제 영역 바깥에 있는 것으로 보는 것이나, 양자 모두 극단론인 건 같다. 당연히 투수의 기량 역시도, BABIP을 투수 통제 영역으로 전제하는 ERA와 투수 통제 바깥으로 전제하는 FIP 사이의 어딘가에 위치해있는 것이다. ERA만 보거나 FIP만 보는 것보단 당연히 둘 다 보는 게 나으며, 특히 1시즌에서 ERA만 보거나 통산에서 FIP만 보는 건 상당히 극단적인 오류이다.

사실 FIP와 ERA의 이 상호보완적 관계가 딱히 특별한 건 아니다. 가령 야구팬들은 투수의 비자책점이 '불운'과 '실력' 사이의 무언가라는 걸 상식으로 잘 알고 있다. RA와 ERA가 상호 보완적이라는 건 설명만 들으면 누구나 납득한다. 그런데 유독 FIP와 ERA의 관계에서만은, "ERA는 볼 필요가 없다"라느니 "FIP는 쓰잘데기 없는 것"이라느니 하는 극단론이 쉽게 돌아다닌다.

그렇다면 ERA가 더 좋은 투수 A와 FIP가 더 좋은 투수 B 중 누가 더 나은 투수인가? 당연히 그건 미지의 영역이다. 단지, 샘플 이닝이 많을 수록 A에 적을 수록 B에 힘을 실어주는 개연적인 추정만이 가능할 뿐이다.

15. 계산 방법[편집]



15.1. 보로스 맥크라켄의 DIPS[편집]


보통 DIPS라 하면 수비와 무관하게 계산된 평균자책점을 떠올리지만, 아주 엄밀히 따졌을 때, 이는 DIPS의 속해있을 뿐 DIPS 그 자체는 아니다. 삼진, 사사구, 홈런을 통해 계산된 투수의 이닝, 피안타, 심지어 승패까지도 모두 DIPS라고 할 수 있다.

맥크라켄이 설명한 DIPS를 계산하는 과정은 대략적으로 이렇다.

1. 파크팩터를 이용해 볼넷, 삼진, 홈런을 보정.

2. 보정된 기본 스탯들을 바탕으로 DIPS 피안타, DIPS 이닝을 계산.

3. 계산된 스탯들을 XR에 적용해 투수의 DIPS ER을 계산.

4. DIPS 이닝과 DIPS ER을 이용하여 DIPS ERA 계산.

5. 피타고리안 승률을 이용하여 투수의 DIPS 승률을 계산.[37]

6. 해당 시즌 리그 전체의 이닝과 디시전의 비율을 계산 후, 이를 투수의 DIPS 이닝에 적용, DIPS 디시전을 계산.

7. DIPS 디시전에 5번에서 구한 DIPS 승률을 계산하여 승패 계산.


참 쉽죠?


15.2. 톰 탱고의 FIP[편집]


위의 과정을 보면 알 수 있듯이 계산 과정이 꽤 번거로운 편이라 일반 팬들 사이에서 널리 쓰이기엔 한계가 있었다. 이에, 톰 탱고가 간단한 계산으로 'DIPS ERA'를 계산할 수 있는 식을 만들어 소개했는데 이것이 바로 FIP다.

FIP의 식은 아래와 같다.

[math( \frac{-2 \times 삼진 +3 \times (볼넷 +몸에 맞는 볼) +13 \times 홈런}{이닝} +C)]

  • 볼넷에서 고의사구를 제외하기도 하는데 FIP를 취급하는 커뮤니티 중 가장 널리 알려진 팬그래프에서는 IBB를 제외하지 않는다.
  • C는 Constant의 머릿글자로, FIP를 ERA 스케일로 맞추기 위한 상수다. 현대 야구[38]에서는 보통 3.00~3.20 정도의 값을 지니며, 이로 인해 리그 ERA와 리그 FIP는 같은 값을 가지게 된다. 참고로 평균자책점이 아닌 9이닝 당 실점을 기준으로 맞춘다면 FIP기반의 9이닝 당 실점이 된다.
    • [math(C = \frac{9 \cdot ER - 13 \cdot HR - 3 \cdot (BB+HBP-IBB)+2 \cdot K}{IP})]
      여기서 사용되는 스탯은 모두 리그 전체의 값이다.
  • -2, 3, 13이란 각 계수는 '상황별 기대 득점(Run Expectancy)'에 기반해 계산된, 이벤트별 '득점 가치(Run Value)'를 통해 구해진 값이다. C값을 제외한 식이 의미하는 바는 즉, '9이닝당 수비 무관 득점 가치'로 볼 수 있다. -2, 3, 13 각 숫자를 9로 나눠주고, 인플레이 상황의 득점 가치를 더해주면 그것이 삼진, 사사구, 홈런의 득점 가치가 된다.
  • 또한 'xFIP(Expected Fielding Independent Pitching)'라고 하여 홈런마저도 제외하고 이를 기대 홈런으로 대체한 스탯도 존재한다. 기대 홈런은 선수의 플라이볼에 리그 평균 플라이볼 대비 홈런 비율을 곱함으로써 계산된다.


16. 관련 문서[편집]



[1] 후속 투수에 의한 추가 실점은 비자책점 역시 동일하게 적용된다.[2] 맥크라켄은 Hits per ball in play란 표현을 사용했다.[3] DIPS는 세이버 메트릭스의 대표적인 흑역사 중의 하나이다. 좀 심하게 표현하자면 자료를 분석해서 결과를 얻은 것이 아니라 결과를 설명하기 위해 자료를 자의적으로 해석했다. 한마디로 주객전도. 그 결과 DIPS는 MLB 이외의 리그에서는 전혀 맞지 않았으며, DIPS의 신빙성을 의심하게 만드는 결과를 초래했다. 야구의 모든 평가 지표 중에서 리그에 따라서 결과가 달라지는 지표는 오직 DIPS 뿐이었기 때문이다.[4] 주의할 것은 나머지가 70%이므로 역시 DIPS는 유의미하다는 식의 자의적 발상이다.[5] 이것을 아주 명확하게 보이는 투수가 바로 2009 시즌의 유동훈이다. 매해 잘하면 3점대 초반의 방어율을 기록하던 그가 BABIP이 1할 7푼대로 떨어지면서 리그 정상급 마무리로 군림했다. 다만 다음 해에 바로 플루크란 것이 뽀록났지만.[6] 상기와 같은 DIPS 맹신은 위험한 발상이다. ERA와 FIP 차이를 무조건 플루크로 폄하하는 태도는 DIPS로 설명 할 수 없는 1/3 정도의 투수를 부당하게 평가하게 된다. 유동훈의 사례도 타 시즌 대비 BABIP이 비정상적으로 낮아진 2009 시즌 1년 성적만으로 능력을 평가하기 어렵다는 것이지, 'BABIP 보니 무조건 플루크'라는 것이 아니다.[7] 이 주장은 아래 쪽 문단에서 DIPS가 미래를 예측하기 위한 목적이 아니라 무슨 일이 일어났어야했는가 측면에서 봐야한다는 궁색한 주장으로 바뀐다.[8] 랜디 존슨의 BABIP는 항상 리그 평균보다 낮았는데, 하필 1999, 2000년에는 리그 평균 정도였다.[9] 결국 DIPS의 위상은 초창기에 비해 많이 낮아졌다. 야구 덕후나 찾아보는 수준의 색다른 지표 정도 수준이며, FIP를 근거로 사이영상에 투표한다는 기자는 이젠 찾아보기 어려워졌다.[10] 대부분의 연구 결과가 천 단위의 BIP 표본이 필요하다고 가리킨다.[11] BABIP를 분석할 때 흔히 간과하기 쉬운 부분인데 리그 전체의 BABIP는 타자들의 성향에 따라 달라질 수 있다. 역사적으로 언제나 .290-.300은 아니었다.[12] 20-80 스케일의 80점[13] Pizza Cutter란 필명으로 유명[14] "... and that is different from what we already know about DIPS and what has been written in 300 articles since Voros, how?"[15] 그냥 자연스럽게 생긴 보너스 같은 거라며[16] 특정 투수가 마운드에 있었을 때 평소에 비해 유달리 수비를 잘하거나 못할 수 있다.[17] 볼넷-볼넷-홈런과 홈런-볼넷-볼넷의 차이[18] 이는 BABIP의 안정화 표본 수에 근거한 발언이다.[19] FIP는 흔히 ERA 스케일로 표현되지만 근본 구조는 득점 가치, 즉 wOBA다.[20] 미래는 불확실하기때문에 사람들은 항상 타당성 있게 결과를 예측하면 열광한다. 문제는 그런 예측은 맞는 경우도 있지만 틀리는 경우도 많다는 점이다. 하지만 추종자들은 틀린 경우에는 주목하지 않거나 의도적으로 무시한다. 괜히 ‘고장난 시계도 하루에 두 번은 맞는다(Even a broken clock gets right twice a day)’라는 속담이 있는 게 아니다.[21] 물론 매덕스는 통산 삼진이 3000개가 넘는다. 하지만 그건 통산 5008이닝이나 던졌기 때문이고, 통산 9이닝당 탈삼진이 6.1개, 커리어하이 시즌도 1995년 7.8개 정도로 그리 높지않은 편이다.[22] 예를 들어 리키 놀라스코는 은퇴를 고려해야 할 나이인 지금까지도 FIP 대비 ERA가 낮은 수준인데, 그 긴 시간동안 '무엇이 일어났어야 했는가?'로 긍정적 평가를 해야한다는 것은 말이 안된다. 리키 놀라스코 한 사람에 국한된 이야기가 아니다. DIPS 이론으로 설명하기 어려운 아웃라이어는 통계적으로 무시하기에는 너무 많다.[23] 이 정도면 통계적으로 무시하기에는 아웃라이어의 숫자가 너무 많다. 아니 이쯤되면 저들이 아웃라이어인 게 아니라 이론이 잘못됐다는 뜻이다.[24] 그곳의 운영진인 데이브 캐머런은 2013년 사이영 상을 예상하면 실점 3할, DIPS 7할 정도가 적절할것 같다는 의견을 내비친 적이 있다. 그리고 팬그래프는 수많은 세이버매트릭스 사이트의 일부일 뿐, 팬그래프를 세이버매트릭스의 전부로 착각하면 곤란하다. [25] 위의 아웃라이어를 주장하는 표를 보면 이미 예시로 8명이나 나와 있고, 여긴 없지만 한동안 FIP로 꽤나 폄하받던 제레미 헬릭슨도 빼놓을 수 없는 FIP와 맞지 않는 사례이다. 어디 이름도 못 들어본 투수들 긁어온 것도 아니고 이름 좀 날렸다는 투수들 중에도 아웃라이어(?)가 저렇게 많다는 것 자체가 이론이 문제가 있다는 뜻이다.[26] 이 정도 숫자가 아웃라이어라면 이론에 문제가 있는 것이다. 기교파 투수, 땅볼 투수, 너클볼 투수 등 특정 유형의 투수는 다 제외하고 적용되는 이론이라면 범용적인 지표로 쓸 수 없다.[27] 가장 큰 이유는 FIP 전제인 투수 BABIP 통제불가론이 잘못 되었기 때문이다. 이 문단에서도 FIP라는 도그마에 과도하게 집착해 끼워맞춘 흔적을 볼 수 있는데, 한국과 미국이 전혀 다른 방식의 야구를 하는 것도 아닌데 한국에서 영 스탯이 맞지 않는다면 이론을 의심했어야 하나 그러지 않고 오히려 KBO라는 집단을 아웃라이어라고 부정해 버린 것이다. 처음부터 투수를 평가하는 단일 지표로 개발됐는데, KBO에서만 맞지않는다면 지표 자체가 잘못되었다고 보는 것이 맞는데 말이다.[28] DIPS가 투수를 평가하는 종속적 보조지표로 불리는 이유이다. 예를 들어 출루율이란 지표를 보정해서 보지는 않는다. DIPS를 보정해서 본다면 그건 이미 단독 평가지표가 아니라 단순한 분석 내지 보조 지표라는 것을 의미한다.[29] 예전에는 위대하다고 적혀 있었지만 그렇게 평가하기에는 최근 위상이 너무 무너졌다. ERA와는 다른 관점에서 그 투수를 보는 종속 지표 정도의 위치이다.[30] 그러나 나무위키의 투수 항목들을 보면 여전히 FIP가 높으니 운이 따랐다(또는 FIP가 낮으니 운이 없었다), FIP와 ERA가 차이가 많이 나기 때문에 곧 FIP로 수렴할 것이다, BABIP는 투수가 컨트롤할 수 없다 등의 서술이 많이 있고, 또 계속해서 그런 서술을 집어넣는 경우도 있으므로 적당히 필터링해서 봐야 한다. 그리고 과거 FIP의 위상이 아직 높을 때, 리키 놀라스코톰 글래빈, 제레미 헬릭슨 등의 FIP와 맞지 않는 선수들을 FIP라는 도그마에 끼워넣기 위해 온갖 가설들을 동원하여 분석한 서술들도 아작 남아 있다. 지금 시점에서는 FIP라는 도그마에 과도하게 집착하며 억지로 끼워맞춘 사례들이라고 볼 수 있으며, 오히려 이것을 보면 FIP가 가지고 있는 문제점들을 알 수 있다.[31] 이 이야기도 옛날 이야기다. 이젠 기자들도 FIP 성적이 높기 때문에 더 뛰어난 투수라는 식의 평가를 하지 못한다.[32] 클래식 스탯인 ERA가 투수를 제대로 평가하지 못해서 개발된 것이 DIPS인데, 오히려 ERA가 더 낫다면 DIPS의 존재목적이 불분명해진다. 그리고 이제 FIP은 단일시즌에 한정해도 ERA보다 낫다고 말하기 힘든 상황이고.[33] 예를 들어 변동성이 큰 것으로 알려진 투수의 BABIP은 약 3700BF(900~1000이닝) 정도면 안정화된다고 한다.[34] 안하는 것이 아니라 못하는 것이다[35] 성적 : 코빈 번스 - 잭 휠러[36] 소화이닝을 고려하면 탈삼진율은 코빈 번스가 훨씬 높다.[37] 득점엔 당 시즌 리그의 평균자책점을, 실점엔 투수의 DIPS ERA를 적용한다.[38] 팬그래프를 참고하면 저 3.00~3.20 이라는 수치로 어느정도 유지되기 시작한건 1993년부터다.


파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-10-23 05:02:45에 나무위키 DIPS 문서에서 가져왔습니다.