야구/기록 계산법

덤프버전 :

파일:나무위키+상위문서.png   상위 문서: 야구

파일:야구 픽토그램.svg
야구의 기록

[ 펼치기 · 접기 ]
투수의 기록
구종 가치 · 규정이닝 · 평균자책점 · 승리 투수 · 패전 투수 · 탈삼진 · 완투 · 완봉 · 세이브 · 블론세이브 · 홀드 · WHIP · 퀄리티 스타트 · DIPS · FIP · K/BB · RA9 · pFIP · kwERA · SIERA · 게임 스코어 · ERA+
타자의 기록
규정타석 · 타석 · 타수 · 타율 · 출루율 · 장타율 · OPS · OPS+ · 안타 · 2루타 · 3루타 · 홈런 · 타점 · 도루 · 도루실패 · 사사구 (볼넷 · 사구) · 삼진 · 병살타 · BB/K · RC · RC27 · RE24 · IsoD · XR · wOBA · wRAA · wRC+ · GPA · EqA · UEQR · UZR
투·타 공통
실책 · WAR · WPA · cWPA · BABIP · VORP · 컴투스 프로야구 포인트 · 웰뱅톱랭킹
관련 문서
투승타타 · 세이버메트릭스




1. 개요
2. 투수
3. 타자
4. 종합



1. 개요[편집]


야구의 각종 기록(stat). KBO에서 공식 기록으로 다루는 부분은 굵게 표시했다.


2. 투수[편집]


투수의 기록이 산정 대상이 되기 위해 충족시켜야 하는 최소 이닝 수. 문서 참고.






  • WHIP(이닝당 안타, 볼넷 허용률, Walks plus Hits divided by Innings Pitched)
이닝 당 출루허용률로 많이 알려져 있으나 이는 틀린 말이다. 이것이 혼동을 줘서 이닝당 출루허용률이라는 WHIP에 왜 몸에 맞는 공은 들어가지 않느냐는 질문이 간간히 올라오곤 한다.



  • K/BB(탈삼진/볼넷)

  • RA9(9이닝당 실점)
세이버메트릭스에서 충분히 많이 던진(대략 1000이닝 이상) 투수의 커리어를 평가하는데 가장 많이 쓰는 지표 중 하나. 평균자책점보다 투수의 능력을 더 잘 나타내는 것으로 알려져 있다.

  • pFIP(RA9 버전 FIP)
공식은 [math(\rm \Large \frac{17.5 \cdot HR + 7 \cdot BB - 9 \cdot K}{PA} \normalsize + Constant)]이다. The Hardball Times의 Glenn DuPaul이 만들었다. 투수의 실제 기량을 예측하기 위하여 홈런의 가치를 조정하였다. 공식이며, RA9방식이 ERA보다 투수 본연의 능력에 더 가깝기 때문에 만든 것이다. 팬그래프서 안 사용하는 이유는 ERA 스케일을 사람들이 좋아하기 때문이다. 홈런, 볼넷, 삼진만 가지고 RA9 방식으로 표현하기 때문에 FIP보다 투수의 순수한 능력을 더 잘 표현한다고 볼 수 있다. 심지어 100이닝이상에서는 SIERA와 MARCEL Pojection, ZIPS Projection보다 RA9에 대한 예측력이 뛰어나다. ERA버전은 '[math(\rm pFIP = \Large \frac{20 \cdot HR + 10 \cdot BB ? 10 \cdot K}{TBF} \normalsize + 4.60(상수) )]이다. 이것 역시 FIP, xFIP, KwERA보다 정확하며, SIERA와 엇비슷한 예측력을 보인다.

  • kwERA
kwERA는 위의 FIP와 탈삼진/볼넷 단순 비율에서 더욱 진화하여 홈런마저 배제한 채 탈삼진/볼넷 비율만을 가지고 성적을 예측하는 시스템이다. 당연히 탈삼진이 많고 볼넷이 적으면서 많은 타자를 상대할수록 kwERA는 낮아진다. 톰 탱고가 개발하였으며, 계산법은 [math(5.40-12×\Large \frac{탈삼진-볼넷}{상대한~타자~수})]이다. 여기서 5.40은 FIP의 3.2처럼 ERA 스케일로 나타내기 위한 상수값이다. 다음 시즌의 성적을 예측하는데에 있어 FIP보다 편리하다고 알려져 있다. 다만 피네스 피쳐들의 경우는 통산 상대한 타자들의 수가 많을 경우 영 좋지 않은 결과가 나오는 경우가 왕왕 있는데, 현대야구에서 보기드문 통산 5000이닝을 달성한 2차대전 이래 최강의 에이스 그렉 매덕스가 통산 3.26 FIP를 기록하고도 4.01이라는 충공깽한 kwERA를 기록한 것이 한 사례라 할 수 있다.

  • SIERA(Skill-Interactive ERA)
비교적 최근인 2010년 소개된 스탯. BP SIERA는 기본적으로 특정 시즌의 그라운드볼과 플라이볼 비율, 탈삼진 비율을 가지고 투수의 당해 시즌 퍼포먼스를 표현하기 위한 스탯이다.
팬그래프 New Siera는 올시즌의 퍼포먼스를 파크 팩터를 중립화하여 보여준다. 내야 플라이볼, 플라이볼, 그라운드 볼, 탈삼진, 볼넷을 가지고 계산한다. New Siera는 파워 피처의 BABIP가 그 투수의 xBABIP보다 낮게 나오는 것을 잡아내주며, 또한 파워 피처의 HR/FB가 리그 평균보다 낮게 나오는 것을 잡아준다.
40이닝 이상 피처를 대상으로 최고의 비율 스탯이다. 볼넷이 적은그라운드 볼러의 비자책 실점을 잘못 찾지만, 이거는 ERA 스케일이라 그런 것이며, 오히려 WAR 계산을 위한 RA9 방식으로 변환시는 더 정확이다. SIRA라고 하는 RA9 버전으로 계산하면 이것도 FIP보다 정확하다. 게다가 우리 흔히 사용하는 Projection 시스템보다 SIERA Projection이라는 다음 시즌의 퍼포먼스를 예상하기 위한 방식을 쓰면 현존하는 대부분의 Projection 시스템보다 정확하다. SIERA Projection의 2011년 버전은 [math(\rm SIERA_{proj} = .59 \cdot SIERA(’10) + .26 \cdot SIERA(’09) + 0.47 )]이다.
자세한 내용은 베이스볼 프로스펙터스의 #1, #2, #3, #4, #5, #Fangraphs SIERA, #Fangraphs SIRA, #Fangraphs SIERA Projection, 공식은 여기 글 참조.

선발투수를 평가하는 지표 중 하나이다. 자세한 내용은 문서 참고.

  • ERA+ ([math(\rm \Large \frac{리그ERA}{ERA \cdot 파크팩터 \cdot 100})])
조정 ERA라고도 하며, 해당 선수의 평균자책점에 파크 팩터를 적용해서 보정한 후, 리그 전체 평균자책점을 100이라고 한 후 비교해서 숫자로 나타낸 것이다. 조정 OPS와 같이 100이 평균, 그 이하면 평균 이하, 그 이상이면 평균 이상이라고 해석할 수 있다. ERA보다 훨씬 정확한데, 특히 다른 구장을 홈구장으로 쓰는 다른 시대의 두 선수를 비교할 때 용이하다.

3. 타자[편집]





  • 타율(BA or AVG, Batting Average)




  • OPS+(조정 OPS)
[math((출루율/리그출루율 + 장타율/리그장타율 - 1)×100/파크팩터(BPF) )]. 리그에서 해당 타자의 위치를 알아보기 쉽게 만듬과 동시에, 몇 시즌 타고투저로 인해 통산기록이 상승하였거나 또는 그 반대로 손해를 본 선수들을 일괄비교할 수 있다. 파크팩터가 개입하므로 투수친화적이거나 타자친화적인 구장에 따른 기록 상승/저하도 계산 가능. 단 우리나라에서는 파크 팩터가 큰 의미가 없다는 계산 결과가 있다. 홈런, 3루타는 꽤 차이가 나지만 종합적으로는 크게 영향을 끼치지 않는다.










  • BB/K(볼넷/삼진)

  • RC(득점 생산, Runs Created)
일단 계산 방법이 매우 복잡하다.
A = 안타+볼넷-도루실패+사구-병살타,
B = 루타+0.24×(볼넷-고의4구+사구)+0.62×도루+0.5×(희생번트+희생플라이)-0.03×삼진,
C = 타수+볼넷+사구+희생번트+희생플라이로 정의할 때,

[math(\rm RC = \Large\frac{(2.4C+A)×(3C+B)}{9×C} \normalsize -0.9C )]이다.
빌 제임스가 고안한 한 타자가 (어떤 방식으로든) 만들어낸 득점 생산력. 당연히 높을수록 팀의 승리에 기여하는 바가 크다. 각 숫자들은 득점에 각 항목이 어느 정도 기여했는지를 알려주는 것이라 이해하면 된다. 예를 들면 도루가 0.62라는 것은 도루 한 개가 0.62점에 해당한다는 뜻.[1]
다만 밑의 XR에 대항하여 새로운 공식이 나왔으니...
A = 안타 + 볼넷 ? 도루실패 + 몸에맞는공 ? 병살타
B = (1.125×단타) + (1.69 x 2루타) + (3.02×3루타) + (3.73×홈런) + .29×(BB-IBB+HBP) + .492×(SH+SF+SB) - (0.4×K)
C = 타수 + 볼넷 + 몸에맞는 공 + 희생번트 + 희생플라이
RC 공식 자체는 위와 같다.
참고로 영양가 있는 안타의 계산 법은 다음과 같다.
[math(\rm H_{RISP} - (AB_{RISP}\times BA)+HR_{ROB}-\Large \frac{AB_{ROB}\times HR}{AB})]

  • RC27
경기당 득점 기대치. 27아웃당(27타석이 아니다) RC. 27아웃은 한 경기를 가리킨다.[2] 즉, 한 타자를 8명 더 복제해서 1번부터 9번까지 전부 그 타자로만 채웠을 때, 그 팀이 몇 점을 얻을 수 있느냐-라고 이해하면 된다. 단, 실제로 한 선수로 타선을 채웠다고 해도 선수 개인의 성향 차이(스위치히터라든가 주자가 없을때만 잘치는 타자, 또는 점수차에 따라 성적이 다른 경우 등)는 반영할 수 없고 투수는 한 가지 패턴의 타자만 파악하면 된다는 점 때문에 절대적으로 같은 득점기대치가 나온다는 보장은 없다. RC/27은 어디까지가 다양한 유형의 타자들이 득점에 기여하는 정도를 알기 쉽게 비교하기 위한 수치다. 계산은 복잡하지만 일단 계산만 되어있으면 선수간의 공격력을 비교하기에 가장 편한 지표. 기본적으로 RC 같은 누적통계가 아니라 OPS, GPA 같은 비율통계의 부류이고, 실제에 적용할 경우 아웃카운트의 개수를 베이스로 산출하는 계산방식의 특성상 출루의 가치가 높게 평가되는 경향이 있다.[3] 다만 출루율이 높은 타자로만 9자리를 채운다고 동일한 수준의 출루율이 나올 수 있을진 생각해볼 문제다. 당연한 얘기지만 동일한 수준의 출루율을 기록할 수 있다면 동일한 수준의 득점기대치가 나올 것이다.

  • RE24 (run expectancy based on the 24 base-out states)
아웃 카운트와 주자 배치가 조합된 24가지 상황에 대해 해당 선수가 타석에 들어 섰을 때부터 아웃되었을 때까지의 득점 기대치 변화량. 쉽게 말해 선수에 대해 관중이 느끼는 영양가라 보면 된다.

  • IsoP(Isolated Power, 절대 장타율)
장타율 - 타율. 장타율 중에 단타가 포함되어 있으므로, 단타를 제외한 2루타 이상만을 계산하고자 하는 기록. 타자의 성향을 나타내는 스탯으로 높을 수록 강타자공갈포라고 판단할 수 있다. 다만 이 스탯 자체가 생산성과는 별 상관이 없는 스탯이므로 이게 높다고 좋은 타자라고는 말할 수 없다. 장타율이 같은 수준이라면 절대 장타율은 낮을수록 좋은 타자이다. 일발장타를 통해 만든 장타율보다 단타 여러개로 만든 장타율이 더 가치가 높기 때문이다.

  • IsoD(Isolated Discipline, 절대 출루율)
출루율 - 타율. 출루율에서 안타를 제외하고 4사구를 통한 출루율을 계산하고자 하는 기록. 절대 장타율과 마찬가지로 타자의 성향을 알아보는 용도로 사용되는 스탯.

  • XR(Extrapolated Runs, 추정 득점)
Jim Furtado가 고안한 통계. 계산법은
1루타×0.5 + 2루타×0.72 + 3루타×1.04 + 홈런×1.44 + (몸에 맞는 볼 + 볼넷 - 고의4구)×0.34 + 고의4구×0.25 + 도루×0.18 - 도루실패×0.32 - (타수 - 안타 - 삼진)×0.09 - 삼진×0.098 - 병살타×0.37 + 희생플라이×0.37 + 희생번트×0.04.
RC와 마찬가지로 저 정도의 공헌도를 지닌다는 계산에서 나온 기록. RC와 계산 방법만 다를 뿐이지 거의 같은 의미의 스탯이라고 여기면 된다.[4] RC보다 복잡하지만 좀 더 정확한 스탯으로 알려져 있다.

  • wOBA (weighted On Base Average, 가중 출루율)
타수(plate appearance)당 공격에 총체적으로 얼마나 기여했는가를 나타내는 지수다.

  • wRAA(weighted Runs Above Average)
타자가 메이저리그 평균 타자에 비해 얼마나 득점에 기여했는지 점수를 통해 나타낸다. 공식은 [math(\rm \Large \frac{wOBA - \text{리그 평균 wOBA}}{wOBA스케일}\normalsize ×타석)].
여기서 wOBA스케일은 wOBA를 출루율 스케일로 나타내기 위해 각 이벤트(볼넷, HBP, 1루타, 2루타, 3루타, 홈런)에 곱하는 값이다. 이 역시 매 시즌 값이 변경되며 2012시즌 wOBA스케일은 1.245다. wOBA를 구할때 인위적으로 곱했기 때문에 다시 나누는 것. 참고로 이것도 톰 탱고의 The Book에 나온 오리지날 수치가 있는데 바로 1.15다.

  • wRC+(weighted Run Created+)
얼핏 보면 위의 RC와 착각할지도 모르나 실은 완전히 다른 스탯으로, 이건 wOBA기반 스탯이다. 계산 방법은 [math(\rm( \Large \frac{\frac{wRAA}{타석}}{\frac{리그~득점}{리그~타석}} \normalsize+ 1)×100×파크팩터)]. 조정 OPS와 마찬가지로 리그 평균 타자의 wRC+를 100으로 상정하여 해당 타자의 전반적인 위치를 쉽게 알아볼 수 있다.

  • GPA(Gleeman Production Average)[5]
약자 그대로 글리만이 만든 통계다. 기존의 OPS는 출루율 + 장타율이라는 단순 계산으로 "출루율 .350에 장타율 .450의 타자"와 "출루율 .280에 장타율 .520"의 타자가 OPS상으론 .800으로 동급으로 취급을 받는 문제가 발생한다. 이런 OPS의 문제점을 보완하고자 출루율의 비중을 높이는 통계를 만들었는데 이것이 Tangotiger(Tom Tango)가 만들어낸 [math(출루율×1.8 + 장타율)]이다. 하지만 일반인들이 느끼기 힘들다는 것으로 판단하고 글리만이 여기서 나누기 4를 하는 방법을 생각해냈다. 그리고 일반 타율에 가까운 수치가 나오도록 1.7대신 1.8을 곱해서 만들어 진것이 바로 GPA이다.
계산법은 [math(\rm \Large \frac{(1.8)OBP+SLG}{4})].

  • EqA(Equivalent Average, 등가타율)


  • UZR
수비 관련되어서 가장 유명한 계산법. 아직 한국에서는 관련 자료들이 미비해서 구하기가 어려우나 여러가지 시도가 이루어지고는 있다.


4. 종합[편집]


  • 실책
  • WAR(Wins Above Replacement, 대체 수준 선수 대비 승리 기여도): 자세한 것은 문서 참조.
  • WPA(Win Probability Added, 승리 확률 기여도): 팀의 승리 확률에 얼마나 기여했는지를 나타낸다.
  • cWPA(Championship Win Probability Added, 우승 확률 기여도): 팀의 우승 확률에 얼마나 기여했는지를 나타낸다.
  • BABIP(Batting Average on Balls In Play): 피칭과 공·수 등 여러가지 면에서 특정 선수나 팀의 실력과 운의 요소 등을 평가하는데 사용된다.
  • VORP(Value Over Replacement Player, 대체선수대비 생산력 지표): WAR과 비슷한 개념이다.
  • 컴투스 프로야구 포인트: OB맥주, MBC 스포츠플러스 등이 신설한 야구 기록으로 원래 이름인 카스포인트로 진행되다가 이후 컴투스와 제휴해 컴투스 프로야구 포인트로 새로 이름을 바꿨다. 허점이 많아서 세이버메트리션은 물론 일반적인 야구팬들에게도 거의 스탯 취급을 받지 못한다.
  • 투승타타: 자세한 것은 항목 참조.
이 외에도 Win shares 등 세이버메트리션들이 고안해놓은 온갖 복잡하고 수많은 기록(stat)들이 있다.

이 문서의 2011년부터의 저작자는 이 링크에서 확인할 수 있습니다.



파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-12-08 09:58:05에 나무위키 야구/기록 계산법 문서에서 가져왔습니다.

[1] 물론 뒤에 복잡한 과정을 거치므로 1점대 0.62점에 대응하는 것은 아니지만...[2] 실제로는 1경기에서 27아웃을 채우지 않는 경우도 꽤 많기 때문에 27 대신 25를 쓰기도 한다.[3] 출루율의 가치가 과대평가된다는 견해도 있지만 실제로 출루율은 매우 중요한 가치다. 머니볼에서는 2002년의 스캇 해티버그 아홉 명으로 라인업을 꾸리면 같은 해의 뉴욕 양키스보다 50점 이상 더 뽑아낼 수 있다는 내용이 나온다.[4] RC는 후에 이런저런 가중치와 추가요소가 덧붙여져 복잡해졌지만 기본적으로 출루율×루타의 개념이다. 경험적으로 실제 득점에 매우 가까운 수치가 나오지만 '왜 그렇게 되는지'를 구체적으로 설명할 수 없는 게 RC의 단점이다. 한편 XR는 실제 자료의 회귀분석을 통해 얻은 가중치를 사용한 선형공식이다.[5] 영어 위키백과에서는 Gross Production Average로 소개되어 있다. 어차피 약자는 같기 때문에 GPA로 부른다.