문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 세이버메트릭스 (문단 편집) == 통계적 방법에 대한 비판과 반론 == >The system of keeping batting averages needs a complete overhauling. At present this system merely gives the comparative number of times a player makes a hit without paying any attention to the importance of that hit. Home runs and scratch singles are all bulged together on the same footing, when everybody knows that one is vastly more important than the other. The result is that the records are grossly misleading. >[[타율]]을 중요시하는 관점은 완전히 손 볼 필요가 있다. 현재의 시스템은 단지 [[타자]]가 [[안타]]를 만들어내는 상대적인 빈도만 제공해줄 뿐, 그 안타의 의미와 가치에는 전혀 관심을 기울이지 않는다. [[홈런]] 하나와 행운의 안타 하나는 똑같이 값이 매겨져있지만, 누구나 홈런이 행운의 안타보다 훨씬 더 중요하다는 사실을 알고 있다. 결과적으로 그 [[스탯]]은 사람들을 매우 오해하게 만드는 셈이다. > ---- >ㅡ F.C. 레인(Ferdinand Cole Lane). '''[[1915년]]'''. [[http://www.baseballprospectus.com/article.php?articleid=21234|원문]], [[http://mlbpark.donga.com/mlbpark/b.php?m=search&p=31&b=mlbtown&id=144801&select=sct&query=%EB%A9%94%EC%9D%B4%EC%A0%80%EB%A6%AC%EA%B7%B8+%EC%9D%B8%EA%B8%B0+%EC%9C%84%EA%B8%B0&user=&reply=|번역본]] 위에서 언급했듯 세이버메트릭스를 야구 경기보다 통계, 숫자에 집착한다며 비판하는 경우가 많다. 그러나 세이버메트릭스의 핵심은 '''어떠한 스탯이 선수의 실질적 가치에 가까운 스탯인가'''를 찾는 것이다. 다시 말해 상대적으로 부정확한 스탯인 타율/다승이 아닌 [[wOBA]]/[[WAR]]를 보는 게 더 좋다는 것이지, 야구를 보지 말고 스탯만 뒤지자는 것이 아니다. 또한 세이버메트릭션들이 통계를 이용한 숫자놀음을 많이 하는 것도 어디까지나 그 선수의 객관적인 평가를 위한 것일 뿐이다. 물론 선수의 플레이 그 자체, 동료간 팀케미스트리, 워크에식과 그날그날의 컨디션, 통계를 종합라여 평가하는 것이 가장 이상적인 건 자명하다. 하지만 그런 종합적 평가의 경지에 도달한 사람은 경험 많은 야구인 중에서도 역대급으로 꼽히는 소수의 몇명 뿐이다. 더군다나 일반 야구팬과 기자들이 볼 수 있는 건 고작해야 경기장에서 공개되는 선수의 지극히 일부 측면과 자극적인 몇몇 일화들일 뿐, 워크에식 같은 건 당연히 못 본다. 따라서 차선책으로, 공개된 데이터의 통계적 분석을 추구할 수밖에 없는 것이다. 오히려 통계의 허점에 대해서는 세이버메트리션 쪽에서 더 많이 언급하고 있다. 세이버메트릭스에 대한 비판 가운데 많은 수를 차지하는 것이 세이버 스탯에 대한 충분한 이해가 없이 그저 본인의 상식과 다르다는 것을 근거로 이루어지는 형태인데, 세이버메트릭스에서 주로 사용하는 스탯들과 그 스탯을 만들어낸 원리와 공식도 재대로 알아보지도 않고 까는것은 비판이 아닌 비난일 뿐이다. 정작 선수들과 선출 야구인들은 세이버메트릭스를 아는 경우 자체가 적은데다 설명을 들어도 '뭐 그딴 쓸데없는...'이라는 반응을 보인다. 무엇보다 유명한 세이버메트리션 대부분이 비선출이다. 인생을 야구에 바친 야구 전문인들 입장에선 자기들 가지고 수치놀음 하는 이상한 사람들로 보일 뿐이다. 일반적인 야구팬들 사이에서 언급되는 대표적인 오해의 예로 '타선은 OPS 순으로 나열해야 한다' 같은 것이 있는데, 그 내용 자체도 세이버메트리션 쪽의 의견과는 다르다. 에서 타석에 서는 횟수와 타석에 섰을 때의 상황을 종합해서 낸 결론에 따르면 1번과 2번, 4번이 가장 중요하며 3번과 5번이 그 뒤를 잇는다. 전체적인 타격 능력이 비슷한 경우 출루에 강점을 가진 선수일수록 앞쪽에 놓으면 좋다. 6~9번은 잘 치는 선수일수록 앞에 두면 된다. 애초에 세이버메트릭스에서는 타순을 중요하게 다루지도 않는데, 연구 결과 효율적인 타선 배치로 인한 이득이 일반적인 통념보다 훨씬 낮게 나타나기 때문이다. 가장 효율적인 타선 조정으로 얻는 점수는 시즌을 통틀어도 5점 미만이다. 결국 이 논제는 세이버메트릭스에 대한 오해 중 하나다. 일반적인 야구팬들, 하다못해 세이버메트릭스에 대한 이해가 없던 세이버메트릭스 도입 초창기의 '''스카우터'''들도 갖고 있던 오해 중 하나는, 세이버메트릭스가 제시하는 이상적인 선수의 상이 하나뿐이라는 것이다. 대충 그들이 가지고 있던 생각은 '세이버메트릭스가 생각하는 이상적인 타자는 딱 하나인데 2할 중 후반대의 그다지 높지 않은 타율, .360~.380 수준의 높은 [[출루율]], .420~.460 수준의 적당한 [[장타율]]의 '''재미없는''' 선수가 그것이다' 라는 것. 세이버메트릭스에 대한 반감을 가지고 있던 스카우터들은 세이버메트리션과의 대담을 나누는 자리에 나와서 '너네들 방법으로 뽑는 선수는 다 똑같을 거다. 우리는 슈퍼스타를 뽑아낼 수 있지만, 이제 야구는 다 재미없어지고 똑같은 애들만 뽑게 될 거다' 라는 뉘앙스로 비꼬기도 했다. 물론 이건 세이버메트릭스를 모르기 때문에 나온 촌극이자 무시다. 오히려 세이버메트릭스는 이전에 무시받던 유형의 선수에게도 중요한 가치가 있음을 알려주며, 더 다양한 선수들의 유형이 등장하게 만들었다. 일례로 2017년 7월 3일 기준, [[코디 벨린저]]는 .262, .335 라는 낮은 타율과 출루율을 기록중이지만 미친듯한 홈런 퍼레이드로 .633의 장타율을 기록 중이다. [[코리 시거]]는 벨린저만큼 홈런을 많이 치진 못하지만, 타/출/장이 거진 3/4/5 에 수렴하는 밸런스 잡힌 성적을 보여주고 있다. [[다니엘 머피]]는 볼넷을 거의 얻지 못하며 출루율 따위는 개나 주라는 듯한 타석 접근법을 보여주고 있지만 .334 라는 미친듯이 높은 타율로 출루율 역시 .387 을 유지하고, .569 의 뛰어난 장타율을 보여주고 있다. 이 세 선수는 각각 일발 장타형 홈런 타자, 어줍잖은 밸런스 타자가 아닌 타출장 3/4/5 의 완벽한 밸런스 형 타자, 미친듯이 높은 타율과 꽤나 좋은 파워를 보유한 타자로 제각기 판이한 모습을 보여주고 있지만, 세이버메트릭스로 분석한 이들의 리그 평균 선수 대비 타석 효율은 각각 146%, 143%, 142% 로 매우 비슷하다. 하지만 상술된 반론이 무색하게 이런 우려는 '''2020년대에 들어서 슬슬 현실화''' 되고 있는데, 결국 세이버메트릭스상으로 가장 좋은 타자가 "선구안이 좋아 볼넷을 골라 낼 수 있으며, 삼진을 두려워 하지 않고 장타를 노리는 풀스윙 히터"라는 추세로 가고 있기 때문이다. 특히 플라이볼 혁명이라 불리는 대세에 힘입어 "결국 출루와 장타가 최고다" 라는 결론이 나오면서, 많은 타자들의 플레이스타일이 2할 중후반의 타율도 아닌, 2할 초반, 혹은 잘 해야 2할 5푼 내외의 저타율과 상대적으로 높은 순출루율, 많은 홈런과 삼진으로 획일화되기 시작하였다.[* KBO에서 20년 전에 이런 스탯을 기록한 선수가 있는데, 바로 해태 타이거즈에서 1년간 활약한 1999년의 [[트레이시 샌더스]]. 샌더스의 99년 성적은 타출장 0.247/0.408/0.575에 40홈런 105볼넷 133삼진으로, 정말 극단적인 OPS형 히터의 성적이다. 이 당시에는 KBO는 물론이고 MLB도 세이버매트릭스가 제대로 알려지지 않은 터라 샌더스는 타율이 2할 5푼도 안되지만 파워는 좋은 공갈포로 취급을 받았다. 하지만 현대야구의 관점에서 보면, 삼진도 많이 먹지만 볼넷도 매우 많이 얻어 눈야구가 되는 타입이고, 타고투저인걸 감안하더라도 한시즌 40홈런을 때려낼 수 있는 파워가 좋은 선수이다. 좀 더 세부적으로 보면 WRC+가 145로 리그 10위이며, wOBA는 0.414로 리그 9위에 해당한다. 샌더스가 지금 MLB에서 저정도 성적을 찍으면, 리그 한손가락에 꼽을 수 있는 엄청난 강타자로 평가받는다.]이로 인해 메이저 사무국은 수비 시프트 금지, 베이스간의 거리 단축 등의 룰을 '진지하게' 고민할 정도로 이 문제는 눈에 띄게 현실화되고 있다.[* 결국 2023시즌부터는 룰 개정을 통해 극단적인 수비 시프트의 제한, 베이스의 크기 확장, 견제 제한 등의 요소를 도입해버리며, 대놓고 안타와 도루 같은 역동적인 장면이 많이 나오게 유도하기 시작했다.] 비슷한 예시로는 NBA를 들 수 있는데, 3점슛의 효율이 부각되면서 시작된 양궁농구와 빅맨 포지션의 기근화가 일어나기 시작하였고, 이로 인해 모든 팀의 경기 스타일이 비슷해지기 시작한 것이 NBA의 인기 하락의 주범으로 꼽히고 있는 상황이다. NBA 사무국 역시 이 문제 때문에 매년 룰을 조금씩 개정 하는 것을 생각하면 야구 역시 같은 길을 걷는 것일 수도 있다. 오직 '승리'만을 위한 획일화는 '재미'를 떨어뜨린다는 치명적인 단점이 있다. 올림픽에서 대회 내내 삽질만 하던 이승엽이 결정적인 순간에 대형홈런 한방으로 팬들을 열광시키며 일약 영웅이 되고, 최고의 마무리 투수였던 [[트레버 호프만]]도 정작 중요한 경기에서 세이브 실패로 팬들에게 엄청 욕을 먹고 심지어 살해협박까지 받는 일도 있었다. 세이버메트릭스에선 무시당하는 '승패'이지만, 일반 야구팬들에게는 여전히 승패가 중요한 것은 '그가 등판한 경기에서 얼마나 승리했나'란게 직관적으로 느껴지기 때문이다. 하지만 세이버메트릭스에선 이런점은 고려되지 않는다. 팬들은 베이징 올림픽을 떠올릴 때 이승엽의 통쾌한 홈런포를 기억하며 감동적인 순간으로 기억하며 다른건 까먹지만, 세이버메트릭스에선 이승엽은 안좋고, 그냥 꾸준한 성적을 낸 선수를 최고로 치므로 팬들과 괴리가 생긴다. 또 그냥 일반 야구시청을 하는데 있어서 이미 기존의 자료로도 충분히 대략적인 파악은 가능하다. 흔히 타율만 거론하며 모순을 지적하지만, 극소수의 라이트팬을 제외한 대다수의 야구팬들은 타자 기준으로는 타율만 보지 않고, 최소 타율, 출루율, 장타율, OPS, 홈런 정도는 보는 편이고, 좀 더 나아가면 WAR, WRC+ 등 타자들의 실력을 잘 드러내면서도 이해하기 어렵지 않은 스탯도 보는데, 이 정도 수치만 봐도 선수들의 실력과 플레이스타일이 어느 정도인지 대략 파악 가능하다. 세이버메트릭스는 거의 학문이나 논문 수준으로 파고들어 접근하는데, 야구계에 종사하는 관계자나 스탯만 파는 덕후들에게는 흥미가 있겠지만, 일반 야구팬들에게는 흥미를 느끼게 하는게 아닌 벽을 느끼게 할 수도 있다. 어차피 일반인들은 그냥 시간날때 팝콘 먹으며 보는 수준인데, 직관적이고 쉬운게 아닌 너무 복잡하고 난해하여 선뜻 이해가 안되면 멀어질 수 있다. 실제 게임들도 시리즈화되면서 마니악해지며 점점 '하는 사람만 하는' 게임으로 변모해가는데, 야구도 복잡한 스탯은 신규 야구팬들을 유입하는데 방해가 될 수 있다. 다만, 이것도 시간이 지나면 너무 복잡하지 않고 직관적인 세이버 스탯들은 점차 대중들에게 널리 알려질 것이라는 견해도 많다. 2022년 기준에서 WAR이나 OPS는 야구에 이제 막 입문하거나 국가대표 경기만 가볍게 보는 시청자가 아닌이상 대부분의 야구팬은 어떤 수치인지 대강 의미를 아는 매우 대중적인 지표로 자리잡았지만 불과 10년전만 해도 WAR이라는 수치는 KBO에서는 극소수의 매니아들만 알고있는, 이제 막 MLB에서 신뢰성 있는 수치로 검증받은 스탯이었다. 당시 2012년 골든글러브 투수부문에서 승수만 적었지 세부스탯으로 압도적인 수치를 기록한 류현진이 고작 14표 밖에 얻지 못했을 정도로 투수의 가치를 평가하는 기준이 매우 구식이었으며, [* 장원삼이 128표, 나이트가 121표로 장원삼이 수상하여 매우 큰 논란이 되었던 수상이다.] OPS라는 매우 간단한 스탯조차 별다른 가치를 부여하지 않았던 시절이었다. 하지만 2022년 기준, WAR은 계산과정이 매우 복잡해도 결과값으로 도출하여 대중에게 보여주는 결과값이 매우 직관적이고 선수들의 가치를 수치 단 하나로 줄세우기를 할 수 있다는 점에서, OPS는 출루의 가치를 저평가한다는 단점이 있어도 계산이 너무나도 쉬우면서 타자의 생산성을 상대적으로 잘 표현한다는 매력적인 장점 덕분에 WAR과 더불어 스포츠 뉴스에서도 종종 나올만큼 아주 대중적인 수치로 자리잡았다. 적어도 WAR로 선수의 가치를 매기는건 과거의 [[투승타타]]로 대표되는 구시대적 안경을 끼고 선수의 가치를 매기는 것보다 훨씬 정확하며, WAR은 타율, 홈런, 승리, 탈삼진 등의 기본적인 스탯을 바탕으로 연구를 통해 얻어낸 스탯들이다. 결국 대중들에게 널리 보급되는 건 이러한 직관적인 스탯이니, 알게 모르게 대중들이 야구를 바라보는 관점도 세이버매트릭스의 관점을 점점 받았다고 얘기할 수 있는 것. 흔히 야구에서 '운도 실력'이란 말이 나오는게, 팬들 입장에선 어쨌거나 중요한 경기에서 승리하거나 중요한 순간에 안타나 홈런을 때리는 선수에게 점수를 크게 주고 기억에 남기 때문이다. 따라서 일반인들이 최고의 선수로 기억하는 선수와, 세이버메트릭스 최고의 선수와는 괴리가 생길 수밖에 없다. 재미없게 판정으로 승리하여 무패로 은퇴한 메이웨더보다, 비록 패도 많이 하고 한물간 평가를 받았던 당시에 최강의 조지포먼을 KO로 잡아낸 알리가 '킨샤샤의 기적'으로 불리며 수십년 지나도 여전히 최고의 선수로 기억되는 이유가 왜인지를 떠올려 보자. [[메이웨더 vs 파퀴아오]] 경기는 기억나는게 중간에 김수미의 맥콜CF밖에 없다는 반응이 많은 지지를 받았다. 하지만 당시 복싱 마니아들은 메이웨더의 숄더롤이 예술이었다며 극찬했다. 일반인들은 물론 잘하는 선수를 좋아하지만, 팬들이 기대하는 일정 기준을 충족한 상위권 선수들 중에서는 '감동을 주는 선수'를 더 좋아한다. [[클러치 히터]]에 대해 일반인들과 세이버메트릭스의 시각이 다른 이유다. 세이버메트릭스가 선수 능력을 수치화하는데 유용한 도구인 것은 분명하지만, 세이버메트릭스를 지나치게 맹신하는 것도 지양해야 할 것이다. 예를 들어 세이버메트릭스의 아버지 빌 제임스는 2017년 한국 언론과의 인터뷰에서 데이터로 사람을 평가한다는 것은 매우 어려운 일이며, 세이버메트릭스를 이용한 선수 평가 역시 틀릴 수도 있다는 것을 인정해야 한다고 말하였다.[* 국내 사례만 봐도, 세이버메트릭스에 기반해 외국인 선수를 영입한 [[NC 다이노스]]의 2018년 외국인 선수 영입이 실패한 것만 봐도 알 수 있다.] [[http://sports.news.naver.com/wbaseball/news/read.nhn?oid=380&aid=0000000988|기사 링크]] 물론 어디까지나 세이버메트릭스만으로 평가하기 어렵다는 뜻이고, 현장에서 수집한 정보 등의 다른 정보와 합쳐지면 평가하기 상당히 좋아지며, 최소한 타율이나 타점, 승이나 평균 자책점만 보고 평가하는 것보다는 비교할 수조차 없을 정도로 신뢰도가 높다는 것은 변하지 않는다. 자세한 것은 [[야구의 기록 계산법]] 참조. 참고로 [[류현진]]에 의하면 2010년 후반 통계 분석이 치밀한 편에 속하는 [[로스앤젤레스 다저스|LA 다저스]]는 다음과 같은 수준이라 한다. >단순히 A란 타자가 B 투수 상대로 몇 타수 몇 안타인지 같은 기록은 데이터 축에 들지도 않는다. 투수의 구속과 회전수, 회전축, 가로와 세로 무브먼트, 릴리스포인트를 전부 데이터화 하여 계산에 넣고 타자의 스윙궤적까지 측정해 계산한다. 이렇게 투수와 타자, 구종에 따라 세세하게 예측한 시뮬레이션을 바탕으로 매 경기의 계획과 전략을 세우고, 시나리오를 짜서 경기에 임하는 게 요즘 MLB 구단이다. 물론 이렇게 분석해도 이따금 지난해 포스트시즌처럼 아쉬운 결과가 나오긴 하지만, 단순히 ‘감’에 의존해서 불합리한 선택을 하는 과거 방식과는 비교가 되지 않는다.[[https://www.mbcsportsplus.com/news/index.php?mode=view&cate=1&b_idx=99861941.000|#]] 세이버메트릭스 자체의 문제는 아니지만 자료를 자의적으로 해석해거나, 심지어 그 자의적 결과를 맹신하는 경우도 비판의 대상이 된다. 보통 세이버메트릭스에 대한 비판과 그에 대한 반론이 격렬히 충돌하는 이슈는 다음과 같은 '''잘못된 과정'''을 거친다. ① 대상이 되는 스탯을 선정 ② 자료 분석 ③ 스탯과 성적 사이 유의미한 인과, 비례관계를 찾지 못함. ④ 결론 도출: 해당 스탯을 고려대상으로 취급하지 않는다. 또는 무의미한 것으로 판단한다. 상기 프로세스는 ③번에서 ④번으로 넘어가는 과정에 치명적인 결함이 있다. 유의미한 인과관계를 찾지 못했다는 것이 인과관계 자체가 없는 것은 아니기 때문이다. 얼핏 보기엔 맞는 거 아닌가 싶지만, 처음부터 잘못된 변수를 설정했거나 복합 변수인 경우 인과 관계가 없는 것처럼 보이기도 한다. 그러나 세이버메트리션 상당수가 오로지 숫자만을 믿고 기존의 가치관을 부정하는 성향이다보니 그런 식의 오류를 범하는 경우가 의외로 꽤 된다. 대표적으로 '보로스 맥크라켄'이 주장했었던 일명 'FIP'로 알려진 [[DIPS]] 이론이 있다.[* 세이버메트릭스의 대표적인 흑역사의 하나이다. 이 이론은 잘못된 부분이 너무 많아서 현재는 그냥 이런 관점도 있다는 정도로까지 위상이 추락했다. 소위 클래식 야구인들이 DIPS 이론에 대해서 비상식적인 주장이라고 비판했지만, 매우 많은 세이버메트리션들이 반론을 검토하기는 커녕 현상을 이 이론에 억지로 끼워맞추는 자세를 취했었다.]저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기