:: 게시판
:: 이전 게시판
|
다시봐도 좋은 양질의 글들을 모아놓는 게시판입니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
13/11/20 04:22
우선 글 잘 읽었습니다. 세이버메트릭스에 관심은 있었는데, 기본적인 지식말고는 없었는데 도움이 많이 되었어요.
그런데, GPA부문에서 전문가들이 어떻게 분석해서 출루율, 장타율의 상관도를 구했는지 궁금합니다. 그냥 엑셀로 최근 5년 구단별 출, 장, OPS, 득점을 상관관계를 구해보면, 출루율 83.88%, 장타율 93.43%, OPS 95.30%가 나옵니다. (득점/공격이닝을 써야 더 신뢰도 높은 수치가 나오겠지만, 공격이닝은 구하지 못하여 페넌트레이스 총 득점을 썼습니다. 큰 차이는 안나겠죠.) 저는 5년 41팀의 스탯으로 구했습니다. 제가 한 것처럼 단순히 출장이랑 득점의 상관관계를 엑셀로 줄 세워서 구하는 게 아닐수도 있을거라 생각합니다. 그런데, 저는 출루율과는 달리 장타율은 주자의 베이스 진출의 의미를 갖고 있기 때문에 득점과 조금 더 관련되어 있는 스탯이라고 생각합니다. 일반적으로 왜 출루율이 장타율보다 더 득점과 관련있다고 인식되는지 궁금합니다.
13/11/20 04:50
지적 감사합니다. 장타율이 득점 상관관계를 구해보면 출루율보다 높게 나오는 것이 맞네요. 제가 잘못 썼네요ㅠ
1.8을 곱하는 근거에 관해서는 http://www.tangotiger.net/ops.html 를 참조할 수 있을 것 같습니다.
13/11/20 04:47
GIDP는 그냥 병살타라고 해도 되지않나요?? 병살타라는 기록은 포스플레이에 의한 더블플레이와 리버스포스더블플레이에 한해 병살기록을 주고있으니까요...
13/11/20 04:53
아 Double Play는 병살이고 병살타의 의미를 생각해보니 GIDP랑 같군요ㅠ 글을 쓰다보니 여러 실수가 발견되는군요. 지적 감사합니다.
13/11/20 05:00
흐흐 재미있는 글이었어요. 저는 아직 전통적인 기록과 감, 타자와 투수의 폼 등을 보고 작두타는 쪽을 즐기는 약간 하일성같은 야덕이거든요. 크크 세이버매트릭스 계열중에서도 XR같은 것은 개념만 두루뭉술하게 알고 있었는데. 수식으로 보니 더 확 와닿는 감이 있네요. 2탄 기다릴게요~
13/11/20 08:09
좋은 글 감사합니다
요즘 ootp라는 게임을 하면서 많은 세이버매트릭스 스탯을접하게됐는데 그래도 막연히 높으면 좋겠거니 하고있었는데 이글보면서 천천히 다시 한번봐야겠네요 그래도 아직은 avg obp slg ops 보는것만으로 만족해야겠네요
13/11/20 09:40
제가 몇년간 진행했던 연구 주제가 '진공 펌프가 고장났는지 판단하는 진단 시스템 개발'이었습니다. 지금 생각해보니 제가 한것이 세이버 메트릭스와 비슷하다는 생각이 듭니다. 타율, 출루율, OPS 등 타자의 상태(성적)을 나타내는 상태변수(스탯)들이 있는것 처럼 펌프도 배기속도, 온도, 출구압력, 소모전력, 내부진동가속도 등등 상태를 나타내는 변수(스탯)들이 있습니다. 각각의 변수가 나타내는 의미야 이미 오랫동안 연구가 진행된 것들이고, 저는 변수들의 상관관계에 주목했습니다. 야구로 따지면 같은 출루율을 가진 타자라도 어떤타자는 상대적 타율이 낮고 어떤 타자는 타율이 높을 수 있겠죠. 펌프도 동일한 배기속도를 가진 펌프도 A타입은 출구압력이 높고 B타입은 출구압력이 낮을수 있습니다. 여기서 만약 어떤 선수가 출루율이 작년과 같은데 장타율이 상승했다면 또는 OPS가 동일한테 장타율이 낮아졌다면 그 선수의 타격스타일이 바뀌었다라고 예측할수 있는것처럼, 저도 펌프가 동일한 배기속도를 내더라도 내부 진동가속도 등이 증가하면 펌프의 성격이 바뀌었다고 생각했습니다. 그리고 기계는 사람과 달리 일정한 범위를 벗어나면 고장이 발생할 가능성이 높지요. 사람은 성장이 목표지만 기계는 상태유지가 목표거든요.
아침에 문득 제가 했던 것들이 생각나 댓글을 길게 달았습니다. 세이버 매트릭스에서 스텟들의 상관관계 - 출루율은 상대적으로 높은데 OPS는 상대적으로 낮은 타자는 왜 그런가? or 작년과 동일한 OPS를 기록한 선수가 득점생산력은 떨어졌다면 그 선수에게 어떤변화가 있었는가 - 등을 따져보면 꽤 재밌을것 같네요.
13/11/20 10:48
출루율은 상대적으로 높은데 OPS는 상대적으로 낮은 타자는 왜 그런가? 는 뻔하죠. 장타율이 낮아서.... -_-;
작년과 동일한 OPS를 기록한 선수가 득점생산력은 떨어졌는가.. 도 눈에 띄게 떨어졌다면 대충이라도 세부지표를 보면 나옵니다;; 여기서 만약 어떤 선수가 출루율이 작년과 같은데 장타율이 상승했다면 또는 OPS가 동일한테 장타율이 낮아졌다면 BABIP을 봐야지요. 타격 스타일이 변할 가능성보단 운일 가능서이 큽니다. 통계기록이라도 일시적으로 끊어서 본다면 다른 값이 나올 가능성이 있으니깐요 들어주신 예와 다르게 야구 스텟에 대한 의문이나 이유 또는 정답은 스텟안에 대부분(99%이상...) 있습니다.
13/11/20 10:45
좋은 글 감사합니다
메이저리그를 보면서 부러운게 한두가지가 아니겠지만, 가장 부러운 것은 mlb.com이 아닌가 싶네요 직관적이고 체계적인 stats를 볼때마다 어찌나 부러운지.. KBO 홈피는 가볼때마다 절망 그 자체입니다
13/11/20 11:00
잘 읽었습니다.
맞는지는 모르겠는데 XR은 제가 어설프게 알고있는 wOBA와 비슷한 느낌인 것 같네요. XR이 R의 스케일을 기준으로 했다면 wOBA는 OBP의 스케일이 기준이 된 차이정도?
13/11/20 11:30
막연하게 이런것이겠지 생각만하고 있었는데 잘 정리해주셔서 덕분에 쉽게 이해했습니다. 좋은 글 고맙습니다. 2탄도 기대합니다~~~ ^^
13/11/20 11:39
RC/27 이라는 스탯은 몇번 들어보기는 했는데 자세한 설명을 보니 직관적으로 잘 만들었네요.
투수 쪽도 저런 스탯이 꽤 있나요?
13/11/20 11:56
세이버매트릭스가 중요한 것은 데이터 해석의 장을 열었다는 거죠.
데이터, 수치를 많이 보는 게 중요한게 아니죠 그걸 어떻게 해석할까인데 현장에서 수치 보는걸 본적이 있는데 정말 자세히는 보죠 근데 해석 능력이 부족합니다. 오히려 해석 능력은 현장보다는 이쪽이 전문가에 가깝다고 봐요.
13/11/20 13:06
한국에선 OPS와 WAR정도만 봐도 타팀과의 경쟁에서 충분히 우위에 설 수 있는 거 같습니다. 이것마저 안보는 프런트들이 태반이라서요. 이장석이 여실히 증명해줬죠..과장 조금 섞어서 글쓴분 정도의 내공을 가진 사람이 KBO 야구팀 프런트에 몇 년만 있어도 왕조 구축이 가능할 것 같네요.
13/11/20 14:15
각 프런트에서 이미 충분히 데이터는 다 보고 있습니다. 괜히 프로 구단, 그리고 언론사에서 스포츠투아이에 일년에 얼마씩 돈 줘가면서 데이터를 받는게 아닙니다. 그러나 전력분석팀에서 분석을 하고 데이터를 넘겨줘도 현장에서 그것을 어떻게 활용하느냐는 별개의 문제입니다. 스탯은 참고사항은 되도 절대적 지표는 되지 못합니다. 무엇보다 스탯은 결과물을 분석하는 거지 앞으로의 성적을 예측하는데 절대적인 영향을 발휘하진 못하거든요. 소싯적 제가 그것 때문에 성민규 해설위원 - 당시엔 스카우터 - 에게 지적 받은 바 있었죠.
프로야구는 팬들이 생각하는것보다 훨씬 더 정치적이다,라고 생각합니다.
13/11/20 15:24
스탯을 결과물로 보고 앞으로 성적을 예측하는데 절대적인 영향을 미치지 못한다고 보는 것이 스탯을 잘못 보는 거죠. 제가 길게 쓰다가 좀 지우고 바꿨는데 현장에서 스탯 보는 식이 이런식이죠 이제까지 이렇게 쳤으니 이런 약점이 있다. 그러니 앞으로 훈련을 통해 이렇게 약점을 개선하도록 치자. 평소 훈련과 모습이 앞으로 예상을 만들어 줄것이라는 현재 현장이 보는 식이죠. 그런데 그렇지 않습니다. 그러니 스탯을 잘못 보는 거죠. 세이버스탯이라는 것이 이제까지 클래식 스탯과 기존의 보는 형식을 바꾸어서 앞으로 예측을 위해 만든 것이고 유의미성은 검증하는 과정이고 그 안에서 현장에서 착각하고 있는 믿음들을 (맞춰 잡는다든가 타구 방향을 조절한다든가의) 깨는 부분들도 있는데 말이죠.
클래식 스탯이 널뛰하는 걸 보고 스탯이 성적 예측을 바라보지 못한다고 보는 것에 가깝다고 봅니다. 그들은 상황별로 자세히는 봅니다만 그것들이 모여서 어떻게 통계적 검정을 거칠지에 대해서는 미비합니다. 통계가 가장 발달한 응용 분야인 경영쪽에서 현실속에서는 미비한 것을 야구 프런트에서 통계 전문가가 있을리가 만무하죠. 선수의 퍼포먼스 자체를 세이버 스탯이 개선해주진 못하죠. 하지만 데이터 속에 숨겨진 그 안의 의미들이나 어떤 방향으로 가야할 지는 제시해준다고 보는데 이 부분에 대해 모르죠. 충분히 데이터는 볼 겁니다. 하지만 충분한 데이터 해석을 전혀 못하고 있죠. 로우 데이터는 로우 데이터 뿐인데요. 전 세이버 만능주의자도 아니고 물론 스탯은 과거결과물일 뿐인 걸 보여주는 선수들도 나옵니다만은 사실 특수 케이스에 가깝고 대다수 선수들은 결국 수렴하죠 스탯이 진리다이기 보다는 양쪽 균형을 맞춰야 하는데 우리 나라는 너무 한쪽으로 쏠려 개선되어야 할 부분이 있다고 봅니다
13/11/20 15:05
박수를 보냅니다!
저도 가끔 자게에 야구 관련 잡글 정도나 올리는 수준인데 그런 수준의 글조차 쓰고나면 여러 오류와 제가 잘못 알고 있었던 사실들이 드러납니다. 하물며 이 정도로 전문적인 글을 친절한 설명으로 풀어내려면 얼마나 많은 정성이 들었는지 조금은 짐작하고 있습니다. 잘 읽었습니다.
13/11/20 15:13
이런 글은 추천부터 하라고 배웠습니다.
스포츠 중에서 통계의 스포츠라고 할 수 있는 야구에 대해 더 깊숙히 알 수 있게 도움이 되는 글 같습니다.
13/11/20 15:32
저도 통계학 공부하고 있는입장이라 세이버메트릭스는 관심이 정말 많이갑니다.
회귀분석 배울때 야구데이터로 이것저것 넣고 돌려보기도하고 했던기억이 나네요 혹시 주자의 능력을 평가하는 지표로 어떤것들이 있는지 소개해주실수있을까요? 주자가 다음타자의 방망이에 얼마나 영향을 주는지 어떤 선수들이 주자로 나갔을때 팀 득점에 보탬이되는지(다음타자에게유리한환경 제공+베이스런닝도합)등을 정리한다면 1번타자들의 가치를 더정확히 매겨 볼수있을거 같아서 말이죠
13/11/20 16:41
발 빠른 주자는 투수를 혼란스럽게 하여 다음 타자에게 이득을 준다. 같은 대부분의 사람들이 예전부터 막연히 생각했던 부분들은 세이버 매트릭스에서 대부분 손을 댄적이 있는데 사람들의 생각과는 다르게 부정적인 결과들이 나온걸로 기억합니다. 아마 수비가 혼란스러워 지는 것을 상쇄할만큼 타자에게 부정적인 영향을 끼친다, 도루 시도는 타석에 wOBA 20만큼의 손해를 끼친다. 라는 결론으로 기억하는데 가물가물하네요. 물론 베이스러닝 자체를 부정하는게 아니고 타석에 들어선 타자에게 이득을 준다 같은 부분에서 말이죠.
베이스러닝에 관한 스탯이라면 추가진루 같은 부분은 UBR이라는 스탯으로 , 도루에 관해선 wSB 라는 스탯으로 팬그래프에서 확인할 수 있습니다. 살펴보면 리그 최고의 주자와 최악의 주자간에 WAR 2정도 차이가 나는걸로 보이네요.
13/11/20 17:19
영향이 없다 정도가 아니라 오히려 까먹는다는 결과가 있군요
주자가 투수에게 주는 혼란이 존재한다고 하더라도 혼입되는 변수가 워낙많아서 측정해내기는 쉽지않아보이긴하네요 제 생각에도 팀에서 작전을 걸고하면 분명 타격에 도움이 되지 않을거같은 부분이 있는게 작전이 걸린 타자들은 자기스윙을 못하거나 진루타를 위한 팀배팅따위를 한다면 본인은 아웃이되서 타격스탯은 까이게되죠 또 도루를 할때 헛스윙으로 포수를 방해하는 이런것들이 당연히 타자의 생산성을 까먹을것같기는합니다.
13/11/20 17:08
이런 지표들을 볼때마다 궁금한게 메이저 자료를 가지고 회귀분석을 이용해서 앞에 계수들을 찾을텐데 그럼 그걸 그대로 kbo에 적용할수 있는가 입니다.
분명 kbo와 메이저는 차이가 있을거 같거든요. 아니면 앞에 계수들을 그대로 적용해도 상관없는건가요.
13/11/20 18:11
물론 차이가 있으니 그대로 적용하는데에는 문제가 따릅니다만 중요한건 현재 한국야구에서 그만한 정밀하고 방대한 데이터를 구할 수가 없다는거죠. 그리고 차이 자체도 그렇게 그렇게 크게 나진 않을겁니다.
13/11/20 18:30
요즘엔 보통 타석에서의 생산력 관련한 스탯은 wOBA로 대동단결인데 런밸류는 어차피 매년 따로 구하는거라서 직접 계산하는건 힘들어도 해주시는 분들이 계셔서 찾아보는데에는 상관없을 거에요. 직접 스탯 계산하실 분들이면 저런 부분에서 실수 하지는 않으실테니까요.
|