Sabermetrics提供了很多不熟悉如何以傳統方式評估球員實力的球迷們一種評估球員能力的門道,但是一直以來各種數據諸如XR、WAR、Winshare都有諸多限制(特別是WinShare極度地無用),原因非常複雜,其中一個原因就是:選手可以很輕易地光靠傳統數據區分出全明星、一般先發、隨時面臨失業風險的浪人三個類型,不需要靠這些進階數據。這些進階數據主要是提供了運算的支援,比方說我們雖然可以把選手區分為這三類,可是我們無從得知組成這樣一隊之後,這個陣容的整季勝場數多少,但是我們可以把整隊的WAR加在一起,推估出大概幾勝,而且Variance不會很大。
但是這僅限於回顧測試的時候,開季的團隊WAR對預測該隊整季的勝場數毫無幫助。
最主要的原因自然是因為MLB的團隊陣容與其他職業運動不同,每季都會有劇烈的變化,而731半季交易大限制度更促使那些已經爭冠無望的球隊會透過交易"以現在換取未來",因此開季的WAR值貢獻預估,往往因為季中換了一堆人而失準。在運動家尚有競爭力的時代,開季WAR值預估往往都只有五成勝率上下,然後透過交易想辦法衝分區或外卡,開季WAR值可以說毫無參考價值。因此WAR值在現代,主要的應用是評估季中頻繁交易後,對各隊陣容的改變,以及用來評估這個交易"誰搶劫了誰"。
而評估的方式,往往是用"用每一WAR要花多少錢的選手,換了每一WAR要花多少錢的選手,因此我們總共淨賺多少WAR,多花/少花幾M的錢。"或是類似的計算方式。fangraphs這篇文章說明了為什麼這樣的計算沒有太大的意義,對於一般人可能不是很好理解,但是學finance特別是derivatives pricing的人應該是非常好懂。這樣的質疑已經存在已久,這篇算是非常統整性地說明原因,如果你想看中文的可以看批踢踢MLB板的翻譯。
除了這文章中提到的WAR用來計算CP值的諸多問題外,WAR本身使用的時候要進行加法計算的諸多限制,則是一個根本上動搖WAR用處的疑問。我所說的並不是chemistry那種無法量化的東西,而是WAR的變化並不是A+B-C,拿兩個人去替代一個人後計算淨變化這麼單純的東西,要確保加法的結果是A+B-C那麼簡化,你得確定A、B、C三名選手的防守相近,與同區高頻率對戰對手的對戰模式相近,否則若C選手是一個金手套鳥槍右外野,身為一個主場外野超巨大的球隊拿一個鳥守恐左大砲A跟殺左有手套的長槍去替代C,完全不能保證會得到如預期的WAR值。單筆交易的誤差或許不會很大,但是在頻繁的交易下你更不能保證誤差平均值是0。
既然WAR在季初使用僅有意淫的作用、也不太能衡量交易的CP值,甚至拿來評估自己交易後陣容的勝場數變化都不太準,這個數據豈不是絕望到了極點嗎?Sabermetric的核心精神甚至可以說被更加精通數據的quant一拳打斷了鼻梁,可以說完全廢了WAR的功用,fangraphs那篇文章中的各方論述應用了derivatives pricing常見的各種方法,老實說作為這行的從業人員我只能說拿來修理1WAR多少錢這種只會加減乘除的人,真的是剛好而已。
問題是,這只不過是引入更複雜的方法論罷了,仍然找不到問題的完整解決方案,因為derivatives pricing最大的困難就是calibration。什麼意思呢?比方最簡單的Black-scholes公式是透過Girsanov theorem把在給定假設前提下(無套利假設)的資產價值變換到風險中立測度上,只要知道該資產價值的波動率跟無風險折現率,似乎就可以算出漂亮的價格。可是實證上陽春的Black-scholes公式已經被證明如同廢物一般無用了,因為在不完全市場下:市場對不同履約價、不同波動度、不同交易量的資產都有特殊的偏好,會使得使用Black-scholes公式算出來的理論價一點用都沒有,你必須用別的方法去計算出波動度,比如使用最近一筆成交價去反推出該筆成交價對應的波動度,稱之為隱含波動度。問題是隱含波動度在不完全市場下往往對trader而言是我們沒有那個屁股不要學人家吃那個瀉藥,仍然無解。
from MLB @ 運動視界 Sports Vision http://ift.tt/2z6kShM
留言
張貼留言