作者tim19990312 (帽子裡的兔子)
標題[專欄] 關於EPM改版
時間2024-11-20 15:03:46
https://reurl.cc/lNVzxj
作者:籃圈即是原點
每天都刷BBE的朋友可能已經發現了,BBE首頁的一體化數據頁面做了一些小調整,主要是
為了應對這賽季EPM的徹底改版。
EPM在這賽季的早些時候上了個全新的版本,這次變化不是簡單的算法優化更新,而是讓E
PM完全變成了另一個數據。過去的單賽季EPM是根據當賽季數據計算的球員賽季表現。根
據作者的意圖,它既是一種面向未來的前瞻性數據,也是一種對當賽季已經完成了的比賽
中球員表現的解釋性或者總結性數據,但是新EPM則是完全的前瞻性數據,提供一種近未
來的球員表現預測。
新EPM的含義和思路基本上和Kostya Medvedovsky創建的DARKO一致。之前我聊過一次幾個
常見一體化數據的對比,當時單獨撇開了DARKO系統中的DPM,就是因為DARKO是思路最特
殊,意圖也完全不同的數據。新EPM和DARKO都采用了機器學習,並且根據球員整個職業生
涯到目前為止的表現,來估算當下這個時間節點下,球員在下一場比賽最有可能打出的表
現,所以他們都是每日滾動更新的。
在DARKO系統中,最核心的其實是對球員面板數據的預測,DPM反倒是個順便產生的數據,
它最初的目的在於回答「當一個球員打出了某種數據,我們該認為這是隨機性帶來的噪音
,還是具有長期意義的水平變化」這個問題。它把球員整個職業生涯的數據都納入計算範
圍,並且給每一項數據設置了一個在0-1之間的參數,並附帶一個和時間軸相關的指數模
型,即越近的比賽在計算中會擁有越高的權重。不同的數據項目會有不同的參數來應對這
項數據本身的穩定性,比如三分命中率遠期數據權重就會比籃下命中率的要高,因為三分
命中率本身的隨機性更大,長期表現更可靠。
DARKP和新EPM通過這種方式把球員的進步或衰退動態地體現在數據中,獲得更好的預測效
果。所以,如果一個球員在新賽季開賽後有一個爆發式的進步,模型在一開始並不會立刻
反映這一點,而是會基於生涯數據對這種進步只給出謹慎地評估,但隨著賽季的進行,球
員持續保持這種水平,近期的比賽數據就會把它視作長期的水平變化反映在預測系統中。
例如Garland在開賽首周後的O-EPM只有+0.8,更接近於他上賽季的表現,兩周後就上升到
了+1.8,現在上升到了+2.8。在舊EPM,LEBRON等xRAPM數據,包括基於面板數據計算的BP
M,PIPM等一體化數據中,我們在賽季初期可能會看到一些很誇張的數值,之後才會因為
樣本增大,數據逐漸趨向穩定(所以他們經常要開賽一兩個月後才公布,BPM的小樣本爆
炸則很容易看到)。
與DARKO的面板數據預測一樣,伴隨新EPM一起上線了Estimated Skills系統,它也給出了
球員面板數據的預測,我個人不玩FBA,不知道DARKO和EPM的這種預測對玩FBA有沒有幫助
,但DARKO的作者聲稱它的系統在FBA遊戲中的預測表現很不粗,至少肯定強於此前市面上
一些網站的表現。
EPM的這次更新對很多pvp玩家來說,價值暴跌,畢竟不再是單賽季的表現綜述了,對線的
時候用起來很不方便,描述本賽季表現得時候並不合適,之前發開賽影響力數據圖得時候
我也用了LEBRON而不是新EPM。不過無論是新EPM還是DARKO本身仍然是非常有價值的,NBA
業內人士有不少也都認可DARKO這種思路,EPM現在也往這個方向上走,或許正說明了這是
一體化數據未來發展的趨勢,所以BBE就借這個機會也把這兩項擺上去方便大家看。比較
遺憾是這類數據的動態變化部分BBE的框架沒法展示。
最近因為更新,可能會連帶出一些bug,有遇到的話可以給我留言或者私信。
--
※ 發信站: 批踢踢實業坊(ptt.org.tw), 來自: 223.137.84.233 (臺灣)
※ 文章網址: https://ptt.org.tw/NBA/M.1732086229.A.F7C
推 MK47 : 優文 11/20 15:12
推 phoenix286 : 感謝分享 11/20 15:16
推 viagraho : 就是變成傾向描述能力,而不是評估貢獻就對了 11/20 15:19
→ steven183 : 真假 11/20 15:47
推 ralpoph : 推 優文 但大多數人不會看 11/20 15:51
推 kkl522608 : 優文 感謝分享 11/20 15:56
推 surfingbboy : 是不是該可以改看LEBRON這個高階數據 11/20 16:09
推 s1290272 : 感謝分享 11/20 16:11
推 chih2loveu : 推 11/20 16:27
→ chih2loveu : 順便問問看 RAPTORS是不是沒了(538被併購) 11/20 16:27
→ LYheha : 推推,我前陣子還以為Epm數據很怪,後來才發現原來 11/20 16:30
→ LYheha : 是改版了~這樣改動比較可以減少極值影響,增加機 11/20 16:30
→ LYheha : 器學習預測數據真的是很讚的變化 11/20 16:30
→ tim19990312 : RAPTORS原作者後來自己搞的 11/20 16:32
推 yoyodjy : 想說怎麼跟上賽季那麼接近 11/20 18:24
推 x123987789 : 推推 11/20 18:44
推 Myosotis : 感謝分享 11/21 02:04