以致于没法给出一个算式

  CBA的赛季奖项的投票都完成了,风波闹的挺大,但反正也结束了,恭喜获奖的球员。事情后续的影响可能还会持续很久。开心的不开心的我想大家情绪最大的时候也差不多过了,我写点纯科普性质的,因为我看了很多讨论,有不少误区,稍作解释吧。

首先,我个人更支持完全开放式投票,即没有候选人,完全信赖记者(否则也没什么办法了对吧?)但是CBA方面觉得还是有这个必要,看很多球迷的反映也对投票记者并不完全信赖,那反正这不是我要考虑的事情,我接到的任务就是找到一个评选MVP上比较合适的数据。我觉得最有价值球员中所说的价值几乎等同于胜场贡献,一个球员的价值如果不反映在赢球上还能反映在哪?目前几乎所有一体化数据模型的建立者也都抱有相同的价值观,无论你去看LEBRON,PIPM,RPM,BPM,RAPTOR,DPM,PER,它们都有对应的累积胜场贡献值,你能为球队带来多少胜利就是你最根本的价值。所以这个筛选MVP候选人的数据当然就从这个角度着手。CBA目前的数据采集条件有限,技术上落后于NBA是众所周知的,手头可以采纳的数据只有PER(以及衍生的累积贡献值EWA),WS,VORP,以及我自己之前做过的REC(以及对应的WINS)。PER是John Hollinger在2005年提出来的,WS则是Dean Oliver在同年出版的Basketball on paper中从棒球数据借用过来的概念,理念上属于上一代一体化数据,在篮球数据的发展史上确有一些地位,时至今日在一些特殊场景也仍有应用价值,但总的来说,理念上已经落后了。BPM的最新版本是去年刚刚重构的,理念上脱胎于2011年推出的RAPM,它的原版对数据样本需求非常大,且结果不稳定,但经历了几年的发展和改进,衍生出了很多可应用的不同版本,其中包括最著名的RPM,目前篮球数据分析的公开领域,几乎所有PM型数据都是以RAPM为基础的。其中的BPM是唯一一项在CBA目前条件下可迅速计算的数据。我自己的REC和BPM的重合度很高,我做这个数据的初衷是因为BPM的1.0版在16-17赛季被证明在衡量高球权球员时会严重失真,而CBA正好有大量高球权的外援,而且BPM把出场时间和是否首发作为一项“教练观点”放在模型中,但我们知道CBA的出场时间和是否首发由于外援政策的影响,和NBA差异很大,实操后我发现确实不适合CBA。所以我自己在RAPM的基础上按照主流思路结合CBA的情况做了REC,后来证明,REC和BPM2.0的结果十分接近。但REC相对BPM2.0还是太简陋了,也不区分攻防两端,既然有了BPM2.0,那大可以拿来主义,不必拘泥于自主研发了。不过BPM在CBA计算VORP时并没有采用原版可替代水平的-2,而是用了-5。这是基于CBA的实际情况做的调整。因为我在做REC的时候就发现了一件事情,CBA的整体水平很低,我们国家的篮球人才并不足以支撑一个20支球队的职业联赛,加上外援的影响,CBA联赛的实际可替代球员水平(即联赛边缘轮换球员的水平)其实在-4.8到-5左右浮动。这个水平以上的球员在CBA正好是240人左右,即每队12人。如果按-2的标准来看,那我们的联赛其实只有一百人左右是配得上打职业的。

BPM的具体计算,我看虎扑上有很多人讨论给了公式,我想说,那个公式是1.0版的,现在版本并不是这样的。目前的版本要复杂的多,以致于没法给出一个算式。BPM目前的计算是统合了得分篮板助攻这些所有面板数据统计经过百回合标准化后的线性模型,具体的权重对于每个球员是不一样的,需要根据球员的位置打法进行调整。因此,为了计算这个,这赛季其实特地要求CBA联赛在球员注册时注明具置,而不是过去的前锋后卫简单划分。在各支球队上报的位置信息的基础上,再根据球员的比赛数据估算他们的真实位置和进攻角色,分配相应的权重。这样计算出来的初始BPM,会再一次进行加权计算,以匹配球队的实际表现,也就是说,数据中包含了球队化学反应和一些面板数据不能体现的作用。

因为沈梓捷和胡金秋这项数据非常好看,有人会有这种疑问很正常。但其实完全不是,准确说,这项数据是不喜欢低效持球手,当然也不喜欢低效吃饼的。对于中上效率的高球权持球手,数据还是非常友好的。比如一众小外援的这项数据就很漂亮,本土球员像郭艾伦,吴前,他们算不上非常高效,只是平均线以上效率的高球权持球型球员,但因为还有额外的传控贡献,OBPM其实都很不错,是本土球员中前三的。甚至得分效率偏低的西热力江,因为传球贡献大,OBPM也不差。相比较而言,沈梓捷虽然得分效率很高,但他没有传球贡献,也不能像胡金秋一样提高产量,他的OBPM就不是很出色了,他的整体数据好,主要来自防守端。但如果你效率真的很低,组织,防守贡献也都不出彩,仅仅是高球权,那确实不受这项数据青睐,你或许会说你是持球核心,你负担大,你遭遇的防守压力大,但如果你效率很低,从我的角度看,那只能说明你的能力匹配不了你的角色,你持球多不代表你真的有持球能力,你只是恰好被分配了这个角色而已。

当然是啊,你都说“不一定”了。类似的难题其实在BPM的原作者就遇到过,他在BPM移植到NCAA时就和众多同行讨论过这个话题。最后的结论是,如果客观条件无法做完整的适应性调整,那就按照原来的做,任何没有依据的改动都是不合适的。BPM的系数来自于15年份的RAPM回归计算,而RAPM需要精准的pbp数据,在CBA的现有条件下,没有这种足量的积累,这项数据在CBA,直到本赛季采集上都还有很多问题没有解决。有一些人质疑这项数据对抢断的高权重。客观上确实如此,CBA由于技术水平低,比NBA有更多的失误,因而抢断也多,施加在抢断上的高权重会很容易体现在防守端数据上。但这里存在的疑问是,抢断多一定代表抢断价值低么?比赛并不是一个市场供求关系,东西多了价值就低了。甚至反过来说,CBA的阵地战进攻水平更低,可能意味着对快攻反击的更多依赖,联赛水平越低,联防,全场紧逼,快攻反击所发生的频率就越高是一个客观规律。所以在有确凿证据证明CBA更多的抢断导致更低的价值之前,我并不觉得应该调整这一项。

很多人把高阶数据理解为和基础数据并驾齐驱的一个分支。看起来很理性客观的说“高阶数据要看,基础数据也要看”。其实不是这样的,至少不完全是这样。比如投篮命中率属于基础数据,有效命中率是高阶数据,两者绝对不是并驾齐驱的两个分支,而是后者完全凌驾于前者,有了后者,前者就是废物数据,不值一提。为什么呢?因为后者的出现就是为了解决前者所存在的问题。在有三分线的比赛里,三分线内的投篮和三分线外的投篮,价值就是完全不同的,凭什么放到一起算?一个球员只投三分,50%命中率,和一个球员只在篮下出手也只有50%命中率,水平和价值难道是一样的么?投篮命中率不仅不能帮助你看懂比赛,反而会误导你。反过来说,只看有效命中率可能是不够的,因为不足以得到真正的细节,一个球员有效命中率低是因为他篮下黄油手,还是三分三不沾,是纯粹的投篮不好,还是踩着三分线投了很多差一点能算三分的两分,这当然是不一样的。但无论球员之间达到某个结果的过程如何,最终,有效命中率可以做到一个数值清楚的描述球员运动战的出手效率。BPM也是类似的情况,它已经涵盖了得分篮板助攻这些基础数据在里面,并做了处理,解决了你只把这些基础数据简单相加所会遇到的误区,能够更准确的用一个单一数据描述球员表现,它在某个特定的应用场景里能完成这个任务就足够了(比如看球员赛季总累积贡献)。至于你要去了解更多细节的内容,那你就去看更多的数据,而不是盯着得分篮板助攻,只看这些够了么?出手数不用看么?失误数不用看么?当我们说着什么20+10+5的时候,我们不是在回归本源,我们只是在粗暴的简化描述罢了,掩盖的东西远比表达的东西多。

数据不能代表一切这句话一直是质疑数据的人喜欢挂在嘴上的。但只有真正了解数据的人才知道它的具体意味着什么。在BPM模型中,OBPM实际已经非常完善了,从过往和其他数据的比对来看,进攻端的可信度非常高。但防守端仍然有一些问题,过去几年,基于更准确的pbp数据的PIPM也有过CBA版本,但这不是一项公开数据,随着作者进入大型数据顾问企业,这项数据就作古了。从PIPM的过去数据来看,BPM的防守端大体上还可以,诸如高抢断的赵继伟在PIPM中的表现也是顶级的,但BPM可能低估了一些护筐协防大师,尤其是不直接贡献盖帽的协防手,比如翟晓川,甚至周琦。但还是那句话,现阶段,CBA的条件目前只能做到这里了。这也是我之前说,这项数据能用来划分范围,而不是直接决定MVP,直接精确定位一个最好的球员做不到,划个十来个人把最好的球员框进去很难有问题。那反正提到这茬了,我再多说几句,有一些球迷,包括媒体朋友,替我说话,描述了一个随着赛季推进,发现了问题,努力补救,但最终无果的愤怒乙方形象。这个形象的后半段是真的,我确实为了最终候选人的合理性努力过,但各种各样原因反正没成功就是了。但前半段真是各位想多了,我去年八月写了方案,当时手头已经有了四年份的数据,VORP几乎每年都有多名同队球员进入前十,这是明摆着的事,根本不需要后来在赛季中才发现,初版方案中当然也不会限制每队只能一人,甚至每队必有一人。虽然联赛规则是赛季前就定的,但我看到成型的联赛手册上的最终方案里多了这一条时,其实已经是1月中旬了,当时我就提醒过这事。三月初的时候又提了一次,一直到三月末郭艾伦连续休战,事情才终于变成了最糟糕的情况,后面的事情只能说身处不同位置,看待事物的角度确实不一样,虽然不认同但也不是完全无法理解吧。

昨天:过去几年mvp都是bpm前三的,公式没有问题,郭艾伦第六,是他自己不行今天:公式就选个候选人,不要在意公式,吴钱人品好,球品好,浙江战绩好,选他实至名归

天王老子来了这次评选都不合理,某南方评委把周琦放在前场第三郭艾伦放在后场第4[虎扑表情-你xx真是个人才],这就是合理吗

网络刷单是违法,切莫轻信有返利,网上交友套路多,卖惨要钱需当心,电子红包莫轻点,个人信息勿填写,仿冒客服来行骗,官方核实最重要,招工诈骗有套路,预交费用需谨慎,

低价充值莫轻信,莫因游戏陷套路,连接WIFI要规范,确认安全再连接,抢购车票有章法,确认订单再付款,白条赊购慎使用,提升额度莫轻信,网购预付有风险,正规渠道很重要!

推荐文章

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注