懂球帝首页>足球新闻> 懂球号> 眼见不一定为实,数据不一定“不说谎”

眼见不一定为实,数据不一定“不说谎”

懂球号作者: 羽则 2019-07-21 12:15

数据从不说谎。1个进球就是1个进球,2次助攻就是2次助攻,3次抢断就是3次抢断。统计数据就在那里,永远都是不偏不倚。

但利用数据得出的结论经常骗人。射门转化率高的前锋就真的更能把握机会吗?创造机会多的中场就真的有更大的进攻贡献吗?抢断多的后卫就真的防守更好吗?今天,就让我们来好好聊聊那些关于足球数据的理解误区。

为什么数据会和现实冲突?

众所周知,这是一个属于大数据的年代。各种“15到30岁的人群平均每周花多少小时看直播/打游戏/看小说”的新闻层出不穷,广告里充斥着“连续N年销量领先”和“每十户家庭就有八户用XX”,明星们的微博粉丝和热搜数字直奔千万和亿级而去,就连你打开任何一个购物网站,首先看到的推荐商品都是根据你以往的浏览与消费而自动生成的。

但这些所谓的大数据都对吗?为什么有的数据看起来言之凿凿,却和我们日常生活里的所见所闻好像并不一致呢?

来,让我们先看几个有趣的例子。

案例一:德国一家全国性报纸曾经发过这样的报道,20岁以下的青少年自杀占到了全国自杀总数的25%,30-40岁的人占到了10%,超过70岁的老人自杀占比不足2%。因此他们得出推论,年龄越大自杀比率越低,我们随着年龄的增长会变得越来越容易找到幸福。

背后的故事:很快就有专业人士站出来吐槽了这家报纸,从总人数来说这样的数据没有问题,但忽视了各个年龄群体的总人数。实际上,随着年龄的增长自杀率反而会不断上升。德国20岁以下的青少年自杀率不到10万分之1,但70岁以上老人的自杀率则接近10万分之50。

这叫从片面数据得结论。

一叶障目,只站在一个位置自然只能看到一个角度,多几个角度的数据往往才能看到全貌。

案例二:特朗普2015年曾经发过一则图文推特,图上表示美国大部分凶杀案都是黑人犯罪,数据来源于“旧金山犯罪统计中心”。当时正值参选美国总统期间,他因为这条推特受到了很多黑人的强烈抨击。

背后的故事:这个什么“旧金山犯罪统计中心”压根就不存在,这是一条不折不扣的假新闻。

这就叫虚假数据。

就像某些流量明星发条微博动辄转发一两亿一样,疯的不是这个世界,而是相信这些“数据”的人。

案例三:1999年到2009年的十年间,美国上吊等窒息自杀的人数与政府的科研支出保持了惊人的同步增长,相关系数高达99.79%!这一定存在着某种不为人知的蝴蝶效应!

同一时间段,美国在游泳池溺死的人数也和尼古拉斯-凯奇参演电影的数量基本保持着同步变化,相关系数也达到了66.6%!这位曾经的影帝每多拍一部烂片,竟然就有更多的美国人会在后院结束自己的生命!

背后的故事:这两张图其实来自于一家专门嘲讽大数据的网站,图片制作者先是找出两组毫不相关但曲线相似的数据,然后强行把他们搭成一对。

这就叫从数据倒推出现象。

抛开观察谈数据,一切都是耍流氓。

在我们的生活中,这些片面分析数据、制造假数据、从数据强行倒推出现象的情况屡见不鲜,足球圈里同样如此。所以接下来,就让我们回去看看那些常见的足球数据,找找看有没有类似上文的理解误区。

射门转化率不一定等于效率

射门转化率是什么意思?拿进球数除以射门的总次数,得出百分之多少的射门最终转化成了进球。射门转化率更高的前锋,理论上可以用更少的射门取得更多的进球,这不明摆着就是效率更高吗?

很多人估计都是这么理解的。比如去年底,我曾经听过某位踢FIFA用时远超看球的友人(这个真不是内德)说了这样的一个观点:奥巴梅扬是英超射术最好的前锋。他的主要依据有两个:一是他在FIFA里用美羊羊的进球率远超阿圭罗、凯恩等人;二是当时有这么一个新闻,奥巴梅扬联赛射门转化率超过了30%,比任何其他球员都高出5个百分点以上。

第一点这里就不吐槽了,咱们重点聊聊第二点。这个数据其实是正确的,而且奥巴梅扬不仅当时的射门转化率高得惊人,整个赛季下来射门94次也打入了22个进球,23.4%的射门转化率在英超所有球员里排到了第四位。

可能有的阿森纳球迷已经感受到疑惑了,按理说射门转化率越高不是代表着射术越精吗,为什么在我们上赛季的观赛印象里,他明明就能出个超过十分钟的“吐饼”集锦呢?

这种印象其实也是正确的,请看英超官网发布的另外一项数据:球员错失绝对机会次数榜。在该榜单里,奥巴梅扬以单赛季23次“吐饼”笑傲群雄。

为什么会这样?

让我们回头看看射门转化率:进球数/射门次数。这只是一个简单的数据,毕竟门前三米面对空门是射门,在多人包夹防守里强行起脚远射也是射门。单看射门转化率,其实并无法准确衡量每一脚射门的难度和质量。如果单用这个数据来评断射术,那就犯了前文“片面数据得结论”的错误。

话题回到奥巴梅扬身上。众所周知,埃梅里麾下的阿森纳非常执着于这么一个进攻套路:倒三角。这种进攻套路里难的是如何从边路把球横敲到中间,门前抢到点之后的射门反而是相对简单的部分。因此,阿森纳在上赛季场均只有12.3次射门,在整个英超只排第11位。而他们创造了足足89次绝对机会排到了英超第5,比起射门总数多出自己71次的死敌热刺还要略高一点。

作为枪手的锋线头牌,奥巴梅扬射门转化率高也有部分原因是射门难度相对较低,而他错失绝佳机会如此之多也能从另一个方面证明他的射术并非顶尖。美羊羊无疑是一个非常优秀的前锋,但射门准度真的不是他最引以为傲的特点。

顺带一提,细心的球迷可能已经发现除了奥巴梅扬之外,威尔逊和瓦尔迪也同时出现在了射门转化率前十和错失机会前五的行列内,这也和伯恩茅斯前场逼抢凶猛、莱斯特城反击效率高,以及两队刀刃火力集中有着直接的联系。

至于错失机会很多但在射门转化率榜单上排不上号的拉什福德和热苏斯……这么说吧,拉师傅平均每90分钟能拿到0.8次绝佳机会,在曼联队内仅次于卢卡库;热苏斯每90分钟更是能有2次绝佳机会,比英超任何其他球员都多出至少50%,跑位能力简直达到了顶级巨星级别。

但他俩的绝对机会转化效率——分列英超六强锋线球员倒数第三和倒数第一。谁和他俩一起远远落后于其他前锋呢?莫拉塔。

创造机会到底是什么?

说完了锋线,我们再来聊聊中场。在评断进攻型中场的能力时,经常会看见这样的两个数据名词:创造机会(Chances Created)和关键传球(Key Passes)。单看字面意思,可能有些球迷会想到这样的画面:一记精妙直塞穿越对手防线,直接送到队友脚下形成绝对机会,也就是传说中的“烙饼”。

不过实际上,这两个词其实指的并不一定是多么精妙的传球,而是泛指形成射门前的最后一脚传球。Squawka等数据网站会把形成进球的最后一传列为助攻,没能形成进球的最后一传列为关键传球,两者相加为创造机会。Whoscored等数据网站则统称为关键传球,并没有创造机会的说法。

但不管采用哪种说法,反正关键传球并不一定真的很“关键”,创造机会也有可能根本就没有“创造”这一说。你在后场把球传给队友,他往前狂带30米重炮轰门,你都能在这项数据上+1。如果碰上某些神奇的队友,原地拨一下皮球都能变成创造机会或者关键传球,甚至还能“刷”出一次助攻。

当然,这个数据从微观上来说不一定能代表传球的质量,但从宏观角度还是可以说明顶级传球手的价值。2006年到2018年的12年间,欧洲五大联赛只有三名球员平均每90分钟创造机会的次数达到3次以上,分别是帕耶(3.06次)、托蒂(3.07次)和厄齐尔(3.5次)。

帕耶职业生涯始终没效力过太强的豪门,托蒂在统计开始的2006年都已经30岁了,各自有着让人佩服的地方。而厄齐尔遥遥领先的数据,足以说明谁才是真正的“欧洲饼王”。

但这个数据也有着一定的局限。比如球员A一脚精妙直塞打穿防线,两名队友反越位成功面对门将二打一,球员B轻松横传球员C破门。那么球员B会记上一次创造机会和助攻,真正重要的球员A那脚在常规数据统计只是普普通通的一次传球,没别的了。

因此,也有部分数据公司正在开发新的数据,比如射门前的倒数第二次和第三次传球。如果把射门前的最后1/2/3传加在一起除以出场时间,会有什么结果呢?2013年到2018年的5年间,英超这项复合数据的杠把子还是饼王厄齐尔,但还有一名球员以非常微弱的劣势紧随其后,两人遥遥领先其他球员。

大卫-席尔瓦。

不抢断也是好后卫

几个月之前,有一项非常受热捧的数据传遍足球圈:范戴克在2018-19赛季英超和欧冠联赛里没被人突破过。后来在利物浦和巴萨的首回合比赛里,虽然他依然没被任何人突破,但面对梅西等人带球基本只退守不上抢的防守风格,让部分好事球迷发出了“不抢断怎么被过”的评论,以及送上了一个“且战且退范戴克”的外号。

那么问题来了,不怎么抢断的后卫到底是不是好后卫?

先搬出两位传奇前辈来举个例子。在足球数据刚刚兴起的年代,分析师惊讶地发现了一个看似很不合理的数据:意大利后卫马尔蒂尼场均抢断只有0.5次。同样在那个年代,弗格森在数据狂助教麦克拉伦的建议下卖掉了斯塔姆,因为荷兰铁卫在脚踝手术之后场均抢断下降了几乎一半,俱乐部认为这代表着他再也回不到巅峰。

你说他俩算不算好后卫?

后来的分析师认为,这是因为他俩都有着丰富的经验和极其出色的选位,位置站好了别人根本就过不去,干嘛冒险去上抢?范戴克的“且战且退”也被认为是类似的道理,前锋们总是希望利用速度、盘带或者传球直接击败防守者,遇到跟随型反而会觉得更加棘手,随着时间的推移可以选择的处理球方式逐渐减少,心理素质不好的就会越来越焦急。

所以,才有了这种1V2的神级防守。

因此,当真不要太在意中后卫的抢断和拦截数据。有的中卫喜欢且擅长上抢,比如基耶利尼和德利赫特;也有的中卫属于拖后站位型,比如范戴克。这只是风格不同,并没有好坏之分。

更何况,按照足球战术的普遍发展方向,中卫作为门将身前的最后一道防线,除非万不得已一般不会被要求冒险上抢。不信你看下面这个英超2018-19赛季场均抢断次数的排行榜,前十不是后腰就是边后卫,没有任何中后卫的影子。

再举个例子,你猜谁是上赛季英超六强里数据最好看的中后卫?

答案是穆斯塔菲。这位阿森纳中卫在英超联赛里平均每90分钟有2.1次抢断,范戴克的1次还不到他的一半;有2次拦截,也接近于范戴克1.1次的两倍;有5.5次解围,超越范戴克的5.3次;还有0.6次封堵对方射门,依然力压范戴克的0.5次一头。

单纯从所有防守数据综合来看,穆斯塔菲的表现可以甩开范戴克好几条街,仿佛这才是堂堂正正的“世一位”。但是看过比赛的诸位,你们真的会这么觉得吗?

关于控球率的那些事儿

对于咱们这些中国球迷来说,看足球直播也真的是一件不容易的事儿。因为大部分比赛都在半夜,就算是铁杆粉丝,其实也很难要求他们绝不错过主队每一场比赛。更不用说五大联赛和欧冠的精彩对决这么多,必然会出现很多“一觉醒来”看看比分和新闻的情况。

在这种时候,也有很多人会扫一眼各项数据,从而对比赛场面有个大概的粗略了解。其中最重要的一个参考项目,就是控球率。

(图)巴萨无疑是高控球率的最杰出代表

那么,你知道控球率是怎么算出来的吗?

控球率=控球时间/双方控球总时间。所谓控球时间,指的是球在本方球员控制下,以及传球未被对方接触之前的时间。双方控球总时间为两者控球时间之和,也就是90分钟减去死球时间之后的净比赛时间。

实际操作里,有些数据公司使用了高速摄像机自动捕捉和计算控球时间、记录员剔除死球时间的“机器+人工”操作,也有些数据公司直接使用了纯手工录入每个起止点的传统方式,因此造成了同一场比赛不同数据网站显示控球率各不相同的现象。

而这个好不容易统计出来的控球率,就一定能概括场面上的谁优谁劣吗?

这个问题如果放在十几年前,答案是“能”。但放到今天,答案只会是“不一定”。

在控球率这一概念被数据公司推到舆论面前的初期,人们很快发现控球率越高的球队越有机会赢得比赛的胜利。这不难理解,你有更多的时间把球控制在自己脚下,自然会有更多的进攻机会去争取进球。2007-08赛季英超联赛里,控球率不超过40%的一方最终只赢下了19场比赛,可以说输掉控球权就约等于输掉了比赛。

但到了2015-16赛季,同样是控球率不超过40%的一方,其胜利场次已经达到了52场,比八年前的两倍还多。

那个赛季,莱斯特城以场均倒数第三的42.4%控球率和倒数第二的70.5%传球成功率,成为了反击制胜的最佳代言人。

国家队的大赛同样有着相近的趋势。2010年南非世界杯,控球率低于45%的球队赢下比赛的概率只有可怜的3%,西班牙式的传控足球达到了巅峰。但到了2016年欧洲杯,控球率低于45%的球队赢下比赛的概率已经疯涨到了30%,足足是六年前的十倍,葡萄牙改头换面的防反笑到了最后。

当然,我的意思并不是什么“传控已死反击当道”,控球率更高的球队一般情况下依然有着更好的场面和更大的胜率,尤其是在漫长的联赛里。但伴随着足球战术进一步走向多样化和复杂化、杯赛各队实力差距逐渐拉近,有更多的球队选择主动让出部分控球权,来换取更好的反击机会。这样的球队,进攻威胁未必就比主打控球的对手更少。

控球率的绝对意义,或许正在慢慢变淡。

写在最后

熟悉我的读者都知道,我大概是懂球帝里最喜欢用数据的专栏作者(笑)。没错,作为一个曾经多年工作都在和财报打交道的人,我对“冷冰冰”的数字的信任程度,或许比知面不知心的活人还要更多一些。

但我个人在分析比赛时始终保持着一个原则,那就是:先看比赛得出观点,再去寻找数据来验证正确与否。因为水平有限和每个人的理解差异,可能有时我对一些数据的看法和部分读者所想的并不一致,但至少能说服自己。

数据不说谎,但千万不要迷信你看到的所有数据。

懂球号作者: 羽则

不代表懂球帝观点

消息参考来源: 懂球帝

严禁商业机构或公司转载,违者必究;球迷转载请注明来源“懂球帝”

热门评论(18)

2019-07-21 12:28:07

1516

看到这个榜单第六位

就再也不相信数据

查看回复(65)

2019-07-21 12:25:20

1376

说我干啥

查看回复(21)

2019-07-21 12:30:51

1077

把青蛙🐸的腿砍掉,大聲叫喊它也不會跑…

由此得出結論:這種動物的聽覺神經在腿上,砍了它就聾了…

數據不會說謊,說謊的是計算數據的規則和操作數據的人~

查看回复(112)

2019-07-21 12:38:36

687

看到这个数据你们可能认为这就是一个普通前锋,但真实情况是这个人叫切尼,是个巴西门将,职业生涯进了131个球

查看回复(60)

2019-07-21 12:29:18

618

看到最后我才发现这个帖子发出来就是专门黑穆斯塔菲的

查看回复(8)

2019-07-21 12:29:26

573

这篇专栏很有深度

所以我相信

范戴克确实不如穆斯塔菲

查看回复(7)

2019-07-21 12:22:05

435

吹爆布斯克茨!世纪助攻

查看回复(38)

2019-07-21 12:35:17

326

数据不说谎?

查看回复(47)

2019-07-21 12:29:15

261

实则吹我厄祖??? 希望下个赛季厄祖状态回来一点,那就很舒服了

查看回复(8)

2019-07-21 12:36:46

207

这不是刷的,布教授这脚可是世纪助攻

查看回复(7)

2019-07-21 12:23:18

205

拜仁不一定有人。

查看回复(7)

2019-07-21 12:24:39

197

厄祖真的没有喷子们说的那么不堪

查看回复(17)

2019-07-21 12:38:08

186

又奥巴梅扬又厄齐尔又慕斯塔菲又传控,这篇文章是写给阿森纳球迷看的

查看回复(9)

2019-07-21 12:41:52

172

因为人的情绪是一直变动的,结果自然千差万别。鬼知道那一瞬间他是内向、内鬼还是内急?

查看回复(2)

2019-07-21 12:19:44

163

对手可能复姓伯恩……

查看回复(7)

2019-07-21 14:51:52

10

其实说,如厄齐尔这种类型的球员,本身就不应该把体力消耗在回防上,很现实的的一个问题,从球员本身出发,一个人一场比赛的体力是一定的,厄齐尔的耐力是属于平均偏下的水平的,C罗为什么耐力和身体这么好,一部分也是有黑人基因的原因,我的意思就是个体存在差异性,那么这就影响了球员的踢球风格,很多人看到厄齐尔在场上散步慢跑,拖节奏,反抢和回防不积极,这是他保存体力的方式。厄齐尔年过三十了,体力也肯定不如以前,他习惯在中圈靠前的分球和在禁区附近进行组织、威胁球传递,而体力的过度消耗会导致技术动作走形,那么这最后一传或者是最后两三传的精度和力度就会产生不确定性,岂不是舍本逐末,只能说在爱美丽的战术结构里,在阿森纳的后防基础上,厄齐尔的存在会给球队防守端产生负担而很挣扎,至于说拖节奏这一点,有一部分考虑是,厄齐尔有着保护球权的意识,他是传威胁球,可他不会看到机会就传球,所以他特别注重视野,把握我方球员的位置,一般观察后才会出球,以上个人见解

查看回复(2)

2019-07-22 00:08:04

9

先搬出两位传奇前辈来举个例子。在足球数据刚刚兴起的年代,分析师惊讶地发现了一个看似很不合理的数据:意大利后卫马尔蒂尼场均抢断只有0.5次。同样在那个年代,弗格森在数据狂助教麦克拉伦的建议下卖掉了斯塔姆,因为荷兰铁卫在脚踝手术之后场均抢断下降了几乎一半,俱乐部认为这代表着他再也回不到巅峰。

我就对这一段话作出解读 首先是马尔蒂尼 马尔蒂尼抢断数据不明显的原因实际上不是第二段那些虚头巴脑的东西 我话放这 没看球的可曾明白 米兰的左中路对比边后卫助攻频率更高的右中路还要有更多的上抢 实际上 真正的原因在于米兰的防守策略 一支能控制住皮球进攻端依托节奏变化吃人的大陆球队同样可以利用本方的技术优势强行降速给我方后卫制造大量缓冲纵深 常理看 以速度著称的曼联本应该给年龄偏大的米兰制造巨大威胁才对 但是米兰成熟可靠的控球体系保证了两点 一 我控球时候你抢不着而且你不敢过份抢因为我有卡卡 二我即便丢球 但是我的人全在后面 而且是呆梨中球队后场有先进的轮转 即便你得到了球 你也打不起快攻 菱形中场或许就代表了意大利足球的精髓 用中路的厚度磨死人 以且战且退的防守轮转抵消对面的反击速度 随便挑两场具有意大利代表的比赛都会发现 从中线开始 任意一个局部 蓝色衣服的人永远比其他颜色的人要多 米兰的强大之处在于皮尔洛和西多夫于传统意大利中场的升级 他们还能控球和传威胁球 这意味着能以我为主滴选择比赛形态 我可以有考虑现在打你还是过会打你 而不是类似于斯科尔斯那般得球后必须快速分边长传消解掉中路被逼抢的压力 也能够洞察到常人无法捕捉到的战机而不至于像莫德里奇那般作为前腰只会让比赛演变成分边传中的局面 这些就是马尔蒂尼数据不好看的原因 彼时米兰的防守就跟米兰体育报说得一样 把球藏起来让对手无法射门 所以当时针对米兰最有效的进攻套路反而是越过中场直接打两头 不仅是类似于锡耶纳这样的中小球队 连拉科 巴萨这样的豪强也不例外 比赛放在那自己去看好了 当然这两支球队的后场出球和前腰的分球速度也绝非今日球队能比的就是 07年利物浦前30分钟场面占优但是无法得分的重要原因就是杰拉德的传控技术不够 让米兰能够轻易退防 让比赛演变成阵地战

再说回马尔蒂尼 他和内斯塔一样 他们真正强的是所谓的预判能力 这两个老家伙对线路演变的预判能力已经到了炉火纯青的境界 这就跟扁鹊对他大哥推崇备至的典故一样 化危机于无形才是至高的境界

他们也讲究提前选位 但是不提倡夺球更注重的是拿到位置 这样一来 对面就没有向前的传球线路只能去被动的倒脚

斯塔姆这个事就很简单了 斯塔姆的身体素质较之00年确实下滑了 这点看过的都懂 而且斯塔姆能力固然强 但是他有两个缺陷 一是转身速度 二是他的防守比较依赖肌肉压迫 爆发力和对抗没问题 但是脚下频率相对慢 相对于内斯塔可以靠步点去压迫持球人获得更大的容错率一次不成但是我也可以不丢位置 斯塔姆就是比较干净利落的去直接破坏了 这也是弗格森说他做不了防线统帅的原因 优秀的防守统帅是需要兼顾干净利落和留有后招的 但是这需要有非常变态的身体素质 因为快速收回重心调整身体姿态没有腰腹力量支撑是完成不来的

综上斯塔姆需要一个优秀的补丁球员作搭档 罗尼约翰森 查一下他的00年前后的出勤率 斯塔姆的下滑原因便一望便知了

查看回复(2)

2019-07-21 19:08:05

8

一言以蔽之,数据只有配上逻辑才有价值。真正搞大数据的都知道逻辑对于数据的意义,只有一些喜欢哗众取宠的媒体才喜欢搞“伪大数据”的东西,比如欧冠里面的巴萨魔咒(已被打破)

文中嘲讽数据的案例都很好解释,就是因为逻辑的缺失。穆斯塔菲的案例只是说明,你给出的那组统计数据无法完全量化后卫的能力,但是实际上球队,甚至一些专业媒体评价后卫的依据早已不是纯看抢断了,范迪克是英超一对一成功率最高的后卫,你看实际上球队只要求“成功”,不求非要“抢断”,追求“抢断”本就是一些追求噱头的媒体搞出来的东西,却拿来攻击大数据?

范迪克防守穆萨西索科可未必全是他一人的功劳。在fifa游戏里,西索科的左脚精读只有2,满分是5,这个统计数据当然不来自于ea,但是也肯定不是范迪克自己总结的,只是孙兴民恰好处在西索科的右侧,范迪克防住右脚,就防住了传给孙兴民的线路,其实西索科也可以用左脚兜弧线或者挑传孙兴民,但是西索科的左脚是真的坑,我估计他自己也知道,他最后决定不整花里胡哨的弧线球,而是一脚爆射,最终他左脚的精度也符合了范迪克和统计人员的期待

但是如果孙兴民要是在西索科的左边,或者带球的是孙兴民,范迪克一防二就很需要运气了

查看回复(4)

更多精彩评论