英超各球队球迷数量 复杂网络研究和数据分析技术与体育结合的多种可能

介绍

随着复杂网络研究范围的不断扩大,体育竞赛也逐渐被应用到其中,尤其是足球和篮球这两项团体运动。 本文梳理了近年来多项相关研究,从球员传球风格和球队胜率,到球队风格的量化,到联赛的整体特征,以及体育与社会的关系等,论证了复杂的网络研究和数据分析技术结合运动的多种可能性。

1.复杂的网络是一个盒子,运动可以放进去吗?

无论是足球还是篮球,团队竞技体育都是涉及数十亿人口、数万亿美元的大产业。 随着体育赛事的数字化,海量的数据让数据科学在体育产业中展现出它的魔力。 NBA勇士队掀起了利用专业数据分析提升成绩的热潮。 随着勇士队连续夺冠,数据分析师已经成为NBA各支球队篮球教练组中不可或缺的一员。 在足球、网球、排球等运动中,数据分析也起到了提高球队比赛水平的作用。

任何涉及团队合作的运动都可以自然地被视为参与者之间的互动网络。 由于竞技体育的结果是明确定义的,因此数据本质上是有标签的。 竞技体育中的运动员特征,如身高、体重等,以及场上的传球、投篮、突破等动作也都有明确的规定。 ,随着计算机视觉对视频数据的自动标注,海量数据积累了许多竞技体育中的自然随机双盲实验。 这使得研究人员能够利用复杂网络的成熟方法论来研究网络结构的变化、网络中的信息传递以及网络中出现的宏观结果(赢或输)之间的关系。

复杂网络在体育运动中的应用有着广阔的空间。 比如,除了各种职业球类运动之外,一些研究方法和结论也适用于团队电竞项目,比如Dota。 未来网络分析框架还可以整合包括视频、可穿戴设备、体检和体检数据等数据源,可以让网络有更多的层次,更好地发挥网络分析的威力。 对于非职业运动来说,随着用户上传的数据增多,也能产生新的研究方向,比如研究如何避免运动带来的伤害,如何让参加运动的运动员相对均匀地锻炼和发展。

本文将介绍最近的四项相关研究,逐步扩大视角。 首先我们看球员传球对胜负的影响,然后看如何量化考察球队的延续风格,然后分析整个联赛在不同时期的整体特征。 最后分析了体​​育在社会中的地位,论证了复杂网络研究与体育结合的多种可能方向。

2. 如何传球

可以让你赢得篮球比赛

球队状态不佳、某位球员发挥不佳,都是输球后常见的借口。 从网络科学的角度分析,可以定义一个新的指标来预测球队的输赢。

杜克大学的研究人员在 2018 年发表的预印本论文中提出了篮球比赛的预测指标。

论文题目:

SMOGS:游戏的

论文地址:

本研究以美国高校NCAA联盟为背景,统一安装高清三维摄影和分析。 这篇文章也是关于传递网络的。 有了这样的数据,就可以给出每个球员的传球和分析结果。 接球的热点。 如下图所示,图a)中的热点区域显示了球员最常在三分弧顶传球,bcd显示了传给前锋球员时最常见的成功接球位置、中锋和后卫位置。

英超各球队球迷数量_英超球迷球队数量排名_英超球迷球队数量统计

图1:不同类型球员传球位置和接球位置热图

然后作者结合篮球规则定义了一个指标来描述每个球员在传球和接球网络中的影响。 该指标可以理解为结合具体应用场景的中心性计算方法(SMOGS),只不过计算方法是分别针对传球和接球英超各球队球迷数量,并且给每个球员对赋予一个二维空间而不是一维空间。 维空间值。

作者根据新提出的指标比较了同一支球队在输球时的传球和接球网络。 通过显示两者之间的显着差异,该指标可以预测球队的输赢。

英超各球队球迷数量_英超球迷球队数量统计_英超球迷球队数量排名

图2:胜负时球队球员传球指标对比。

上图中的每个点(数字代表球员的编号)代表一名球员,红色代表球,蓝色代表传球。 位置表示根据SMOGS计算出的指标在二维空间中的位置。 地点。 左侧对应于失败,右侧对应于获胜。 无论从整体(团队)还是个体角度来看英超各球队球迷数量,都有明显的区别。 当用作预测时,新提出的指标也优于现有指标。

3.瓜迪奥拉治下

巴塞罗那巅峰,有什么区别?

在9月分期发表的一篇论文中,研究人员利用网络科学方法来支持球迷对主教练瓜迪奥拉的巴塞罗那队(2010-11赛季)细腻传球和控制比赛节奏的印象。

论文题目:

球队:使用to's FC

论文地址:

研究人员重点关注比赛中的传球,将西甲球队单赛季的传球记录结合起来,形成如下图所示的有向网络。 图中每个点都是一个球员,点的大小代表网络中的特征向量中心性( ),点的位置就是其平均传球的位置,线的深度代表传球的总数。

英超球迷球队数量统计_英超球迷球队数量排名_英超各球队球迷数量

图 3:巴塞罗那传球网络可视化

随后,研究人员将传统足球分析中使用的指标,例如50次传球所需的时间,与网络分析中使用的指标,例如聚类系数( )、最大特征向量、球队球员特征向量中心性的最大值进行比较,发现与巴塞罗那和其他西甲球队的传球网络平均值有显着差异。

在进球或失球之前,巴萨的传球网络也与其他西甲球队有显着不同。

英超球迷球队数量统计_英超球迷球队数量排名_英超各球队球迷数量

图4:西甲不同球队进球/失球前50个传球网络对应指标对比

上图显示了进球和失球之前由 50 次传球组成的网络。 依次检查网络的聚类系数和通过网络的相应矩阵的最大特征向量。 纵轴是进球时的数值,横轴是失球时的数值。

这个分析是为了说明,在进球/失球的关键时刻,巴萨与其他球队的差异仍然存在,而且球队之间的这种差异是稳健的。 研究人员还利用横轴和纵轴的差异来说明丢球和进球之前的传球网络是不同的。

4. 足球比赛变得无聊——

获得令人沮丧的结果变得越来越困难

竞技体育的魅力就在于没有永远的赢家,但最近的一篇文章打破了“只要努力,就会赢”的神话。 在今年8月份arixv上的一篇论文中,作者通过分析欧洲11个主流联赛的8万场比赛的胜负情况,得出结论:球队之间的实力差距正在变得显着,比赛结果也变得更加有意义。 可预测性,而主场优势通常变得不那么重要。

论文题目:

是 ; 共 11 个专业 88 分

论文地址:

英超各球队球迷数量_英超球迷球队数量统计_英超球迷球队数量排名

图 5:英超比赛中输赢关系的网络可视化

上图是本文研究的网络。 图中的每个点都是英超联赛中的一支球队。 线的深度代表两队之间的净胜球数。 分数的大小代表球队的胜利。 负网络中的介数中心性 ( )。

本文使用简单的逻辑回归模型,根据球队一个赛季的平均进球数和失球数等指标,结合球队是否主场等指标来预测比赛结果。

下图显示了欧洲几个顶级联赛的预测模型的AUC(橙色,用于评估模型的准确性)和基尼系数(蓝色,用于评估不平等程度)。 可以看出,从1995年到18年均大幅增长。

英超球迷球队数量排名_英超各球队球迷数量_英超球迷球队数量统计

英超球迷球队数量排名_英超各球队球迷数量_英超球迷球队数量统计

英超各球队球迷数量_英超球迷球队数量统计_英超球迷球队数量排名

英超球迷球队数量统计_英超球迷球队数量排名_英超各球队球迷数量

图6:英超、德甲、西甲、意甲胜负的可预测性以及衡量球队胜负差异的基尼系数。

5、某球队粉丝数总和

城市人口呈现幂律关系

竞技体育具有超越国界的魅力。 作者在2018年的一篇arxiv文章中发现,皇马、曼联、拜仁三大足球豪门的粉丝数(关注数、转发数)与各国不同城市的人口数量呈现幂律关系分配。

论文题目:

上的城市

论文地址:

这并不奇怪,但文章中有趣的是对那些国家粉丝数量增长的分析是超线性的(),即粉丝数量的增长速度快于城市总人口的增长速度,例如城市人口的增长10倍,粉丝数量增加了15倍,对应的系数为15/10=1.5。 下图显示了印度尼西亚(ID)、哥伦比亚(CO)、墨西哥(MX)、西班牙(ES)、英国(GB)和美国这三支球队的球迷数量与城市人口的差异(美国)分别。 幂指数大小。

英超球迷球队数量统计_英超球迷球队数量排名_英超各球队球迷数量

图7:三大足球豪门在不同国家不同城市的球迷数量增长率

可以看到,在印度尼西亚和哥伦比亚,都出现了不同程度的超线性增长,这意味着大城市的粉丝比例要高于小城市。

在美国、英国和西班牙,情况恰恰相反。 美国人对足球不感兴趣,但英国和西班牙却没有超线性增长。 这说明在发展中国家,对足球的热爱更加紧密地依赖于城市。 规模增长。

一种可能的解释是,在贫富差距较大的地方,城市越大,竞技体育带来的娱乐需求就越大。

除了其结论符合幂律的普遍性外,本文还将体育视为社会物理学的一部分( ),研究体育与我们关心的其他指标之间的关系,例如球队的表现和成绩城市的经济。 升起和降落。

6.用数据说话,成为专业粉丝

网络科学、数据科学在体育竞赛中应用的相关研究越来越多,与行业知识的融合也越来越深。

如果你问篮球迷主场优势是什么意思,他或她可能无法解释清楚。 而如果你有数据科学武装,你可以拿出这篇论文(Home Sweet Home: Home Court For NCAA)中的研究,其中指出主场作战的球队的盖帽和助攻数将接近20%高于平均水平。 会增加,罚球和抢断次数也会增加5%-10%。 这与观赛球迷的普遍印象相符。 盖帽和抢断数据增加的原因是球员的战斗更加积极。 更多的罚球意味着裁判会照顾主队。 更多的助攻意味着球队打得更有耐心。

论文题目:

甜蜜之家:NCAA 主场

论文地址:

还有很多结合网络数据的研究,比如根据足球中球的位置对球队进行聚类,从而对应球迷常说的442、434(比赛中)等不同阵型。 另一个例子是利用遗传算法帮助球队管理者选择最佳的球员组合。

论文题目:

' 对于团队英超各球队球迷数量,索引

, 使用

论文地址:

另一个可能的整合点是研究决定职业运动员/教练成败的因素。 成功科学最近也成为一个热门研究话题。 通过形成玩家相互博弈关系网络,研究人员还可以发现体育界“与专家合作”、“名师传弟子”等艺术家和科学家之间的成功模式。 这也是一个值得研究的方向。

作者更关心的是体育与普通人的关系。 大数据研究能否用来解释体能训练和体能评估分数与个人学业、职业成功或创新能力之间的相关性? 或者指出体育锻炼设施的数量与城市的经济发展之间存在因果关系? 这是一个更具有普世价值、更接地气的研究方向。