足球|数说足球:以拜仁为例 通过大数据模型分析引援契合度( 三 )


第三个公共因子F3在X2(出场时间) , X7(传球) , X9(抢断) , X14(解围)这4个变量上的载荷值比较大 , 上述指标是防守球员的核心指标 , 表示球员的拦截和防守能力 , 将其命名为防守拦截因子 。第三个公共因子对全部开始变量的方差贡献率为10.689% , 为次重点考虑方面 , 主要原因是拜仁的高位逼抢战术几乎平均于每个位置 。
第四个公共因子F4在X1(身高) , X4(黄牌) , X11(犯规)这3个变量的载荷值比较大 , 上述指标为球员身体与比赛风格的核心指标 。表示球员在比赛中的踢球习惯与风格 , 将其命名为风格因子 。第四个公共因子对全部开始变量的方差贡献率为7.359% , 为最后考虑方面 。毕竟 , 拜仁不是弱队 , 战术犯规在弗里克接手后绝大多数时间内几乎无用 。
通过因子分析 , 将14个指标变量降维成4个公共因子 , 如表4(因子命名结果)所示:
(因子命名结果)
根据因子载荷矩阵写出F1 , F2 , F3的因子得分表达式为:
F1=-0.678X1+0.266X2+0.134X3-0.406X4+0.735X5+0.477X6+0.417X7+0.878X8-0.199X9+0,.025X10-0.150X11+0.562X12+0.900X13-0.587X14;
F2=-0.048X1-0.001X2+0.921X3-0.359X4+0.322X5+0.760X6-0.351X7+0.029X8-0.365X9+0.843X10+0.181X11-0.095X12+0.246X13-0.227X14;
F3=0.088X1+0.928X2-0.188X3-0.062X4+0.166X5-0.096X6+0.730X7+0.120X8+0.734X
9-0.286X10+0.017X11+0.357X12+0.143X13+0.554X14;
F4=0.208X1-0.017X2-0.062X3+0.627X4-0.085X5-0.035X6-0.034X7-0.054X8+0.112X9
+0.093X10+0.856X11+0.538X12-0.082X13+0.083X14;
最后由各个因子方差贡献率占4个因子方差贡献率的比重作为权重进行加权汇总 , 得到各个球员的综合得分F , 即:
F=(28.275×F1+19.861×F2+18.344×F3+10.781×F4)/77.261
因子分析结论
代入各式子 , 得到各个球员的综合评价的指标F的得分 , 以这个综合得分大小排序 , 就可以得到球员适合拜仁的素质排名 , 如表5(素质因子得分 , 排名结果):
足球|数说足球:以拜仁为例 通过大数据模型分析引援契合度
文章图片

文章图片

(素质因子得分 , 排名结果)
根据各个球员的因子得分 , 排名结果得出以下结论:
上表中4个公共因子得分和因子综合得分越大 , 说明球员的助攻能力 , 得分能力 , 防守能力和风格优势越高 , 综合竞争越强 。从综合得分看来 , 哈弗茨、范德贝克、布罗佐维奇、乌帕梅卡诺这4名球员在平均水平之上 , 其他在平均水平之下 。结合拜仁现有阵型配置考虑 , 范德贝克应该是最适合拜仁引援对象 。(注:本文不进行聚类分析)
通过指标特征 , 利用matlab软件在因子分析的基础上选择标准欧氏距离(内平均法)作分析 。拜仁三个位置分类的引援顺序分别是:中场:布罗佐维奇 , 托纳利 , 维纳尔杜姆 , 凯塔 , 格鲁伊奇;边后卫:德斯特 , 阿隆斯 , 贝莱林;边锋:德佩 , 扎哈 , 卡马文加 , 马拉约尔 。两位在拜仁《转会市场》列表上的无名小将希基和乔-鲁特没有一线队引进价值 。而通过因子分析结果 , 将球员分为 3 个层次 。第一个层次的四名球员因子得分在 1.15289——0.22118;第二个层次的因子得分在 1.04285——0.01186;第三个层次的因子得分在-0.20559—— -0.90669 。通过因子分析结果可知 , 各个球员的素质是拜仁发展的重要指标 , 上述排名结果表明 , 助攻型中场球员对拜仁贡献作用明显 。
当然 , 我们也必须指出 , 球员对应球队所形成的数据结果 , 绝不可以一概而论的转化到其他球队 。笔者非数据统计专业人士 , 有所纰漏也是在所难免 。同样 , 相信还记得十年前贝尼特斯在利物浦排首发故事的球迷 , 都知道全靠大数据是不可信的 。但从仅供参考的角度 , 作为普通球迷的我们 , 可以列入自己“钟意对象”进行计算 , 也是可以适用于任何人主队的 。在国际足坛 , 这也是很多球队助教帮助主教练考察球员的参考方式之一 。


推荐阅读