如何利用计算预测比赛?
首先,这个问题有误区,足球比赛的胜负取决于团队整体的运行状况而不是依靠某个人的神机妙算或者所谓的“预测”。而且任何带有赌博性质的活动都是违法的所以这里所说的“预测”是指通过分析历史数据来寻找某种规律以便能够在今后的比赛中做出更加合理的判断,这种判断仅供娱乐参考并不具有实际意义上的指导作用。 其次,这里的数据分析只包含静态的数据而不包含动态的信息比如队员伤情、天气状况等因素虽然这些也是影响比赛结果的重要因素但是已经超出单纯数据挖掘的范畴而是需要加入其他知识加以分析了。所以这里所说的“预测”并不是一个严格的数据挖掘问题。 最后,讨论的问题本身其实没有太大的意义,因为任何一场比赛的结果都是不可预知的或者说难以精确预测的。所谓“预测”比赛不过是一种自欺欺人的说法而已。真正有意义的工作应该是找出造成比赛结果差异的因素从而知道哪些地方可以改进从而赢得更多的比赛。当然寻找因素的过程可能是通过数据挖掘来完成但是最终的分析肯定不是单纯的由数据和算法能够解决的。
以世界杯决赛为例,德国队最后加时赛进球夺冠,英国《卫报》赛后整理的数据表明,两队全场射门次数、传球次数和成功率等几项主要统计数据德国都处在下风,而失误次数和丢球率两项指标却明显高于英格兰。 这说明了什么问题呢?说明单纯的数据并不能带来胜利(至少不能长久地带来胜利);同时也不能否认数据的重要性。可以说数据是在模糊不清又错综复杂的现象中找出的一堆相对清晰的量化指标。如果能够很好地运用这些量化指标并据此做出正确决策的话那么胜利也就指日可待了。