对话李永乐：揭秘世界杯中的科学预测模型

当数学老师遇上足球：一次意外的跨界

“李老师，您一个教物理数学的，怎么也研究起足球来了？” 这是李永乐老师被问得最多的问题之一。视频里，他推了推标志性的黑框眼镜，身后的白板上写满了复杂的公式，话题却是即将开赛的世界杯。“很多人觉得，足球是激情，是偶然，是艺术。这没错，”他笑了笑，话锋一转，“但在这片绿茵场上奔跑的数字和概率，可能比我们想象的要有序得多。”

这位凭借科普视频走红的中学老师，用他最擅长的工具——数学，为我们撬开了世界杯预测那扇看似神秘的大门。在他眼里，一场足球比赛不仅仅是22个人的追逐，更是无数数据流、概率树和模型参数的激烈碰撞。

预测不是“算命”：从经验直觉到数据模型

“过去我们预测比赛，靠的是什么？是教练的经验，是球迷的直觉，是媒体‘懂球帝’的深度分析。”李永乐老师直言不讳，“这些重要吗？非常重要。但问题在于，它们难以量化，容易受到情绪和偏见的影响。”他举了个生动的例子：一个球迷因为特别喜欢梅西，会在心里无限放大阿根廷队的赢面，而选择性忽略他们后防线的老化问题。这种“情感加权”在人的大脑里时刻发生。

而科学模型要做的，就是尽可能剔除这些“噪声”。“模型的核心思想，是把球队抽象成一个可以量化的‘实力值’，把比赛过程看作一个随机过程，然后去计算各种结果发生的概率。”这听起来冷冰冰的，却是一种更基础的“语言”。

他转身在白板上写下几个关键词：泊松分布、ELO评级系统、期望进球值(xG)。“你看，就拿最经典的泊松分布来说，它本来是用来描述电话交换机接到呼叫次数的，但数学家发现，一场足球比赛中双方的进球数，也大致符合这个规律。” 这意味着，只要我们能相对准确地估计出两队各自的平均进攻力和防守力（即λ参数），就能推算出踢成0:0、1:0、2:1等各种比分的概率有多大。

模型的三块基石：进攻、防守与不可预测的“运气”

那么，一个预测模型到底需要哪些“食材”呢？李永乐老师为我们梳理了三大核心要素。

对话李永乐：揭秘世界杯中的科学预测模型

第一块基石：历史战绩与球队“积分”

“最基础也最著名的，就是借鉴国际象棋的ELO系统。” 他解释道，每个球队都有一个动态的积分，赢了强队就大幅涨分，赢了弱队就小幅涨分，输了则扣分。国际足联的世界排名在早期也基于类似原理。“这个积分，是球队长期表现的‘浓缩药丸’，它提供了一个实力比较的基准线。”但李老师也指出其局限性：“足球比赛远比象棋复杂，一场比赛的胜负除了实力，还深受战术克制、主客场、甚至天气的影响。单纯的积分，不够‘细’。”

第二块基石：过程数据，不止于比分

这就引出了更精细的“食材”——过程数据。“现代足球数据采集已经细到了可怕的程度。”李永乐老师如数家珍，“一场比赛，数据公司能记录每个球员的跑动距离、冲刺速度、传球路线、射门位置、甚至触球脚和受力部位。” 其中，“期望进球值”是一个革命性的概念。

“它回答了一个问题：‘这次射门，在历史上类似情况下（位置、角度、防守压力、进攻方式等），平均能进多少个？’” 比如，梅西在禁区弧顶一脚搓射，这个位置的射门历史平均进球概率可能是8%，那么这次射门就为球队贡献了0.08个“期望进球”。整场比赛下来，把双方所有的“期望进球”值加起来，就能得到一场“理论上”的比分。“你会发现，有时候赢球的一方xG反而低，这说明他们可能赢得比较幸运，而输球的一方创造了更多实质机会。这个数据，比光看比分更能反映比赛的真正内容和球队的进攻效率。”

第三块基石：量化“偶然性”

“但足球最迷人的地方，恰恰在于模型最难把握的部分——偶然性。”李永乐老师提高了声调，“一个门将的低级失误，一个意外的折射，一次争议判罚，甚至是一阵风，都可能改变一切。” 科学模型如何对待这些？“不是忽略它，而是承认它，并把它作为模型的一个‘随机扰动项’。”在概率计算中，会为各种小概率事件（比如远射世界波、红牌点球）赋予一个基础的发生概率。“模型知道自己的‘盲区’，它会告诉你，根据历史数据，有大约10%-15%的比赛结果，是显著偏离实力预测的，这就是足球的‘魔法’空间。”

模型的实战：以弱胜强，真的是冷门吗？

我们最关心的，当然是模型如何看“以弱胜强”。李永乐老师以经典的“莱斯特城奇迹”为例。

“在2015-16赛季初，所有模型基于莱斯特城之前的表现和阵容实力，给出他们夺冠的概率都低于0.1%，有的模型甚至认为是万分之一。这有错吗？从当时的数据看，没错。” 他话锋一转，“但模型是动态的。赛季开始后，莱斯特城连胜，他们的ELO积分在快速上涨，他们的比赛数据（比如防守反击的成功率、瓦尔迪的射门转化率）远超历史平均。这时，聪明的模型会迅速调整参数，在赛季中期，可能就会将他们的夺冠概率上调到1%、5%甚至更高。”

“所以，模型不是预言家，它是‘贝叶斯主义者’。”李永乐总结道，“它不断地用新发生的事实（证据）来修正自己之前的看法（先验概率）。最终的‘奇迹’，在发生的那一刻概率很低，但在发生的过程中，其可能性是在不断被重新评估和放大的。”

对于世界杯，模型同样如此。它会考虑球队阵容的完整性（有没有核心伤停）、战术风格是否相克（传控队怕不怕密集防守）、甚至赛程和气候（热带球队在卡塔尔的适应情况）。“一个复杂的模型，会像拼图一样，把这些因素尽可能都变成参数，塞进它的公式里。”

模型的局限与足球的魅力

聊到最后，我们不可避免地触及了模型的“天花板”。李永乐老师非常清醒。

“黑天鹅”与“更衣室魔法”

“模型再复杂，也是基于过去的数据。它无法预测从未发生过的事情，也就是真正的‘黑天鹅’。” 比如，2014年世界杯半决赛，巴西队在家门口1-7惨败给德国。“这种崩溃式的、涉及巨大心理波动的溃败，在历史数据中极其罕见，模型几乎不可能提前给出高概率预警。”

更重要的是，“足球是关于人的运动，而人的情感、士气、团队凝聚力，是当前数据最难捕捉的部分。”李永乐老师感慨，“一个教练的赛前动员，一个核心球员的领袖作用，球队在逆境中是否团结……这些‘更衣室魔法’，是冰冷的数字暂时无法翻译的语言。而这，往往是大赛决胜的关键。”

预测的目的：不是消灭悬念，而是理解游戏

“所以，我们必须摆正对预测模型的态度。” 李永乐老师最后总结道，“它不是一个用来赌球稳赚不赔的‘水晶球’。它的价值，在于提供一种超越个人偏见、基于集体历史数据的理性视角。”

“当你看到模型说，强队获胜概率是65%，这不是说弱队就没机会了。恰恰相反，它明确告诉你，有35%的可能性会爆冷。这反而让比赛更刺激了，不是吗？” 他笑着说，“模型把足球这场宏大、感性的戏剧，翻译成了理性概率的语言。它让我们明白，每一个进球背后，有多少是实力的必然，又有多少是运气的馈赠。”

“作为球迷，我们完全可以一边用模型理解比赛深层的逻辑，一边为每一次‘小概率’的精彩扑救或绝杀进球而热血沸腾。科学与激情，理性与感性，在世界杯这个舞台上，完全可以共存。” 谈话结束，白板上的公式依然复杂，但足球，在我们眼中似乎多了一层清晰而有趣的维度。这或许就是科学带给观赛的，一份独特的礼物。

对话李永乐：揭秘世界杯中的科学预测模型

世界杯官方网络平台带您畅享全球体育盛事

对话李永乐：揭秘世界杯中的科学预测模型

当数学老师遇上足球：一次意外的跨界

预测不是“算命”：从经验直觉到数据模型

模型的三块基石：进攻、防守与不可预测的“运气”

第一块基石：历史战绩与球队“积分”

第二块基石：过程数据，不止于比分

第三块基石：量化“偶然性”

模型的实战：以弱胜强，真的是冷门吗？

模型的局限与足球的魅力

“黑天鹅”与“更衣室魔法”

预测的目的：不是消灭悬念，而是理解游戏

延伸阅读