L’Espagne, la France ou l’Angleterre soulèveront-elles le butin ? En s’instant sur les situation de milliers de sports, des statisticiens ont littéraire 100 000 jour la Coupe du monde 2026 de foot vers isoler les scénarios les mieux probables.
Autrefois, vers connaître quels gréé allait extorquer la Coupe du monde, il fallait délibérer des voyants à la bille de verre, convoiter l’rejetons pendant lequel les hebdomadaires de thé ou certifier que Paul le Poulpe moi-même révèle ce qui allait se couler.
Aujourd’hui, la discipline des situation offrande une faculté mieux crédible. Au robert d’une gréé de statisticiens, j’ai contribué à tenter un algorithme d’éducation procédural aussi de imaginer le pérennité le mieux croyable du épreuve.
Prévisions probabilistes et dés pipés
L’processus que moi-même avons interprété fonctionne en une paire de étapes. Dans un antécédent époque, des modèles statistiques sophistiqués sont combinés aux analyses des bookmakers et aux situation du marché des transferts aussi d’compter la trempe de toutes les équipes et de à elles joueurs. Dans un collègue époque, un processus d’éducation procédural détermine la meilleure fabriquer de concilier ces estimations derrière d’hétérogènes informations relatif à les équipes.
Cette vestibule permet de rapporter une jugement stochastique vers quelque épreuve compatible du épreuve. On peut l’produire quand une couple de dés pipés : au pièce de apparaître les chiffres de 1 à 6 derrière une prévisibilité pareil, ces dés attribuent des probabilités hétéroclites au rassemblement de buts que quelque gréé est excitable de border.
Par résumé, accompagnant nos prévisions, le dé du Mexique conclusion en norme 1,9 but alors du épreuve d’bonde, cependant que celui-ci de son belligérant, l’Afrique du Sud, n’en conclusion que 0,7. Cela ne signifie malheureusement pas que le Mexique gagnera à égratignure sûr. Une réussite mexicaine constitue sincèrement l’leçon la mieux croyable, derrière une prévisibilité de 65 %. Un épreuve nul est moins croyable (21 %), cependant qu’une réussite de l’Afrique du Sud représente le pérennité le moins croyable (14 %).
« ¡Vuelve a casa, el fútbol vuelve a casa ! »
En utilisant hétéroclites paires de dés pipés, il est compatible de imiter le terminaison de quelque épreuve de la Coupe du monde. Nous avons toléré en relevé le impression au coïncidence formaliste du épreuve pour que l’rassemblement des menstruation de la FIFA, y enregistré les prolongations et les séances de tirs au but. Nous avons alors terminé 100 000 simulations aussi de diagnostiquer le pérennité le mieux croyable de la coupe.
Les résultats montrent que l’Espagne est la préférée vers le cartouche, derrière une prévisibilité de réussite de 14,5 %. Elle est suivie intimement par l’Angleterre et la France, toutes une paire de à 12,4 %, ensuite par l’Allemagne derrière 11,2 %.
En conception de l’dilatation du épreuve — cette Coupe du monde réunit 48 équipes et chariot cinq tours à exclusion spontanée —, les écarts convaincu les favoris restent quant faibles. Le Portugal et l’Argentine tiennent eux encore de solides chances de extorquer le butin, derrière respectivement 8,9 % et 8,2 % de prévisibilité de réussite dénouement.
De à eux côté, les États-Unis ont de bonnes chances d’débarquer les seizièmes de dénouement : 78 %. Il s’agit de la prévisibilité la mieux digue de à eux rapprochement, qui relevé triade hétérogènes équipes. En correctif, alors de la période à exclusion spontanée, où quelque épreuve est définitif, les chances de l’gréé états-unienne de conspirer son cursus diminuent suffisamment intensément. La prévisibilité de remarquer le concitoyen commensal rameuter le butin alors de la dénouement disputée au MetLife Stadium le 19 juillet n’est que de 1 %.
Les coulisses du modèle
Notre processus d’éducation procédural et les simulations qui en découlent reposent sur un combinaison de situation, d’examen et de modèles statistiques.
Tout d’dehors, l’rassemblement des sports cosmopolites disputés au courant des huit dernières années sert de armature à une abrégé panorama du standing des équipes. Ensuite, une abrégé anticipation est établie à disparaître des cotes proposées par divergents bookmakers cosmopolites, à laquelle reflètent à eux esquisse experte du épreuve à émaner.
Troisièmement, des évaluations individuelles des joueurs sont établies à disparaître de à eux tribut aux buts marqués en discothèque quand en éclectisme nationale. Enfin, la honneur réelle des joueurs et à eux possible devenir sont appréhendés à défaut à eux résolution boutiquière estimée. Ces situation sont disponibles sur le panorama Transfermarkt, qui s’carrure sur une vestibule fondée sur l’amitié ville vers idolâtrer des droits de marché qui, par grossier, restent inconnues.
Ces quatre variables sont alors combinées à un béant écran d’hétérogènes indicateurs pertinents décrivant l’balance nouveau des hétéroclites équipes et des concitoyen qu’elles-mêmes représentent. Cela comprend des éléments propres aux sélections, quand à eux classement FIFA ou le rassemblement de joueurs nanti accosté les demi-finales de la Ligue des champions cette période. Nous avons identiquement intégré des facteurs socio-économiques propres à quelque concitoyen, semblables que le PIB par autochtone.
Pour diagnostiquer si ces variables influencent simplement les résultats d’une Coupe du monde, et pendant lequel quels avare, moi-même avons eu ressource à un processus d’éducation procédural.
Plus pleinement, moi-même avons employé ce que l’on billet une forêt fluctuant (random forest), un modèle mélangé d’un spacieux rassemblement d’baliveaux de fermeté, quiconque incarnant prédisposé sur des sous-ensembles miette divergents des situation. L’processus a été prédisposé à disparaître de complets les sports disputés alors des grandes compétitions internationales depuis la Coupe du monde 2006.
Il apprend pour à lier le standing des équipes, la résolution boutiquière de à elles joueurs et d’hétérogènes facteurs au rassemblement de buts marqués alors des sports de Coupe du monde. C’est cette actualité qui permet de « crier les dés » utilisés pendant lequel nos simulations.
Quelle volonté ?
Ce n’est pas la baptême jour que à nous gréé, rédigée d’Andreas Groll, de Rouven Michels et de à elles collègues de l’collège manière de Dortmund en Allemagne, pour que de Lars Magnus Hvattum du Molde University College en Norvège, de Gunther Schauberger de l’collège manière de Munich et de nous-même, collabore vers imaginer l’leçon d’une Coupe du monde.
Lors de la Coupe du monde féminine 2019, moi-même avions parfaitement appelé les Mémoires-Unis quand mouvements vainqueurs. Lors de la Coupe du monde féminine 2023 et de la Coupe du monde masculine 2022, les équipes sacrées — l’Espagne et l’Argentine — n’présentaient pas nos favorites, même si à nous modèle les identifiait quand de sérieuses prétendantes au cartouche.
La proviseur conclusion est qu’une jugement repose sur des probabilités. Notre indicateur ne prétend pas imaginer le guerrier derrière une vérité plénière. Mais il a probablement surtout de chances de dédicace qu’un gastéropode à huit biceps.
Achim Zeileis, Professor of Statistics, University of Innsbruck
Cet papier est republié à disparaître de The Conversation en deçà agrément Creative Commons. Lire l’papier authentique.