El próximo domingo, 20 de noviembre, las selecciones masculinas de fútbol comenzarán la Copa Mundial de la FIFA en Qatar. Esta vez, el favorito es Brasil, con una probabilidad de ganar de 15 porciento. Esto fue demostrado por un equipo internacional de científicos formado por Andreas Groll y Neele Hormann (ambos de la Universidad Técnica de Dortmund), Gunther Schauberger (de la Universidad Técnica de Múnich), Christophe Ley (de la Universidad de Luxemburgo), Hans Van Eetvelde (de la Universidad de Gante) y Achim Zeileis (de la Universidad de Innsbruck) con la ayuda de aprendizaje automático. Su pronóstico combina varios modelos estadísticos sobre la “fuerza de juego” de los equipos con información sobre la estructura de los mismos (como el valor de mercado o el número de jugadores de la Champions League), así como factores socioeconómicos del país de origen (población o producto interior bruto). “Esta vez, el Mundial se ve enturbiado por muchos problemas éticos y deportivos que no podemos ignorar. Sin embargo, por razones científicas, hemos decidido utilizar nuestro enfoque de aprendizaje automático, que hemos utilizado con éxito en anteriores torneos, para hacer pronósticos probabilísticos”, afirma Achim Zeileis.
100.000 simulaciones
Con los valores predichos por el modelo de los científicos, el mundial entero fue simulado 100.000 veces: partido por partido, siguiendo el sorteo del torneo y todas las reglas de la FIFA. Esto resulta en las probabilidades con las cuales los equipos pasarán a las distintas rondas del torneo y, finalmente, ganen el campeonato. Esta vez, el favorito es Brasil, con una probabilidad de ganar de 15 porciento, seguido por Argentina (11,2 porciento), los Países Bajos (9,7 porciento), Alemania (9,2 porciento) y Francia (9,1 porciento) – el pronóstico completo está disponible aquí. Por supuesto, el torneo no está predeterminado para nada, lo que se refleja en la probabilidad comparativamente baja que los mejores equipos tienen para ganar. "Está en la propia naturaleza de los pronósticos que también pueden ser incorrectos; de lo contrario, los torneos de fútbol serían muy aburridos. Proporcionamos probabilidades, no certezas, y una probabilidad de ganar de 15% también implica una probabilidad de 85% de no ganar", explica Andreas Groll. Sin embargo, las predicciones han tenido bastante éxito hasta ahora: El modelo de Innsbruck de Achim Zeileis, que se basa en las probabilidades ajustadas de las casas de apuestas, fue capaz de predecir correctamente la final de la Eurocopa en 2008, así como el campeón mundial y de Europa, España, en 2010 y 2012. Este año, el modelo de Zeileis se utilizará por segunda vez después de la Eurocopa 2021 como parte de un modelo combinado más completo desarrollado por los equipos en torno a Andreas Groll (TU Dortmund), Gunther Schauberger (TU Munich) y Christophe Ley (Universidad de Luxemburgo), que superó la calidad de predicción de los proveedores de apuestas en el Mundial 2018.
El Mundial de 2022 es particularmente interesante desde un punto de vista científico debido a la fecha inusual: el torneo tuvo que posponerse a los meses de invierno debido a las altísimas temperaturas de Qatar en verano: “Además de los problemas éticos ampliamente discutidos de este Mundial, esto también plantea cuestiones deportivas muy críticas: En los meses de invierno, todas las grandes ligas de fútbol de Europa y Sudamérica tienen que interrumpir su calendario habitual de partidos para adaptarse al torneo. Esto da menos tiempo a las selecciones nacionales para prepararse y los jugadores tendrán menos tiempo para recuperarse antes y después del Mundial. Además, las condiciones climáticas extremas aumentan el riesgo de lesiones”, explica Achim Zeileis. Por lo tanto, tener un equipo con muchos jugadores en las ligas internacionales – como la Champions League, la Europa League o la Europa Conference League – podría resultar ser más desventaja que ventaja este año, como señala Andreas Groll: “Todos estos factores hacen que sea más difícil predecir cómo resultará el torneo, ya que las variables que fueron muy significativas en anteriores Mundiales podrían no funcionar bien o funcionar de forma diferente”.
Como aficionados del fútbol, los investigadores están consternados por las circunstancias en las que se desarrolla el Mundial este año, subraya Achim Zeileis: “La alegría con la que habitualmente anticipamos un Mundial ha sido aplastada por las terribles circunstancias de este año: desde la presunta corrupción en el proceso de selección de la sede, hasta las condiciones de trabajo y de los derechos humanos en Qatar, y la falta de sostenibilidad en la construcción y el funcionamiento de los estadios”.
Aprendizaje automático
El cálculo de los científicos se basa en cuatro fuentes de información: Un modelo estadístico para la “fuerza de juego” de cada equipo, basado en todos los partidos internacionales de los últimos ocho años (Universidades de Gante y Luxemburgo), otro modelo estadístico para la “fuerza de juego” de los equipos, basado en las cuotas de apuestas de 28 casas de apuestas internacionales (Universidad de Innsbruck) e información adicional sobre los equipos, por ejemplo el valor de mercado, y sus países de origen, por ejemplo el tamaño de la población (TU Dortmund y TU Munich). La cuarta fuente o “socio” de investigación es un modelo de aprendizaje automático que combina las distintas fuentes y las optimiza paso a paso. Previamente, los científicos entrenaron el modelo con datos históricos, como explica Andreas Groll: “Alimentamos el modelo con los datos actuales de los últimos cinco Mundiales, es decir, entre 2002 y 2018, y lo comparamos con los resultados reales de todos los partidos de los respectivos torneos; de esta manera, la ponderación de las fuentes de información para el torneo actual será muy precisa en el caso ideal.” El modelo entrenado de este modo también podría ser usado para otros pronósticos en el futuro, una mejor previsión futbolística podría proporcionar también, con el tiempo, previsiones meteorológicas más precisas. Que tan bien el modelo funciona para pronosticar resultados de fútbol, eso lo veremos el 18 de diciembre.