Una historia de fútbol internacional: cómo analizar un juego colectivo; individualmente


Designed for fun by BBVA Data & Analytics | EN

Predecir el resultado de un partido o de toda la competición que en estos días tiene lugar en Rusia es difícil, ya que en cada uno de los partidos de 90 minutos de estas 4 semanas pueden ocurrir tantos acontecimientos imprevisibles fuera de modelo.

Para ayudar a aquellos que intentan usar alguna combinación de datos, instinto futbolístico e inclinación innata a invertir dinero de forma imprudente para predecir el resultado exacto de un partido en una quiniela (informalmente llamada porra en España, o polla en algunas partes de Latinoamérica) hemos desarrollado una visualización que podría ayudar a entender el posible resultado de los diferentes partidos.

Interactúa

Distribución por posición de los jugadores |

Delanteros Centros Defensas Equipos menos balanceados Equipos más balanceados


Muchas consideraciones juegan un papel importante en el largo y sinuoso camino hacia la historia del fútbol internacional. Un solo jugador -el astuto Maradona, el enérgico Pelé o el elegante Johan Cruyff- puede cambiar el destino futbolístico de todo un país; un solo error también puede poner de rodillas a un equipo muy bien preparado contra todo pronóstico -Corea del Norte venció a Italia en 1966 y quedó segundo de su grupo-.

Predecir el resultado de un partido o de toda la competición que en estos días tiene lugar en Rusia es difícil, ya que en cada uno de los partidos de 90 minutos de estas 4 semanas pueden ocurrir tantos acontecimientos imprevisibles fuera de modelo. Para ayudar a aquellos que intentan usar alguna combinación de datos, instinto futbolístico e inclinación innata a invertir dinero de forma imprudente para predecir el resultado exacto de un partido en una quiniela (informalmente llamada porra en España, o polla en algunas partes de Latinoamérica) hemos desarrollado una visualización que podría ayudar a entender el posible resultado de los diferentes partidos.


Cómo lo hicimos

Algoritmo: Client2vec

Hemos utilizado nuestro algoritmo client2vec, que crea integraciones para representar el comportamiento del cliente y produce una categorización que va más allá de los parámetros sociodemográficos. En este caso, extraemos el porcentaje de juego defensivo, central u ofensivo para cada uno de los jugadores, mirando las posiciones de los que tienen un estilo de juego similar. Al hacerlo, aprovechamos la capacidad de client2vec para lograr un equilibrio consistente entre precisión y memoria. En este contexto, esto significa que client2vec puede ayudarnos a definir con precisión la posición de un jugador al detectar un número relativamente pequeño de jugadores similares. Además, extraemos el comportamiento en el campo de equipos enteros combinando el estilo de juego de sus jugadores (nuestro análisis incluye toda la lista y no discrimina entre el primer equipo y el resto).

Hemos entrenado a player2vec (cómo hemos rebautizado nuestro algoritmo) con las características recopiladas durante los últimos 3 años de cada participante en la competición de fútbol más importante del mundo, incluyendo goles, regates, pases exitosos o minutos jugados. Si se utiliza para asignar un jugador a una sola posición, nuestro algoritmo nos permite alcanzar una precisión de alrededor del 70%, mejorando ya el uso de las estadísticas de juego en bruto para la misma tarea de clasificación. Experiencias pasadas con client2vec nos mostraron que el algoritmo podía detectar con éxito similitudes de comportamiento incluso para puntos de datos cuyas etiquetas diferirían, por lo que elegimos evaluar cuánto avanzaba, centralizaba o retrocedía el juego de un jugador en lugar de apegarnos a una simple tarea de clasificación.

También añadimos una medida de competitividad que nos permite calcular el rendimiento de un jugador por los partidos que ha jugado en los últimos 3 años. Si el jugador ha estado jugando en ligas de alto nivel (como la Bundesliga, La Liga o Premier League), tendrá una puntuación de competitividad más alta que alguien que haya jugado en competiciones menores. Este resultado dista mucho de ser el ideal, ya que considera por igual a todos los equipos de una misma competición (jugar en el Numancia tiene el mismo resultado que jugar en el Barcelona FC).

Con el fin de añadir un poco más de dimensionalidad a nuestros datos, hemos extraído una medida del valor del jugador tal y como lo percibe el mercado. Esto se ha hecho utilizando datos ficticios de valor de mercado procesados por el sitio alemán Transfermarkt, uno de los sitios más populares de su tipo, con miles de estadísticas de jugadores.


¿En el término medio está la virtud?

Fig. 1 - Selección de los equipos más importantes representados según estilo de juego. El tamaño de los puntos representa el valor de mercado de los jugadores.

Mediante la agregación de los datos de todos sus jugadores (incluidos los que normalmente son suplentes) hemos podido entender dónde juega más cómodamente un equipo. A partir de los datos, hemos comprobado que las selecciones nacionales tradicionalmente fuertes tienen un componente de jugadores defensivos y delanteros moderados -las grandes estrellas del fútbol, como Neymar, Messi o Ronaldo, tienen una inclinación hacia delante, pero conservan un componente importante en el mediocampo-.

En general, todos los equipos que compiten este verano por el título de los mejores del mundo reproducen esa naturaleza defensiva-centro, pero dentro de ella hay diferencias notables.

Alemania es uno de los equipos más equilibrados de la competición mundial de este verano y aún así no fue suficiente para ser derrotado. Analizando los datos de los jugadores y comparándolos con los de rivales como México y Suecia podemos detectar una falta de defensas más polivalentes en Alemania, a pesar de ser uno de los equipos más caros y enfrentarse a equipos menos valiosos, pero aún más equitativamente distribuidos. También podemos visualizar una distribución poco común de jugadores sobre la base del triángulo en el que proyectamos nuestras tres dimensiones.

Fig. 2 - Visualización de los jugadores de Alemania, Suecia y México.

Por otro lado, España tiene un equipo al que le encanta jugar en el centro del campo (con un 32%, el mayor de los equipos), frente a Rusia, el equipo más progresista, con un 35% del componente delantero, similar a Bélgica.

México es uno de los más equilibrados (con un 26% de delantero y un 25% de centro), lo que significa, que podrían acomodar a un equipo a una forma versátil de jugar, al igual que Francia o Uruguay.

En la parte defensiva de estas tres dimensiones se encuentra Brasil (con un 51% de componente de defensa). Esto podría significar que la mayoría de sus jugadores muestran un estilo defensivo-medio, mientras que algunos jugadores muy efectivos, como Neymar, Coutinho o Jesús, lideran el equipo en la parte delantera.


Los que continúan en la competición: Cuartos de final

Filtramos los datos según las selecciones que continúan en la competición, justo en el momento en el que están a punto de empezar los partidos de cuartos de final. Ocho selecciones con estilos diferentes, cuyos factores defensivos, de mediocampo u ofensivos se pueden comprobar uno a uno en el siguiente interactivo.

Como se puede observar, hay equipos más arriba en el eje Y dependiendo del dinero total que sus jugadores acumulan. Si tenemos esto en cuenta, los equipos favoritos deberían ser Brasil o Inglaterra. Pero el dinero no lo es todo: la realidad nos ha demostrado que el valor de los jugadores no significa nada si no hay cohesión o un líder inteligente detrás de la plantilla. La puntuación de competitividad que hemos creado para esta historia (que se basa en la puntuación global de las competiciones de un país calculada por la FIFA) muestra que también debemos considerar a selecciones como la de Uruguay.


¿Podemos encontrar nuevos talentos?

Nosotros creemos que sí. Mirando el carácter delantero, mediocampista o defensivo de un jugador y comparándolo con los vecinos que han alcanzado la cima del mercado podemos encontrar algunos jugadores que podrían ser clave para llevar a su equipo a las fases finales de la Copa del Mundo.

Según las características de sus jugadores y el nivel de las competiciones en las que juegan, en este Mundial hay unos pocos jugadores que podrían considerarse estrellas en ascenso y su rendimiento puede llevar a sus equipos más allá de lo que se espera de ellos. Este podría ser el caso de Michy Batshuayi, de Bélgica, y Florian Thauvin, de Francia, podrían convertirse en los pilotos secretos del éxito de su equipo.

También podemos jugar un juego de imposibles e imaginarnos lo que pasaría si sustituyéramos a toda una selección nacional por jugadores de estilos de juego similares. ¿Obtendríamos los mismos resultados en el mismo juego hipotético? (nunca lo sabremos).

Fig. 4 - Comparación de los equipos de España y Rusia.

Por ejemplo, este podría ser el otro equipo nacional de España:

Monreal: Dendoncker (Bélgica), Azpilicueta: Fagner (Brasil), Busquets: Laxalt (Uruguay), Thiago Alcantara: Guardado (México), Ramos y Nacho: Difíciles de comparar Saúl: Paulinho (Brasil), Odriozola: Thauvin (Francia), Carvajal e Iniesta: difíciles de comparar Koke: Augusto (Brasil), Lucas Vázquez: Lemar (Francia), Rodrigo: Januzaj (Bélgica), Isco: Dembelé (Francia), Asensio: Griezmann (Francia) y Aspas: Rushford (Inglaterra)


¡Ojo!
Esta historia de datos ha sido desarrollada por un equipo formado por un científico de datos (Leonardo Baldassini), un narrador visual (Iskra Velichkova) y un comunicador (Jairo Mejía) con poco o ningún conocimiento del fútbol internacional. Sólo hemos utilizado datos que podrían enriquecerse potencialmente para obtener mejores resultados. Todos estos datos han sido extraídos exclusivamente del análisis de datos y sólo con fines de investigación.