Serie: Explicando el rendimiento de los futbolistas (II parte)

Equipo Futbolytics
7 min readAug 15, 2022

Este artículo forma parte de la serie de posts que Benjamín ha venido publicando para contarnos los avances de su tesis para el Magíster en Economía Aplicada en la Universidad de Chile enfocado en: encontrar las variables que explican el rendimiento de los futbolistas por posición .Puedes revisar el primer capitulo acá

Continuando con la serie, en este capítulo se estudiarán las variables/características que nos permitan explicar y definir el rendimiento de futbolistas, mediante métodos estadísticos como nos gusta aquí en Futbolytics. Primero que todo veamos cómo se comporta este estudio con los arqueros, para validar la metodología, para esto me gustaría tomarme de un artículo previo de nuestro, donde generamos una propuesta para medir el rendimiento de los porteros, la cual se resume en esta fórmula:

La fórmula expuesta previamente se basa en que los goles esperados (xG) representan el número de goles que un equipo debería haber anotado. Por lo tanto, un arquero que tenga mayor xG por gol en contra, significa que le convirtieron menos goles de los que le deberían haber hecho. Por ejemplo, si el equipo rival acumuló un xG de 3, pero solo lograron convertir dos goles, el xG por gol concedido del arquero sería 1.5 (3/2 = 1.5) , ie, para convertir un gol, el rival tuvo que acumular un xG de 1.5.

“Por lo general, los goles esperados y el número de goles que efectivamente se convirtieron no son iguales, lo que puede deberse a dos motivos: un buen o mal desempeño de los rematadores y/o un buen o mal desempeño del arquero. Por lo tanto, una manera de evaluar el rendimiento de los porteros es comparar la cantidad de goles que debería haber recibido con la cantidad de goles que recibió, mediante la división entre los goles esperados en contra y los goles recibidos.”

Tomándonos de esta recomendación y aplicando la metodología utilizada por Constanza en su proyecto de tesis para eliminar variables redundantes. Nos quedamos con un set de 45 variables por portero en cada partido normalizadas por 90 minutos(*Nota al pie de pagina), tiros al arco, tiros atajados, pases con la mano, entre otras. De estas 45 nos gustaría quedarnos con las que tengan un mayor efecto sobre los goles esperados por gol recibido. Para esto existen varios métodos para seleccionar y filtrar las variables, disminuir dimensionalidad, en esta oportunidad utilizaremos LASSO, método de análisis de regresión que realiza selección de variables y regularización para mejorar la exactitud e interpretabilidad de un modelo estadístico. O en otras palabras, toma el conjunto de variables (acciones de juego) y determina cuales tienen mayor importancia para la acción de juego que queremos explicar, que en este caso son los goles esperados en contra.

Del LASSO obtenemos un set de 24 variables. Esto facilita el análisis, ya que en vez de estar “atento” a 45 variables solo es necesario evaluar 24. Este resultado es preliminar, pero permite visualizar qué variables son las que más influyen en el rendimiento de los arqueros. Justamente lo buscamos en Futbolytics, poder explicar a través de las matemáticas este hermoso deporte.

set de variables a trabajar. * La data es tratada a nivel de fecha.

El modelo en acción

Acompañado de las variables significativas, LASSO nos entrega también los coeficientes asociados, es decir, ponderaciones o, dicho de otra forma, cuánto influyen estas variables en el rendimiento final. Por ejemplo, Super salvadas tiene signo positivo, lo que se traduce en que a mayor sea el número de super atajadas, mayor es el rendimiento de los arqueros, lo cual es muy intuitivo. Por otro lado, tenemos variables que en principio son contraintuitivas, este es el caso de conceder penales. LASSO entregó un coeficiente positivo a esta variable, lo que quiere decir es que a mayor penales concedidos, mayor es el rendimiento de los arqueros (Lee en el pie de pagina la explicación).

Con estas variables y estas ponderaciones, podemos rankear a los arqueros de mayor a menor el rendimiento en cada partido del campeonato. Podemos ver cuales fueron las mejores 5 actuaciones del torneo y como Ignacio Gonzalez, arquero de Deportes Antofagasta, aparece en 2 ocasiones, en la fecha 26, la mejor actuación del campeonato y en la fecha 28.

Ahora, queremos hacernos la siguiente pregunta, ¿Cuál fue el mejor arquero del Primera División de Chile 2021?. ¿Es una pregunta fácil de responder? ¿Qué otras variables entran en juego?. Si ordenamos los arqueros por el promedio de sus actuaciones, el gráfico nos quedaría de la siguiente forma:

Ordenamos a los arqueros del torneo de acuerdo a la predicción del modelo

En este gráfico tenemos bastante información, los arqueros están ordenados de mayor a menor según el promedio de sus puntajes en los partidos del campeonato, tenemos la línea segmentada blanca que indica el promedio de todas las actuaciones de los arqueros. El largo de los boxplots, como se explicó en el capítulo anterior, se pueden interpretar como la consistencia de los arqueros, es decir, un boxplot como el de Zacarías López indica que tuvo partidos con muy alto rendimiento y otros que no, a pesar de estar más o menos en el promedio de los arqueros. Por otro lado, un boxplot como el de Omar Carabali, indica que fue consistente en los pocos partidos que jugó, su rendimiento no varió mucho y lo hizo consistentemente por sobre el promedio de arqueros. Añadimos colores a las cajas para facilitar la identificación de los arqueros con más partidos (rojo) a menos partidos (azul).

Zoom al top ten de arqueros. En Rojo más partidos a azul menos partidos.

Ahora si nos ponemos en la situación de recomendar un arquero para algún club, ¿Cuál arquero recomendamos?. Tenemos que los 5 mejores arqueros del campeonato fueron Augusto Batalla, con 9 partidos disputados, Ignacio Gonzalez (29 partidos), Leandro Requena (32 partidos), Matías Dituro (7 partidos) y Omar Carabalí (2 partidos). Gonzalez y Requena combinan varios insumos interesantes: Tienen una alta cantidad de partidos jugados (rojo), su rendimiento es destacado (de acuerdo a las visualizaciones previas) y según TransferMarket tienen un valor de mercado de 400 mil y 75 mil euros respectivamente, haremos un doble click en ellos.

El rendimiento de Requena por partido.
El rendimiento de González por partido.

Primero expliquemos estos gráficos: Esta visualización despliega los resultados del modelo para cada uno de los arqueros seleccionados (Recordar formula inicial, mientras más alto mejor). La linea roja indica el promedio en el torneo de Gonzalez, mientras que en azul lo es el de Requena. La linea segmentada naranja indica el promedio de los arqueros del torneo.

Comparando las actuaciones fecha a fecha, podemos ver que Ignacio Gonzalez tiene “rachas”, primeras fechas por sobre el promedio del campeonato (Línea punteada naranja), fechas por debajo del promedio y al final del campeonato un repunte del rendimiento, junto con promedio mayor al de Requena. Por otro lado, Requena es menos consistente, oscilando entre partidos altos y bajos. Teniendo en cuenta lo anterior y los precios de mercado, se debería recomendar Ignacio Gonzalez como un buen fichaje.

Si te gustó este artículo, puedes suscribirte y no perderte ningún artículo nuevo! (Ingresando tu correo más abajo)

(*) Normalización por 90 minutos: Existen muchas formas de medir una misma variable para una acción de juego. Para un mismo torneo podríamos ver la cantidad de tiros totales que realizaron los jugadores y podríamos decir que el jugador con más remates fue el más activo en arco contrario. Para nosotros, esta metodología introduce sesgos y no nos permitiría evaluar a jugadores con menos minutos en cancha (pocas oportunidades o prolongada lesión) por lo anterior es que ajustamos las acciones de juego por el minutaje en cancha y luego lo dividimos por 90 para tener un perfil de lo que podríamos esperar de él en un partido cualquiera. El concepto de normalización viene luego y se trata de un proceso estadístico que permite hacer comparables acciones de juego con magnitudes distintas (ej: Centros por partido vs pases totales).

(**) Conceder penales con signo positivo: Esto en Futbolytics, nos sonó raro y quisimos investigar más, nos dimos cuenta que en Chile se meten solo el 68% de los penales concedidos y el modelo de xG le asigna un 0,77 al tiro penal. Cómo estamos utilizando goles esperados por gol recibido, la efectividad en Chile es menor a la que el modelo asigna, por lo tanto, los goles esperados son más de los goles efectivamente recibidos, aumentando esta estadística. Por lo cual, a pesar de que un arquero conceda penales, lo que se puede ver como algo malo, se convierten menos goles de los que el modelo espera, por lo tanto el efecto efectivamente es positivo para los goles esperados por gol recibido

Si te gustó este artículo, puedes suscribirte y no perderte ningún artículo nuevo! (Ingresando tu correo más abajo)

--

--

Equipo Futbolytics

La plataforma de análisis de jugadores que tu club necesita!