Copa Libertadores 2021: ¿Qué probabilidades tiene tu club de pasar la fase de grupos?

Equipo Futbolytics
5 min readApr 16, 2021

Así quedaron los grupos de la edición 2021 de la Copa Libertadores con todos sus equipos ya definidos!

A continuación te presentamos las probabilidades que tiene cada equipo de pasar la fase de grupos de acuerdo a nuestro modelo:

Según nuestros cálculos, en 4 de los 8 grupos existe claramente un favorito para clasificar en primer lugar ( A: Palmeiras, B: Internacional, D: River Plate y H: Atlético Mineiro ) y en general, el segundo lugar también tiene una inclinación hacia un equipo determinado exceptuando el grupo H donde Cerro Porteño y América de Cali están más parejos en probabilidades.

Los otros escenarios son:

  • En los grupos C, E y F una disputa más ajustada por el primer lugar entre dos equipos (Boca Juniors/Santos, Sao Paulo/Racing y Flamengo/Velez Sarsfield, respectivamente)
  • -El grupo de la muerte: En el grupo F la diferencia en probabilidad de clasificar entre el primer y último equipo es menor al 30%.

¿ El dinero aumenta las probabilidades de que un club avance de fase?

(spoiler alert: ¡Sí!)

Desde el 2017 hemos desarrollado un modelo para estimar probabilidades de clasificación considerando únicamente como parámetro de entrada la valorización económica ($) de la plantilla centrado respecto al promedio de esa variable dentro del grupo, considerando los datos históricos de las últimas diez ediciones de Copa Libertadores (2011–2020).

Así, hemos comprobado que esto es especialmente relevante para la fase de grupos, puesto que con el valor $ de la plantel es posible explicar entre el 75% y el 80% de los equipos clasificados a octavos de final. Esto es, 12 o 13 de los 16 clubes que avanzan son generalmente aquellos que tienen plantillas mejor valoradas que los contrincantes de su respectivo grupo.

A modo de ejemplo, a continuación se observa un gráfico que ilustra dicho valor $ centrado en el eje X (un valor mayor a 0 indica que la valoración de la plantilla del club es mayor al promedio del grupo y viceversa) y los puntos obtenidos en fase grupo en el eje Y, además de mapear con color azul si el club clasificó y con rojo si no lo hizo.

Allí se aprecian claramente 3 zonas:

  • Zona A - “En busca de la hazaña”: Clubes con valoraciones menores a 18 millones de euros respecto al promedio de su grupo. Solo el 13% de estos clubes ha logrado clasificar. Entre ellos están LDU, Independiente del Valle y Guaraní, todos sorpresas de la edición 2020.
  • Zona B - “La verdadera competencia”: El 57% de los clubes entra en esta zona, en la que se observa una gran variación tanto de los valores de plantilla como de los puntos obtenidos y el resultado final de clasificación. Acá el 44% de los clubes logra clasificar y es donde es posible decir que existe una competencia más equilibrada.
  • Zona C - “Favoritos”: Clubes cuya valoración está 10 millones de EUR o más sobre el promedio del grupo. En esta zona el 91% de los clubes ha avanzado de fase. Algunas de las pocas excepciones fueron Palmeiras 2016, Atlético Mineiro 2019, Sao Paulo 2020, Flamengo 2012 y 2017. Por otro lado, el 90% de los clubes de esta zona son brasileros o argentinos, lo que indica la gran disparidad en cuánto a valoración de plantillas que existe en general entre estos dos países y el resto (ver gráfico siguiente).

Sumado a eso se tiene que Brasil y Argentina tienen la mayor cantidad de cupos para clubes de sus federaciones, lo que desequilibra aún más la balanza. Si miramos el porcentaje de participación de cada país en las últimas 10 ediciones de la Copa se tiene que más de un tercio (36%) de los participantes son brasileros (19%) o argentinos (17%), mientras que el resto de países no supera el 10%, fluctuando entre el 7% y el 9% aproximadamente dependiendo en parte de su capacidad de avanzar en las fases previas. México participó solo en algunas ediciones.

Finalmente, si bien es posible decir que las valoraciones económicas de las plantillas tienen cierta relación con las cualidades técnicas, físicas y mentales de los jugadores que las conforman, esta es una variable proxy e indirecta que debería ser desmenuzada en mayor profundidad.

Si se quiere es posible incluir otras variables que aportan a la capacidad predictiva del modelo, como por ejemplo el país del club. Sin embargo, no hemos ahondado más allá hasta el momento. Otros posibles aspectos potencialmente útiles de considerar (por comprobar) serían:

  • Si hubo o no un cambio reciente de DT
  • Información de lesiones, minutos jugados y/o “rachas” de los jugadores en el último tiempo (ej: “goles - xG” acumulados)
  • Características de juego del equipo
  • Campañas previas en sus respectivos torneos locales
  • Otras características de la plantilla: cantidad de jugadores, promedio de edad, separar estadísticas por posiciones, etc.
  • Mediana u otros percentiles del valor $ de los jugadores de cada club (para ahondar en la distribución de los valores)

Los datos de valores $ de plantillas fueron extraídos del sitio Transfermarkt en los días previos al primer partido de cada edición de la Copa.

Finalmente, a continuación una visualización interactiva con los datos históricos de las probabilidades de cada club (eje Y) en función de la variable $ ya mencionada (eje X) y sus respectivos resultados de clasificación (color). Situando el cursor sobre los puntos se desprende mayor información.

Si quieres revisar más detalles acerca del modelo y el desarrollo histórico del mismo puedes visitar los siguientes enlaces:

--

--

Equipo Futbolytics

La plataforma de análisis de jugadores que tu club necesita!