Golver

Cómo Construir un Modelo Predictivo de Fútbol para Apuestas: Variables, Calibración y Backtesting

Cargando...

Los modelos estadísticos calculan probabilidades con más precisión que las casas — si estan bien construidos

Mi primer modelo predictivo era un desastre. Lo construi en una hoja de cálculo con tres variables: posición en la tabla, goles a favor y goles en contra en los últimos cinco partidos. Me daba probabilidades para los tres resultados del 1X2 y las comparaba con las cuotas. El modelo «encontraba valor» en el 40% de los partidos — una cifra que debería haberme alertado de inmediato. Tres meses y 200 apuestas después, mi yield era del -6%. El modelo no estaba encontrando valor; estaba sobreestimando la probabilidad de los favoritos porque las tres variables que usaba ya estaban completamente capturadas por las cuotas del mercado.

Las estrategias ganadoras en 2026 se basan en el uso de modelos estadísticos y machine learning que calculan las probabilidades reales de cada resultado con más precisión que las casas de apuestas. Pero la palabra clave es «precisión» — un modelo mal calibrado es peor que no tener modelo, porque te da una falsa sensacion de ventaja que te lleva a apostar con confianza en selecciones sin valor real.

Seleccion de variables: que datos incluir y cuales descarta el ruido

La selección de variables es donde se gana o se pierde un modelo predictivo. La tentacion del principiante es incluir todo: forma reciente, xG, posesión, tiros a puerta, corners, faltas, posición en la tabla, historial de enfrentamientos directos, lesiones, estado del terreno de juego, temperatura. Más variables es mejor, verdad? No.

El sobreajuste — overfitting — es el enemigo número uno del modelador novato. Si incluyes demasiadas variables, el modelo se adapta al ruido de los datos históricos en lugar de capturar las relaciones reales. Un modelo con 30 variables que predice el pasado con un 75% de acierto puede predecir el futuro peor que uno con 6 variables y un 62% de acierto histórico.

Las variables que yo he encontrado más predictivas después de años de pruebas son: xG medio (últimos 8-10 partidos), xGA medio (misma ventana), diferencia de xG (ofensivo menos defensivo), posición relativa en la tabla (no absoluta — la distancia entre los dos equipos), ventaja de campo (ajustada por liga) y días de descanso desde el último partido. Los modelos de xG estan entrenados con casi un millón de tiros históricos e integran más de 20 variables por disparo, lo que significa que el xG ya captura internamente muchas de las variables que un modelo naive intentaria incluir por separado — tiros a puerta, posesión ofensiva, corners.

Variables que parecen útiles pero que en mis tests no aportaron poder predictivo adicional: historial de enfrentamientos directos (demasiada varianza con muestras pequeñas), resultados de los últimos 3 partidos (ventana demasiado corta), posesión total (no correlaciona bien con resultados). Variables que parecen irrelevantes pero que aportan: días de descanso (especialmente cuando la diferencia entre equipos es mayor a dos días), distancia de viaje del equipo visitante (en ligas grandes con desplazamientos largos) y el factor entrenador nuevo (los equipos suelen tener un bump de rendimiento en las primeras 5-8 jornadas con un nuevo técnico).

Calibración: cómo verificar que tu modelo no sobreestima ni subestima

8 de los 10 mejores modelos predictivos de fútbol utilizan datos xG, y los 2 modelos con mayores pérdidas estan basados solo en datos de goles. Pero incluso un modelo basado en xG puede estar mal calibrado — es decir, puede asignar probabilidades que no reflejan las frecuencias reales de los resultados.

La calibración se mide comparando las probabilidades que tu modelo asigna con los resultados reales observados. Si tu modelo dice que un resultado tiene un 30% de probabilidad, y en 100 apuestas con esa probabilidad asignada el resultado ocurre 30 veces, el modelo está perfectamente calibrado para ese rango. Si ocurre 40 veces, subestima. Si ocurre 20, sobreestima.

El metodo práctico que uso es dividir mis predicciones en rangos de probabilidad (0-10%, 10-20%, 20-30%… 90-100%) y comparar la probabilidad media asignada con la frecuencia real de aciertos en cada rango. Un modelo bien calibrado produce una curva que sigue la diagonal — probabilidad predicha similar a frecuencia real. Las desviaciones me indican donde el modelo necesita ajuste.

Un error frecuente es calibrar con los mismos datos usados para construir el modelo. Eso produce una ilusion de calibración perfecta que se desmorona con datos nuevos. La regla es siempre dividir los datos en dos conjuntos: uno para entrenar el modelo (70-80% de los datos) y otro para validar la calibración (20-30% restante). Solo la calibración sobre datos que el modelo no ha «visto» es informativa.

Backtesting con datos históricos: validar antes de arriesgar dinero real

Antes de apostar un solo euro con un modelo nuevo, lo someto a un backtesting que simula como habría funcionado en temporadas anteriores. Este paso es el más tedioso del proceso y también el más importante — es la diferencia entre apostar con una hipotesis validada y apostar con una corazonada disfrazada de matemática.

El backtesting funciona así: aplico mi modelo a las cuotas de apertura de partidos de temporadas pasadas — normalmente dos o tres temporadas completas — e identifico las apuestas que habría realizado según mis criterios de EV positivo. Luego comparo esas apuestas con los resultados reales y cálculo el yield hipotetico.

Las trampas del backtesting son sutiles. La principal es el sesgo de supervivencia: si has probado 15 variantes de tu modelo y presentas solo la que mejor funciona en backtesting, estas haciendo cherry-picking. La variante ganadora puede haber tenido suerte con los datos de esas temporadas específicas. Para mitigar esto, defino las reglas del modelo ANTES del backtesting y no modifico variables después de ver los resultados. Si el modelo no funciona en backtesting, vuelvo a la fase de selección de variables — no ajusto el modelo hasta que «funcione» con los datos históricos.

Un backtesting valido necesita volumen. Menos de 200 apuestas hipoteticas no es estadisticamente significativo — la varianza puede producir resultados positivos o negativos por azar. Apunto a un mínimo de 500 apuestas en backtesting antes de considerar que los resultados son fiables. Con tres temporadas de las cinco grandes ligas europeas, eso es fácilmente alcanzable.

El resultado final del backtesting no es «el modelo funciona» o «no funciona». Es un rango de yield esperado con intervalos de confianza. Si mi backtesting produce un yield medio del 3,5% con un intervalo de confianza del 95% entre 1,2% y 5,8%, se que el modelo probablemente es rentable pero no espero un 3,5% exacto. Si el intervalo de confianza incluye valores negativos, el modelo no tiene suficiente evidencia de ventaja y necesita más trabajo. Para complementar la construccion de tu modelo con las herramientas de datos adecuadas, la guía de xG y expected goals detalla donde obtener los datos estadísticos que alimentan estas variables.

Necesito saber programar para crear un modelo predictivo de fútbol?
No es imprescindible para un modelo básico. Una hoja de cálculo con formulas de probabilidad y datos de xG descargados manualmente puede funcionar como primer modelo. Sin embargo, para automatizar la recopilacion de datos, correr backtesting con miles de partidos y actualizar predicciones antes de cada jornada, saber programar — aunque sea a nivel básico en Python o R — multiplica tu capacidad por diez.
Con cuántas temporadas de datos debo entrenar mi modelo?
Mínimo tres temporadas completas para el conjunto de entrenamiento y una adicional para validacion. Menos de tres temporadas no ofrece suficiente volumen estadístico para separar señales reales de ruido. Más de cinco temporadas puede introducir datos obsoletos — el fútbol cambia tacticamente y los datos de hace siete años pueden no reflejar el juego actual. El punto dulce suele estar en 3-4 temporadas recientes.