Golver

Expected Goals (xG) en Apuestas de Fútbol: Modelo, Datos y Aplicación Práctica

Cargando...

8 de cada 10 modelos predictivos ganadores usan xG — los 2 perdedores no

Hace cinco años, un estudio independiente analizó los 10 modelos predictivos de fútbol con mejor rendimiento en competiciones de pronósticos. El resultado fue contundente: 8 de los 10 modelos ganadores integraban datos de expected goals como variable central. Los 2 modelos que solo usaban datos de goles reales —marcadores finales, rachas de victorias, promedios de goles— fueron los que más dinero perdieron.

Este dato cambió mi forma de apostar. Yo venía de una tradición de análisis más convencional: estadísticas de resultados, posición en tabla, historial de enfrentamientos directos. Funcionaba razonablemente bien en mercados ineficientes, pero tenía un techo. El xG rompió ese techo porque mide algo que los goles reales no capturan: la calidad de las ocasiones que genera y concede un equipo, independientemente de si entraron o no.

Tom Lawrence, uno de los analistas de referencia en football analytics, lo resume bien: el xG ha democratizado el análisis de fútbol. Lo que antes requería ver cientos de partidos ahora puede entenderse a través de datos. Esa democratización también aplica a las apuestas. Los apostadores que integran xG en sus modelos acceden a ventajas que antes eran exclusivas de sindicatos profesionales con presupuestos de seis cifras. En esta guía voy a explicar exactamente cómo funciona el modelo, qué variables usa, dónde falla y —lo más importante— cómo aplicarlo para encontrar apuestas de valor en mercados de fútbol.

Qué es el xG y cómo se calcula: las 20+ variables detrás de cada tiro

Si ves un partido y un delantero dispara desde 30 metros con dos defensas delante, sabes intuitivamente que eso es más difícil que un cabezazo a un metro de la portería sin nadie entre medias. El xG convierte esa intuición en un número: la probabilidad de que un tiro concreto, desde esa posición exacta, con esas condiciones exactas, termine en gol.

Un penalti tiene un xG de 0.76, lo que refleja la tasa histórica de conversión del 76%. Un tiro desde fuera del área, frontal y sin presión, puede tener un xG de 0.05 —uno de cada veinte termina en gol—. Un cabezazo a bocajarro tras un centro al área pequeña puede estar en 0.35 o 0.40. Cada tiro recibe su valor, y la suma de todos los tiros de un equipo en un partido es su xG total del partido.

Los modelos más avanzados —los de proveedores como Stats Perform y Opta, que son el estándar de la industria— están entrenados con casi un millón de tiros históricos. No se limitan a la posición del disparo. Integran más de 20 variables por cada tiro: la distancia a la portería, el ángulo con respecto al centro del arco, la parte del cuerpo utilizada, si fue un disparo directo o un remate tras centro, la velocidad del balón en el momento del pase previo, el número de defensas entre el balón y la portería, la posición del portero, si el tiro fue con el pie dominante del jugador, si vino de una jugada de contraataque o de una posesión establecida, y muchas más.

La potencia del modelo está en el volumen de datos de entrenamiento. Un millón de tiros con 20+ variables cada uno genera una función de probabilidad que captura patrones que ningún ojo humano puede detectar en tiempo real. Por ejemplo: los tiros desde la zona central del área a una distancia de 8-12 metros tienen un xG promedio de 0.15, pero si el portero está desplazado más de un metro respecto al centro de la portería, ese xG sube a 0.28. Ese tipo de matiz solo emerge del análisis masivo de datos.

Lo que el xG te da como apostador es una medida del rendimiento subyacente de un equipo, limpia de la variabilidad del acierto goleador. Un equipo puede generar 2.3 xG por partido y marcar solo 1.1 goles de media: eso indica que su eficacia de cara a gol está por debajo de lo esperado y probablemente subirá. Otro equipo puede marcar 2.0 goles por partido con solo 1.2 xG generado: está convirtiendo muy por encima de lo sostenible y su producción goleadora bajará. Esas divergencias son exactamente donde se esconde el valor en las apuestas.

NPxG (Non-Penalty xG): por qué eliminar penaltis mejora el análisis

Los penaltis distorsionan el xG de un equipo de una forma que puede engañarte como apostador. Un penalti aporta 0.76 xG de golpe, el equivalente a cuatro o cinco tiros desde buenas posiciones en juego abierto. Si un equipo recibe tres penaltis en cinco partidos, su xG de temporada se infla sin que eso refleje una mejora real en su capacidad de generar ocasiones desde el juego.

El NPxG —Non-Penalty xG— elimina todos los penaltis del cálculo. Es la métrica que uso como base para mis análisis de apuestas, porque los penaltis son eventos relativamente aleatorios: dependen de decisiones arbitrales, de jugadas en el área que no siempre correlacionan con la calidad del ataque del equipo. El NPxG mide lo que quiero medir: cuántas ocasiones de calidad genera un equipo desde el juego, que es lo que se repetirá partido tras partido de forma más predecible.

La diferencia práctica importa. Si un equipo tiene un xG de 1.8 por partido pero un NPxG de 1.2, su creación de juego real es significativamente menor de lo que sugiere el dato bruto. Apostar al over basándote en el xG total cuando una parte relevante viene de penaltis es un error que he visto cometer a apostadores experimentados.

xG frente a goles reales: lo que la diferencia revela sobre un equipo

Temporada 2024-25 de LaLiga: un equipo de mitad de tabla marcó 12 goles en las primeras 10 jornadas —una cifra impresionante— con un xG acumulado de solo 8.3. Otro equipo, percibido como decepcionante por sus aficionados, marcó 6 goles con un xG de 10.1. Las cuotas del mercado reflejaban la clasificación real, no el rendimiento subyacente. Tres meses después, la regresión a la media hizo su trabajo: el primer equipo se desplomó y el segundo remontó. Los apostadores que miraron xG en octubre ganaron dinero en enero.

La diferencia entre xG y goles reales se llama xG delta, y es una de las señales más potentes para detectar equipos infravalorados o sobrevalorados. Un xG delta positivo sostenido —un equipo que marca consistentemente más de lo que su xG predice— indica que algo excepcional está ocurriendo: un delantero en racha sobrehumana, un portero rival que comete errores inhabituales, o simplemente buena suerte. Esa sobreperformance casi siempre se corrige.

Hay un dato que me encanta usar como referencia: los equipos que generan 1.0 o más xG en los primeros 30 minutos de un partido ganan el 68% de las veces. Esa estadística es más predictiva que el marcador al descanso, porque el marcador puede mentir —un gol de falta directa a los 5 minutos no dice nada sobre la dinámica del juego—, pero el xG acumulado en los primeros 30 minutos refleja el dominio territorial y la creación de ocasiones reales.

En la práctica, lo que hago antes de apostar en cualquier partido es comparar tres cosas: el xG medio del equipo en los últimos 5 partidos como local o visitante, el xG concedido del rival en las mismas condiciones, y la diferencia entre goles reales y xG de ambos en la temporada. Si un equipo marca menos de lo que genera y su rival concede más de lo que sugiere su xGA, la probabilidad de que «estalle» en ese partido es mayor de lo que las cuotas reflejan. Y ahí está el valor.

Cómo usar xG para apostar en over/under, resultado y ambos marcan

Un compañero analista me dijo una vez: «Tengo un modelo xG perfecto pero no sé en qué mercado usarlo». Aplicaba el xG del mismo modo al over/under que al 1X2, y sus resultados eran inconsistentes. El problema no era el modelo. Era que cada mercado tiene una forma distinta de integrar el xG, y confundir las aplicaciones es un error que he visto repetirse incluso entre apostadores con experiencia.

Para el mercado over/under, el xG combinado de ambos equipos es tu punto de partida. Si el equipo local genera una media de 1.6 NPxG por partido en casa y el visitante concede una media de 1.4 xGA fuera de casa, la estimación base de goles esperados del equipo local está entre 1.4 y 1.6. Repites el cálculo para el visitante y sumas. Si el total supera los 2.5 con un margen razonable y la cuota del over 2.5 te da un EV positivo, tienes una apuesta fundamentada. El mercado over/under 2.5 es especialmente atractivo porque en España tiene el margen más bajo del operador: un 4,81% frente al 5,71% del 1X2.

Para el mercado de resultado —1X2—, el xG es una de las variables que alimenta tu estimación de probabilidad, no la única. Un equipo con 1.8 NPxG generado y 0.9 NPxG concedido tiene un perfil dominante, pero necesitas contextualizar: esas cifras, ¿son constantes o vienen de dos partidos extraordinarios contra rivales débiles? ¿El rendimiento es similar como local y como visitante? El xG de los últimos 5 partidos en la misma condición —local o visitante— es más predictivo que el xG de temporada para el resultado de un partido concreto.

Para el mercado de ambos marcan, lo que necesitas es el xG generado de cada equipo por separado. Si ambos equipos generan más de 1.0 NPxG por partido de forma consistente, la probabilidad de que ambos marquen sube significativamente. Pero aquí hay un matiz defensivo que muchos ignoran: el xGA —expected goals concedidos— del equipo más fuerte. Un equipo puede generar 2.0 xG por partido pero si solo concede 0.6 xGA, la probabilidad de que el rival le marque es baja aunque ese rival genere 1.2 xG habitualmente. El «ambos marcan» requiere cruzar el ataque de cada equipo con la defensa del rival, no mirar solo la producción ofensiva.

Un error recurrente: aplicar el xG de temporada completa sin ajustar por rival. El xG de un equipo contra los cinco peores equipos de la liga no predice su rendimiento contra un rival del top-5. Los modelos xG dan un número agregado, pero tu trabajo como apostador es desagregar y contextualizar ese número para cada enfrentamiento específico.

Limitaciones del xG: qué no captura este modelo y cuándo falla

Sería irresponsable hablar del xG como si fuera infalible. No lo es. Y conocer sus limitaciones es tan importante como conocer sus fortalezas, porque una confianza ciega en el modelo te llevará a cometer errores sistemáticos.

El primer problema es su base estadística. El fútbol es un deporte de marcadores bajos donde un tiro típico tiene aproximadamente un 10% de probabilidad de convertirse en gol. Eso significa que la muestra de tiros en un solo partido —entre 20 y 30 combinados— es pequeña. El xG de un partido individual tiene un margen de error enorme. Un equipo con 2.5 xG en un partido puede haber tenido muchos tiros de baja calidad que se sumaron, no necesariamente dos o tres ocasiones claras. El xG gana potencia predictiva con la acumulación de partidos, no en eventos individuales.

El segundo problema es lo que el modelo no captura. El xG estándar no mide la calidad del rematador —Lewandowski y un central de segunda tienen el mismo xG para un tiro desde la misma posición—. No captura el estado psicológico de un partido: un equipo que necesita ganar para no descender y un equipo que ya no se juega nada reciben el mismo tratamiento. No integra factores tácticos como cambios de formación durante el partido, ajustes defensivos tras un gol en contra o la fatiga en los últimos 15 minutos.

El tercer problema es la retroalimentación. El xG puede subestimar o sobreestimar sistemáticamente a ciertos estilos de juego. Equipos que dominan el contragolpe generan tiros de altísima calidad con pocos disparos totales: su xG puede ser bajo pero su eficiencia es real y sostenible, no solo suerte. Equipos que acumulan disparos lejanos pueden tener un xG engañosamente alto que no se traduce en goles porque la calidad real de esas ocasiones es inferior a lo que el modelo captura.

Mi enfoque: trato el xG como la mejor herramienta disponible, no como la verdad absoluta. Lo uso como variable principal en mi modelo, pero siempre lo cruzo con contexto táctico, información de alineaciones y el análisis visual de cómo juega cada equipo. Un xG alto que contradice lo que tus ojos ven cuando miras los highlights del partido debe investigarse, no aceptarse ciegamente.

Dónde consultar datos xG fiables: fuentes gratuitas y de pago

El mejor modelo del mundo es inútil si no tienes acceso a los datos. Afortunadamente, el ecosistema de datos de xG en 2026 es mucho más accesible que hace cinco años, con opciones tanto gratuitas como de pago que cubren las principales ligas europeas.

En el lado gratuito, hay plataformas que ofrecen datos xG por partido, por equipo y por jugador para las cinco grandes ligas europeas, LaLiga incluida. Estas fuentes proporcionan el xG total del partido, el xG por equipo, y en algunos casos el desglose por tiro. Para un apostador que está construyendo su primer modelo, es información más que suficiente. Las actualizaciones suelen llegar entre 12 y 48 horas después del partido, lo que las hace válidas para apuestas prepartido pero no para live betting.

En el lado de pago, los proveedores profesionales ofrecen datos en tiempo real, con desglose tiro a tiro, NPxG, xGA, y variables adicionales como xT —expected threat, que mide la peligrosidad de cada posesión, no solo de los tiros—. El coste oscila entre 20 y 200 euros al mes dependiendo del nivel de detalle y del número de ligas. Mi recomendación: si tu bankroll es inferior a 2.000 euros, las fuentes gratuitas son suficientes. Si supera esa cifra y apuestas regularmente, la inversión en datos de pago se amortiza rápido porque te permite acceder a mercados en vivo y a análisis más granulares.

Un consejo práctico que me habría ahorrado meses: no acumules datos de múltiples fuentes sin verificar su consistencia. Los modelos xG de distintos proveedores no son idénticos —cada uno usa variables ligeramente diferentes—, así que mezclar datos de dos fuentes contamina tu análisis. Elige una fuente, entiende su modelo y sé consistente. Cambiar de proveedor a mitad de temporada es como cambiar de unidad de medida: todo lo anterior pierde contexto.

Ejemplo práctico: analizar un partido de LaLiga con datos xG antes de apostar

Voy a reconstruir un análisis real que hice la temporada pasada para que veas el proceso completo, desde los datos hasta la decisión de apostar o no. Los nombres de los equipos no importan —lo que importa es el flujo de trabajo—.

Partido: equipo A (local, mitad de tabla) contra equipo B (visitante, zona alta). El mercado 1X2 ofrecía cuotas de 3.40 / 3.30 / 2.10. La cuota del visitante a 2.10 implicaba una probabilidad del 47,6%. La del local a 3.40 implicaba un 29,4%. El empate a 3.30, un 30,3%. La suma supera el 100% porque incluye el margen del operador.

Primer paso: xG de los últimos 5 partidos en la misma condición. El equipo A como local había generado una media de 1.52 NPxG y concedido 1.14 xGA. El equipo B como visitante generaba 1.38 NPxG y concedía 1.31 xGA. Estos números sugerían un partido más equilibrado de lo que las cuotas indicaban.

Segundo paso: xG delta de temporada. El equipo A marcaba menos de lo que su xG predecía —xG delta de -0.3 en 12 partidos como local—. El equipo B marcaba ligeramente por encima de su xG —delta de +0.15—. La lectura: el local tenía margen de regresión positiva y el visitante estaba algo inflado en goles respecto a sus ocasiones.

Tercer paso: contexto. El equipo A venía de perder tres seguidos, lo que hundió su cuota de victoria. Pero sus datos de xG en esos tres partidos eran de 1.7, 1.4 y 1.6 —generó ocasiones, no las convirtió—. No era un equipo en crisis de juego, sino en crisis de acierto. El mercado castigaba los resultados, yo leía el proceso.

Cuarto paso: estimación de probabilidad. Combinando xG contextual, xG delta y la ventaja de campo, estimé la victoria local en un 34%, empate en 28% y victoria visitante en 38%. La cuota del local a 3.40 implicaba un 29,4% pero yo estimaba un 34%. EV = (0,34 x 2,40) – (0,66 x 1) = 0,816 – 0,66 = +0,156. Un 15,6% de EV positivo. Apuesta registrada.

Quinto paso: comprobación del over/under. El xG combinado estimado era de 2.66 para el local y 1.31 para el visitante generado, con un total orientativo de unos 2.8 goles esperados. La cuota del over 2.5 estaba a 1.82, con un margen del operador más bajo que en el 1X2. Calculé un EV ligeramente positivo también para el over, pero inferior al de la victoria local, así que prioricé la apuesta con mayor EV.

Resultado del partido: 2-1 para el local. Pero eso es irrelevante para evaluar el proceso. Lo relevante es que la estimación de probabilidad estaba fundamentada, el EV era positivo y el stake estaba dimensionado según mis reglas de bankroll. Si hubiera terminado 0-1, el análisis habría sido igual de correcto. El value betting se evalúa en cientos de apuestas, no en una.

Preguntas frecuentes sobre xG y apuestas

¿Es el xG fiable para partidos con pocos tiros a puerta?
Su fiabilidad disminuye cuantos menos tiros tenga el partido. Con 8-10 tiros combinados, el margen de error del xG individual del partido es alto. Sin embargo, el xG sigue siendo más informativo que el marcador para evaluar quién dominó. La solución es no basar decisiones de apuestas en el xG de un solo partido, sino en la acumulación de al menos 5 partidos en condiciones similares.
¿Dónde puedo consultar datos de xG gratis para LaLiga y Champions League?
Existen varias plataformas de analítica de fútbol que ofrecen datos de xG gratuitos para las principales ligas europeas, incluida LaLiga y Champions League. Estas fuentes proporcionan xG por partido, por equipo y en algunos casos por jugador. Las actualizaciones llegan entre 12 y 48 horas después del partido. Para la mayoría de apostadores que trabajan con mercados prepartido, la información gratuita es suficiente para construir un modelo funcional.
¿Qué diferencia hay entre xG, NPxG y xGA?
El xG mide los goles esperados totales que genera un equipo con sus tiros, incluyendo penaltis. El NPxG elimina los penaltis del cálculo para reflejar solo la creación de ocasiones desde el juego. El xGA mide los goles esperados que un equipo concede a sus rivales, es decir, la calidad de las ocasiones que permite el equipo en defensa. Para apuestas, el NPxG generado y el xGA concedido son las dos métricas más útiles como punto de partida.
¿Se puede usar xG para apostar en mercados de apuestas en vivo?
Sí, pero requiere acceso a datos de xG en tiempo real, que suelen ser de pago. El xG en directo te permite detectar si un equipo está generando muchas ocasiones sin marcar —lo que sugiere que el gol puede llegar— o si un marcador favorable se sostiene sobre muy poco xG generado —lo que indica vulnerabilidad—. La ventaja del xG en vivo es que el mercado tarda minutos en ajustar las cuotas a la dinámica real del partido, y en ese desfase hay oportunidades.