Machine Learning · Proyecto académico

LaLiga Match Predictor

Proyecto académico de Machine Learning que recorre el ciclo completo de un modelo supervisado: preparación de datos, feature engineering, entrenamiento, evaluación probabilística y una demo interactiva en Streamlit.

Interfaz de LaLiga Match Predictor con configuración del partido y resultado probabilístico

Resumen del proyecto

Explicación del proyecto

LaLiga Match Predictor es una mini aplicación académica de Machine Learning clásico construida para recorrer el ciclo completo de un problema supervisado multiclase: búsqueda de datos, preparación del dataset, construcción de variables, entrenamiento, comparación de modelos, evaluación probabilística y presentación del resultado en una interfaz interactiva.

Para la obtención de datos utilicé Kaggle como fuente principal de búsqueda de datasets deportivos. A partir de información de equipos, goles, resultados y árbitros, generé variables predictivas para entrenar modelos de clasificación multiclase para estimar tres posibles salidas: victoria local, empate o victoria visitante.

El objetivo no era crear un sistema de predicción deportiva profesional ni una herramienta orientada a apuestas, sino demostrar una base técnica sólida en ML aplicado: transformar datos tabulares en señales útiles, entrenar modelos supervisados, interpretar métricas como Log Loss, Accuracy y Brier Score, y convertir el resultado en una demo visual entendible.

Competencias trabajadas

  • Preparación y limpieza de datos tabulares.
  • Feature engineering sobre información deportiva.
  • Entrenamiento y comparación de modelos supervisados.
  • Evaluación probabilística con Log Loss, Accuracy y Brier Score.
  • Conversión de un flujo de ML en una aplicación interactiva.

Stack

Datos: Kaggle, Pandas, NumPy.

Modelado: Scikit-learn, clasificación multiclase y comparación de modelos supervisados.

Evaluación: Log Loss, Accuracy y Brier Score.

Aplicación: Streamlit, Plotly y Joblib.