Análisis Exploratorio de los datos (EDA)

Por Jose R. Zapata

Ultima actualización: 19/Feb/2026

El Análisis Exploratorio de Datos (EDA) tiene como objetivo comprender la estructura, patrones y características principales de un conjunto de datos antes de aplicar cualquier modelo o técnica avanzada. A través de visualizaciones y estadísticas descriptivas, el EDA permite detectar valores atípicos, datos faltantes, distribuciones inesperadas y posibles errores en los datos, proporcionando una base sólida para la toma de decisiones en las etapas posteriores del proyecto.

El análisis univariable se enfoca en examinar cada variable de forma individual para entender su distribución, tendencia central, dispersión y forma. Esto permite identificar cómo se comporta cada característica por separado, detectar valores atípicos y evaluar si es necesario aplicar transformaciones antes de continuar con análisis más complejos.

El análisis bivariable estudia la relación entre dos variables simultáneamente, buscando identificar asociaciones, correlaciones o dependencias entre ellas. Este tipo de análisis es fundamental para descubrir qué variables podrían tener influencia sobre la variable objetivo y para formular hipótesis sobre las relaciones causa-efecto presentes en los datos.

El análisis multivariable examina la interacción entre tres o más variables al mismo tiempo, permitiendo capturar relaciones complejas que no son visibles en análisis de menor dimensión. Este enfoque es clave para entender cómo múltiples factores actúan en conjunto, identificar grupos o segmentos dentro de los datos y reducir la dimensionalidad del problema antes de la etapa de modelado.

Contenido

📖 References

Visualización

EDA

Statistical tests