Curso abierto de Análisis exploratorio de datos con Pandas

La definición más común del Análisis Exploratorio de Datos la propone John W. Tukey y se refiere al tratamiento estadístico al que se someten las muestras recogidas durante un proceso de investigación en cualquier campo científico.

Sin embargo en el área de los sistemas de información geográfica (SIG)’s cuando tratamos con datos relacionados con el espacio y tiempo, este análisis de datos se refiere a: “El proceso iterativo de búsqueda de patrones geográficos en los datos, así como las relaciones entre otros elementos. (Mitchell 1999). Andrienko y Andrienko, 2006 plantean que este proceso comienza con la formulación de una pregunta de investigación, seguida de un método de análisis partir del tipo de dato disponible y el nivel requerido de información. (que a su vez puede generar datos adicionales). Después el dato es procesado y el resultado se despliega, lo que permite analizar la información y validar su utilidad o replantear los datos con distintos parámetros y otras técnica para interpretar y evaluar los datos obtenidos.

La diferencia de un análisis estadístico puro y uno que se hace en un sistema de análisis geográfico parece radicar en el tipo de dato al que se enfrenta la person y la variedad de métodos disponibles.

Es por eso que me llamo la atención este curso. Quizás valga la pena echarle un ojo.

Open Machine Learning Course. Topic 1. Exploratory data analysis with Pandas

View story at Medium.com

Referencias

Andrienko, N., & Andrienko, G. (2006). Exploratory analysis of spatial and temporal data: a systematic approach. Berlin ; New York: Springer.
Advertisements