Herramientas adicionales en STATA para el análisis de datos espaciales 3ª Reunión Española de Usuarios de STATA 2010 Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona
Análisis de datos espaciales Estructura de la presentación STATA como herramienta para el análisis de datos espaciales: procedimientos disponibles Desarrollos en curso: Matriz de pesos espaciales Sobre la introducción de retardos espaciales de las variables explicativas en modelos de regresión Sobre la visualización de los resultados del análisis exploratorio espacial
Análisis de datos espaciales ssc install spmap ssc install shp2dta ssc install mif2dta Herramientas disponibles
Análisis de datos espaciales net install sg162.pkg http://www.stata.com/products/stb/journals/stb60.pdf
Análisis de datos espaciales Columbus – Ohio 49 vecindarios del distrito de Columbus en Ohio (Estados Unidos) Información para 1980 sobre: Precio de la vivienda Ingresos familiares Robos por cada 1000 viviendas http://www.rri.wvu.edu/WebBook/LeSage/spatial/anselin.html http://www.rri.wvu.edu/WebBook/LeSage/spatial/aford.html
Análisis de datos espaciales Precio de la vivienda Crimen
Análisis de datos espaciales La matriz de pesos espaciales En el análisis econométrico “estándar”, se supone que cada una de las observaciones analizadas es independiente del resto (hipótesis de no autocorrelación”). Autocorrelación espacial y/o retardos espaciales de las variables explicativas: matriz de pesos espaciales. La matriz de pesos espaciales recoge la existencia de relaciones entre los territorios analizados. Existen diferentes especificaciones de dicha matriz.
Análisis de datos espaciales Se han propuesto distintas especificaciones: Contigüidad (matriz de contactos binaria) Proximidad (matriz basada en distancias entre centroides o entre capitales) Flujos (matriz basada en movimientos de personas, mercancias, etc. – asimétrica) … Es importante analizar la robustez de los resultados a distintas especificaciones de la matriz.
Análisis de datos espaciales Pero, los procedimientos existentes en STATA sólo permiten trabajar con matrices binarias generadas manualmente por el usuario o matrices basadas en distancias (simétricas). En otros programas como GEODA-PYSAL, MATLAB o R es posible generar y utilizar distintas matrices de manera muy simple (a partir del propio mapa). Sin embargo, estos programas no ofrecen la potencialidad de STATA en otros aspectos.
Análisis de datos espaciales Geoda
Análisis de datos espaciales Hemos desarrollado procedimientos que permiten importar matrices generadas desde estos programas, normalizarlas y utilizarlas con spatreg (aunque sean asimétricas por naturaleza como las obtenidas a partir del procedimiento K-nearest neighbours-) gal2dta gwt2dta sparse2dta normw
Análisis de datos espaciales Retardos espaciales de las variables explicativas La existencia de autocorrelación espacial en un modelo de regresión puede indicar la omisión de variables relevantes como retardos espaciales de alguna de las explicativas. Sin embargo, los procedimientos existentes en STATA no permiten introducir de manera directa retardos de las variables, por lo que hemos desarrollado un procedimiento que permite hacerlo de manera muy sencilla. slag
Análisis de datos espaciales Visualización del análisis exploratorio de datos espaciales Geoda Stata spatlsa2 Measures of local spatial autocorrelation Weights matrix -------------------------------------------------------------- Name: W1 Type: Imported (binary) Row-standardized: No Moran's Ii (CRIME) ------------------------------------------------------------- Location | Ii E(Ii) sd(Ii) z p-value* --------------------+----------------------------------------- 1 | 1.474 -0.042 1.381 1.097 0.136 2 | 1.586 -0.063 1.674 0.985 0.162 3 | 0.375 -0.083 1.912 0.240 0.405
Análisis de datos espaciales 1 2 3 Matriz binaria de contactos normalizada
Análisis de datos espaciales
Análisis de datos espaciales
Análisis de datos espaciales 1 2 3 4 5 Matriz binaria de contactos de primer y segundo orden normalizada
Análisis de datos espaciales
Análisis de datos espaciales
Análisis de datos espaciales
Análisis de datos espaciales Los interesados en los procedimientos mencionados pueden contactar con nosotros a través del correo electrónico en las siguientes direcciones: rramos@ub.edu, vroyuela@ub.edu Existen otros procedimientos de interés en este ámbito: anketest, usswm, chinaspatdwm, spmlreg, … … y seguimos a la espera de la difusión de spmat, sarml y g2sls de David Drukker http://repec.org/snasug08/drukker_spatial.pdf