Caso de regresión lineal simple: Relación entre población y número de nacimientos. Jorge Galbiati
El objetivo del estudio es explorar el valor predictivo de la población de cada uno de los tramos etarios sobre el número de nacimientos, de las comunas. En particular, determinar cuál tramo etario (su población) tiene mayor poder predictivo sobre el número de nacimientos.
Se tiene una muestra de 40 comunas comunas elegidas al azar, en que se midieron las siguientes variables : Población por tramo etario (del censo de 2002): 1 menos de 1 año 2entre 1 y 4 años 3entre 5 y 9 años 4entre 19 y 19 años 5entre 20 y 44 años 6entre 45 y 64 años 7entre 65 y 79 años 880 años o más 9 Nacimientos en el año (correspondientes a 2006)
Comuna menos 1e 1 - 4e 5-9e 10-19e 20-44e 45-64e 65-79mas 80 Nacimien tos 1 Huasco , Las Cabras 3051,2991,7943, El Monte 5082,0792,6345, Alto Biobío , San Nicolás , San Fernando 9604,0905,75612, Aisén 4271,6822,1214, Llanquihue 2801,1551,5813, Victoria 4711,7602,5476, Arauco 6132,6783,5737, El Bosque 2,65510,64713,25731, San Vicente 5681,3923,4627, Yerbas Buenas ,3623, Pemuco , Chiguayante 1,5376,1528,61220, Porvenir Combarbalá , Conchalí 1,6866,6768,28618, Tucapel ,0582, Camarones
Comuna menos 1e 1 - 4e 5-9e 10-19e 20-44e 45-64e 65-79mas 80 Nacimien tos 21 Quinta de Tilcoco , Ovalle 1,6616,7129,14020, Pica Ninhue Taltal , Molina 5382,2973,2247, Arica 2,84211,63015,54533, Navidad Graneros 4291,7572,4065, Coronel 1,4716,2488,68120, Caldera ,2662, Mejillones , Colchane Chillán 2,2839,54913,43730, Lago Verde Futrono 2781,1501,5413, Máfil , Canela , Freire 4021,6672,3375, Valdivia 2,1738,47011,33628,
Se presentan los gráficos de los nacimientos versus población, de cada tramo.
Se observa que persistentemente una comuna tiene un número de nacimientos mayor que el resto, según su población, en todos los tramos. Es la Comuna de Las Cabras. Las comunas con ambos números más grandes son Arica, El Bosque y Chillán. Para los gráficos y los cálculos siguientes se usó el software MINITAB.,
Hay una correlación muy fuerte entre las poblaciones de los distintos tramos de edad, siendo un poco menos entre el tramo “más de 80” y las demás. Esto se puede apreciar en la siguiente figura, en que grafican las variables de a pares.
Se ajustaron modelos de regresión lineal simple a los nacimientos, con la población de cada uno de los tramos etarios, como regresor. La respuesta (y) siempre fue el número de nacimientos. La salida de MINITAB es la siguiente (en el primer caso):
Regression Analysis: Nac versus menos 1 The regression equation is Nac = (menos 1) Predictor Coef SE Coef T P Constant menos
(cont.) S = R-Sq = 96.0% R-Sq(adj) = 95.9% Analysis of Variance Source DF SS MS F P Regression Residual Error Total
De las pruebas t de hipótesis, se concluye que el intercepto a = no es significativo, mientras que la pendiente B = 1.03 si lo es. Por lo tanto la relación entre nacimientos y el tamaño de la población de menores de 1 año es Nac = 1.03
Relaciones similares se puede obtener para las otras variables poblacionales y su efecto sobre el número de nacimientos. Eso queda para el lector.
FIN