por Virginia Sánchez Romero ESTADÍSTICA APLICADA Índice de Gini por Virginia Sánchez Romero ESTADÍSTICA APLICADA
Introducción Corado Gini (23 de mayo de 1884 - 13 de marzo de 1965): estadístico, demógrafo y sociólogo, desarrolló una medida de desigualdad de una distribución que publicó en “Variabilidad y Mutabilidad” en 1912, y a la que denominó coeficiente de Gini. Normalmente se utiliza para medir la desigualdad en los ingresos, pero puede utilizarse para medir cualquier forma de distribución desigual. También puede utilizarse para medir la desigualdad en la riqueza, pero este uso requiere que nadie disponga de una riqueza neta negativa.
Definición Coeficiente de Gini: es un número comprendido entre 0 y 1 donde: 0 se corresponde con la perfecta igualdad (todos tienen los mismos ingresos). 1 se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno). Índice de Gini: es el coeficiente de Gini expresado en porcentaje (coeficiente de Gini multiplicado por 100).
Cálculo CURVA DE LORENZ: El cálculo del coeficiente de Gini se puede realizar de 2 formas: A través de la Curva de Lorenz. Mediante de Fórmula de Brown. CURVA DE LORENZ: Definición: Es un gráfico que se suele utilizar para representar la distribución relativa de una variable en un dominio determinado. Por ejemplo: tomar el dominio como el conjunto de hogares o personas de una región o país y la variable cuya distribución se estudia como el ingreso de los hogares o las personas (en % acumulado).
La curva parte del origen (0,0) y termina en el punto (100,100). Línea de la igualdad perfecta: es la línea de 45º (recta y = x) y corresponde a una distribución de ingresos perfectamente equitativa. Línea de la desigualdad perfecta: función y = 0 para x < 100 x = 100 para x = 100 Curva de Lorenz: en general se encuentra en la situación intermedia, e indica una mayor igualdad cuanto más cercana esté a la línea de igualdad perfecta y viceversa.
Cálculo del coeficiente de Gini: Siendo A el área entre la línea de la igualdad perfecta y curva de Lorenz y B el área debajo de la curva de Lorenz, el coeficiente de Gini se define como A/(A+B).
FÓRMULA DE BROWN: Cálculo del coeficiente de Gini: Si queremos trabajar analíticamente, la forma de hallar el coeficiente de Gini es mediante la fórmula: Donde:
Ejemplos: Para apreciar la percepción que ofrece el coeficiente de Gini veamos dos ejemplos: Ejemplo 1: vamos a calcular el índice de Gini de una serie de datos con los sueldos de los empleados de una empresa. Ejemplos: Datos: Calculamos los valores que necesitamos para aplicar la fórmula: Sueldos (miles de €) Empleados 20 10 27 12 36 8 48 5 60 3 90 1 120 Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi 20 10 25,0 200 13,8 11,2 27 12 22 55,0 324 524 36,3 18,7 36 8 30 75,0 288 812 56,3 48 5 35 87,5 240 1052 73,0 14,5 60 3 38 95,0 180 1232 85,4 9,6 90 1 39 97,5 1322 91,7 5,8 120 40 100,0 1442 X x Σpi (entre 1 y n-1) = 435,0 Σ(pi - qi) (entre 1 y n-1 )= 78,5 Por lo tanto: G=78,5/435,0=0,18 (18%) Un coeficiente de Gini de 0,18 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de concentración no es excesivamente alto.
Ejemplo 2: el mismo ejemplo pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor concentración de renta en unas pocas personas. Datos: Calculamos los valores que necesitamos para aplicar la fórmula: Sueldos (miles de €) Empleados 20 10 27 36 8 48 5 60 3 90 120 4 Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi 20 10 25,0 200 10,9 14,1 27 50,0 270 470 25,6 24,4 36 8 28 70,0 288 758 41,2 28,8 48 5 33 82,5 240 998 54,3 28,2 60 90 120 7 40 100,0 840 1838 0,00 x Σpi (entre 1 y n-1) = 392,5 Σ(pi - qi) (entre 1 y n-1 ) = 151,9 Por tanto: G=151,9/392,5=0,39 (39%) El coeficiente de Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas en la empresa.
Ventajas e Inconvenientes Es una medida de desigualdad representativa de la mayor parte de de la población. Compara distribuciones de ingresos a través de diversos sectores de la población. Es muy simple y puede comparar países interpretándose muy fácilmente. Puede indicar cómo cambia la distribución del un país durante el tiempo (si aumenta o disminuye). Anonimato: no importa quiénes poseen las riquezas y quienes no. Independencia de la escala: no considera el tamaño de la economía (si en promedio el país es rico o pobre). Independencia de la población: no importa el nº de habitantes del país. Principio de la transferencia: si la renta se transfiere de una persona rica a una persona pobre la distribución que resulta es similar.
INCONVENIENTES: Medido en un país geográficamente grande y diverso dará un coeficiente mucho más alto que cada una de sus regiones individualmente. Los países cuyas ayudas no son en forma de dinero no afectarán al coeficiente de Gini y no se pueden comparar con los que sí lo dan. La curva de Lorenz puede minimizar la cantidad real de desigualdad si la población más rica utiliza su renta eficientemente. Estadísticamente, habrá errores sistemáticos y de azar en los datos. Además cada país puede recoger sus datos de forma distinta, lo que dificulta la comparación. Las economías con rentas y coeficientes de Gini muy similares pueden tener distribuciones de ingresos muy diversas. (ejemplo: el coeficiente de Gini es de ½ tanto si la mitad de la población tiene toda la renta y el resto nada como si una casa tiene la mitad de la renta total y el resto está repartida). Es más sensible a las rentas medias que a las de los extremos.
Ejemplos de uso A) DESIGUALDAD DE INGRESOS: El uso más común del índice de Gini es el estudio de la desigualdad de los ingresos, es decir, cómo de repartidas están las riquezas en una determinada población. COEFICIENTE DE GINI POR COMUNIDADES AUTÓNOMAS:
COMPARACIÓN POR COMUNIDADES AUTÓNOMAS: Se pueden ver las comunidades que están por encima y por debajo del coeficiente de Gini total español.
ENCUESTA DE INGRESOS: Veamos a continuación la utilización del coeficiente de Gini en una Encuesta Nacional de Ingresos y Gastos de los Hogares española correspondiente al año 2004.
INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países): CONCLUSIÓN: se puede observar que Portugal, España y Grecia son los países con mayores desigualdades.
INDICE DE GINI DE EEUU SEGÚN INGRESOS BRUTOS O NETOS:
INDICE DE GINI DE EEUU SEGÚN SEXO:
INDICE DE GINI DE AMÉRICA LATINA: CONCLUSIÓN: aquí observamos que los países sudamericanos tienen un índice bastante elevado.
COMPARACIÓN DE PAÍSES SUDAMERICANOS CON OTRAS ZONAS: CONCLUSIÓN: y aquí que efectivamente es muy elevado incluso con respecto al resto de continentes. Además, Brasil sale siempre en los estudios como una de las zonas con más desigualdad del mundo.
COMPARACIÓN A NIVEL MUNDIAL DEL ÍNDICE DE GINI: Forma tabla: Obtenemos una información ordenada de cada país. Es menos efectivo que una gráfica como comparativo general pero muy exacto si queremos información de países en particular. La tabla está ordenada de menor a mayor índice de Gini. Posición País Gini Año 1 Dinamarca 24.7 1997 2 Japón 24.9 1993 3 Suecia 25 2000 4 Bélgica 1996 5 República checa 25.4 6 Noruega 25.8 7 Eslovaquia 8 Bosnia y Herzegovina 26.2 2001 9 Uzbekistán 26.8 10 Finlandia 26.9 11 Hungría 2002 12 Macedonia 28.2 1998 Posición País Gini Año 13 Albania 28.2 2002 14 Alemania 28.3 2000 15 Eslovenia 28.4 1998 16 Rwanda 28.9 1983 17 Croacia 29 2001 18 Ucrania 1999 19 Austria 30 1997 20 Etiopía 21 Rumania 30.3 22 Mongolia 23 Belarus 30.4 24 Países Bajos 30.9
Posición País Gini Año Posición País Gini Año 25 Rusia 31 2002 26 Corea del sur 31.6 1998 27 Bangladesh 31.8 2000 28 Lituania 31.9 29 Bulgaria 2001 30 Kazakhstan 32.3 2003 España 32.5 1990 32 La India 1999 33 Tajikistan 32.6 34 Francia 32.7 1995 35 Paquistán 36 Canadá 33.1 37 Suiza 1992 38 Sri Lanka 33.2 39 Burundi 33.3 40 Yemen 33.4 41 Latvia 33.6 42 Polonia 34.1 43 Indonesia 34.3 44 Egipto 34.4 45 Kyrgyzstan 34.8 46 Australia 35.2 1994 47 Argelia 35.3 48 Grecia 35.4 49 Israel 35.5 1997 Posición País Gini Año 50 Irlanda 35.9 1996 51 Reino Unido 36 1999 52 Italia 2000 53 Nueva Zelandia 36.2 1997 54 Jordania 36.4 55 Azerbaijan 36.5 2001 56 Nepal 36.7 1995 57 Georgia 36.9 58 Moldova 2002 59 Vietnam 37 60 Laos 61 Estonia 37.2 62 Armenia 37.9 1998 63 Jamaica 64 Tanzania 38.2 1993 65 Portugal 38.5 66 Mauritania 39 67 Marruecos 39.5 68 Mozambique 39.6 69 Túnez 39.8 70 Turquía 40 71 Trinidad y Tobago 40.3 1992 72 Guinea 1994 73 Camboya 40.4 74 Turkmenistan 40.8
Posición País Gini Año Posición País Gini Año 75 Ghana 40.8 1998 76 Senegal 41.3 1995 77 Singapur 42.5 78 Kenia 1997 79 Irán 43 80 Uganda 1999 81 Nicaragua 43.1 2001 82 Tailandia 43.2 2000 83 Hong Kong S.A.R. 43.4 1996 84 Ecuador 43.7 85 Uruguay 44.6 86 Camerún 87 Côte d' Ivoire 2002 88 Rep. Popular de China 44.7 89 Bolivia 90 Filipinas 46.1 91 Costa Rica 46.5 92 Estados Unidos 46.6 93 Guinea-Bissau 47 1993 94 República Dominicana 47.4 95 Madagascar 47.5 96 La Gambia 97 Burkina Faso 48.2 98 Venezuela 49.1 99 Malasia 49.2 Posición País Gini Año 100 Perú 49.8 2000 101 Malawi 50.3 1997 102 Malí 50.5 1994 103 Niger 1995 104 Nigeria 50.6 1996 105 Papua Nueva Guinea 50.9 106 La Argentina 52.2 2001 107 Zambia 52.6 1998 108 El Salvador 53.2 109 México 54.6 110 Honduras 55 1999 111 Panamá 56.4 112 Zimbabwe 56.8 113 Chile 57.1 114 Colombia 57.6 115 Paraguay 57.8 2002 116 Suráfrica 117 El Brasil 59.3 118 Guatemala 59.9 119 Swazilandia 60.9 120 Rep. Centroafricana 61.3 1993 121 Sierra Leona 62.9 1989 122 Botswana 63 123 Lesotho 63.2 124 Namibia 70.7
Forma gráfica: Con ayuda de un mapamundi y un código de colores podemos comparar de un solo golpe de vista todos los países. Muy rápido pero poco concreto debido a la necesidad de agrupar los coeficientes por intervalos.
B) EVOLUCION EN EL TIEMPO: Una de la ventajas más destacadas que hemos visto es que el índice de Gini puede indicar cómo cambia la distribución de una población durante el tiempo. Así que habrá veces que lo importante del estudio no sea la comparación entre poblaciones, sino su desarrollo durante un tiempo concreto. EVOLUCIÓN DEL INDICE DE GINI A PARTIR DE ALGÚN SUCESO TRASCENDENTAL: Se estudió con un diagrama de dispersión la evolución del índice de Gini de un grupo de países desde la 2ª Guerra Mundial hasta nuestros días.
AUMENTO/DISMINUCIÓN DESPROPORCIONADO/A DE LA DESIGUALDAD EN UNA POBLACIÓN: Forma tabla: El aumento en China resulta poco intuitivo pero los datos son muy exactos. CHINA 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 Coef. Gini 0.239 0.232 0.246 0.258 0.264 0.288 0.292 0.301 0.300 0.310 0.307 0.314 0.320 0.330 0.340 Forma gráfica: El aumento en la ciudad de Boston se aprecia considerablemente aunque la gráfica no nos ofrece datos muy exactos.
C) OTROS USOS: COMPARACIÓN IMPORTACIONES/EXPORTACIONES: Aunque los usos mayoritarios son los dos anteriores, a veces podemos observar estudios según coeficientes de Gini sobre aspectos bastante diversos. Veamos algunos ejemplos. COMPARACIÓN IMPORTACIONES/EXPORTACIONES:
COMPARACIÓN DE ÁREAS URBANA/RURAL DE UNA MISMA POBLACIÓN: Forma tabla: Año Total COLOMBIA (Urbano) COLOMBIA (Rural) 1978 0,52 0,51 0,49 1988 0,55 0,50 0,57 1991 0,53 1992 1993 1994 0,48 1995 0,44 Fuente: Ocampo, José Antonio, María José Pérez, Lasso, Camilo Tovar y Francisco Lasso . Macroeconomía, ajuste estructural y equidad en Colombia, 1978-1996, DNP. Documento 79. Marzo de 1998. Tabla: Colombia. Coeficiente GINI 1978-1996. Forma gráfica:
DISPERSIÓN DE LA ESPERANZA DE VIDA EN ESPAÑA POR COMUNIDADES: Forma tabla: En ambos géneros puede observarse una relación negativa: al aumentar la esperanza de vida disminuye el coeficiente de Gini. Comunidad Autónoma Índice de Gini Varones Mujeres Andalucía 0.1181 0.0843 Aragón 0.1142 0.0828 Asturias 0.1259 0.0834 Baleares 0.1239 0.0865 Canarias 0.1198 0.0887 Cantabria 0.1202 0.0837 Castilla-León Castilla-La Mancha 0.1108 0.0818 Cataluña 0.1246 0.0825 Extremadura 0.1151 0.0851 Comunidad Autónoma Índice de Gini Varones Mujeres Galicia 0.1266 0.0882 Madrid 0.1192 0.0821 Murcia 0.1151 0.0844 Navarra 0.1136 0.0829 País Vasco 0.1219 0.0847 La Rioja 0.1343 0.0866 Valencia 0.1170 0.0822 Ceuta y Melilla 0.1379 0.1063 España 0.1191 0.0839
Forma gráfica: Los datos de Ceuta y Melilla no están incluidos en la forma gráfica porque están muy alejados de la nube de puntos y tienen excesiva influencia sobre la regresión. VARONES: MUJERES: An: Andalucía Ar: Aragón As: Asturias Ba: Baleares Ca: Canarias Cn: Cantabria Cl: Castilla y León Cm: Castilla-La Mancha Ct: Cataluña Es: España Ex: Extremadura Ga: Galicia Ma: Madrid Mu: Murcia Na: Navarra Pv: País Vasco Ri: La Rioja Va: Valencia CONCLUSIÓN: aparte de la evidente diferencia por sexos, en la que las mujeres sobreviven a los hombres en todas la comunidades, podemos concluir que con mucha diferencia, los habitantes de Ceuta y Melilla son los españoles con menor esperanza de vida, así como los varones riojanos, que salen bastante mal parados.
USO DE INTERNET POR COMUNIDADES AUTÓNOMAS: Comunidad Autónoma Coef.Gini (Host por dominio) ANDALUCÍA 0,83033608 ARAGÓN 0,871786784 ASTURIAS 0,933675902 BALEARES CANARIAS 0,760293347 CANTABRIA 0,771487542 CASTILLA- LEÓN 0,873348627 CASTILLA-LA MANCHA 0,947946352 CATALUÑA 0,788169232 Comunidad Autónoma Coef.Gini (Host por dominio) COM. VALENCIANA 0,819332548 EUSKADI 0,838797652 EXTREMADURA 0,932137931 GALICIA 0,736879881 MADRID 0,672657463 MURCIA 0,96707733 NAVARRA 0,965217391 RIOJA CONCLUSIÓN: Se obtienen valores muy altos debido a la gran concentración de usuarios de internet en instituciones y empresas. Sólo las comunidades empresarialmente más desarrolladas toman valores más pequeños al repartirse entre tanta variedad de empresas, como es el caso de Cataluña y sobretodo, Madrid.
fin