Índice E e Índice de Theil MEDIDAS DE CONCENTRACIÓN ECONÓMICA: Índice E e Índice de Theil Beatriz Larraz Iribas Prof. Estadística Universidad de Castilla-La Mancha Valencia, 28 de noviembre de 2006
Concepto de concentración económica Curva de Lorenz Índices de Concentración Medidas de Concentración Índice geométrico Índice de Gini Índice E Descomposición del índice de Theil intergrupos e intragrupos Índice de Theil
Concepto de Concentración Económica En la distribución de salarios de una empresa se puede estudiar si la masa salarial (o nómina de la empresa) se encuentra concentrada en unos pocos trabajadores o si, por el contrario, está bien repartida entre ellos. 9.000€ 10 empleados el director 8.100 € 90 € 8.100 € Estos sueldos estarían muy desproporcionados, muy concentrados en una sola persona
Concepto de Concentración Económica Más ejemplos… Reparto de horas extraordinarias entre la plantilla de una empresa Reparto del total invertido en fondos de inversión entre las distintas gestoras de patrimonio Grado de concentración de las ausencias laborales En el ámbito financiero: concentración del volumen de negociación diario entre los distintos valores que conforman el IBEX-35, El nivel de desigualdad en el reparto de la masa global de pensiones entre los pensionistas de un país, etc. Cómo se reparte el capital social de un banco entre los accionistas, etc. Masa Total de la Variable (MTV)
Medidas de Concentración Miden el grado de igualdad en el reparto del total de los valores de la variable. Indican el grado de equidistribución de la variable = grado de CONCENTRACIÓN. Los casos extremos serían: Concentración mínima o equidistribución: Cuando todos los trabajadores reciben la misma cantidad: Concentración máxima: Cuando de los n trabajadores sólo uno percibe el total de las rentas (de los salarios) y los demás nada:
mediante los denominados Medidas de Concentración El estudio de la concentración en la distribución de la MTV se puede abordar desde dos puntos de vista: Gráficamente Analíticamente mediante la curva de concentración, más conocida como Curva de Lorenz mediante los denominados Índices de concentración
Ordenación de los valores Curva de Lorenz Salarios Anuales (xi) Nº trabajadores (ni) 7.512,65 2 8.414,17 3 15.025,30 1 24.040,48 39.065,79 Ordenación de los valores de la variable de menor a mayor MTV = (7.512,65 · 2) + (8.414,17 · 3) + (15.025,30 · 1) + + (24.040,48 · 2) + (39.065,79 · 2) = 181.505,66 €/año.
Curva de Lorenz xi ni xini Ui pi qi 7.512,65 2 15.025,30 20 8,28 Porcentaje de trabajadores con un salario igual o inferior al i-ésimo Masa parcial acumulada xi ni xini Ui pi qi 7.512,65 2 15.025,30 20 8,28 8.414,17 3 25.242,51 40.267,81 50 22,18 1 55.293,11 60 30,46 24.040,48 48.080,96 103.374,08 80 56,95 39.065,79 78.131,58 181.505,65 100 10 Porcentaje de la masa salarial que se llevan los trabajadores con un salario igual o inferior al i-ésimo
Curva de Lorenz A continuación en unos ejes de coordenadas, se marca en el de abcisas los siguientes valores de pi en porcentajes: que indican los porcentajes de trabajadores con un nivel de salario igual o inferior al i-ésimo. Por ejemplo, si i = 3 tenemos que p3 es el 60%, lo que significa que el 60% de los trabajadores obtienen un salario anual igual o inferior al tercero en orden ascendente.
Curva de Lorenz Sobre el eje de ordenadas se anotan los valores de qi, también porcentajes: que indican la parte que del total de la masa salarial les corresponde alos trabajadores cuyo salario es igual o inferior al i-ésimo. Por ejemplo para i = 4 se tiene que q4 es el 56,95%, es decir, de los 181.505,66 €, el 56,95% corresponde a los trabajadores con salario igual o inferior al cuarto en orden ascendente.
Curva de Lorenz
Curva de Lorenz Características generales: Es siempre creciente (porque p y q son acumulados) Se sitúa siempre por debajo de la diagonal, ya que, al estar ordenados los salarios de menor a mayor, ningún qi. podrá ser mayor que su correspondiente pi En caso de equidistribución pi = qi ., la curva de concentración sería la diagonal, recta que se denomina recta de equidistribución. En caso de máxima concentración , la curva de concentración, denominada curva de máxima concentración, vendría dada por ABD donde p1 = (N-1/N) %; q1 = 0% p2 = 100%; q2 = 100%
Curva de Lorenz Área Conc Área Máx Conc
Índices de Concentración Cuanto mayor sea el área de concentración respecto del área máxima concentración, mayor será la desigualdad en el reparto de la masa total de la variable. Por consiguiente, de manera natural, las medidas de concentración se obtendrán por cociente entre estas dos áreas. Índice Geométrico Índice de Gini Índice E Índice de Theil relativo
Índice de Gini Es la medida de concentración más utilizada, propuesta por el que fue Decano de la Facultad de Ciencias Estadísticas, Demográficas y Actuariales de la Universidad de Roma, Corrado Gini. Gini, Corrado (1912). "Variabilità e mutabilità" Reimpreso en Memorie di metodologica statistica (Ed. Pizetti E, Salvemini, T). Rome: Libreria Eredi Virgilio Veschi (1955). Gini, Corrado (1921). "Measurement of Inequality and Incomes". The Economic Journal 31: 124-126. Su fundamento es el siguiente: Gini parte de una distribución de frecuencias unitarias de n elementos en cuya curva de concentración pueden establecerse n-1 diferencias entre pi y qi (recuérdese que pn = qn ).
Índice de Gini Índice de Gini GRÁFICO 2 p 2 -q 1 3 i-1 i n-1 n-2 …. 100 q ...
¿ ? Índice de Gini Equidistribución Máxima Concentración xi ni xini Ui pi qi 99 99% 0% 1.000 1 100% xi ni xini Ui pi qi 1 1% 0% 1.000 99 99.000 100% ¿ ?
Índice de Gini de la Concentración de la renta Fuente: Human Development Report, 2006 (ONU)
Para evitar el problema de que el índice de Gini sólo sirve para frecuencias unitarias, Índice E Montero Lorenzo, J.Mª, 2003 “Sobre Concentración Económica: Índice E para colectivos discretos” Revista Estadística Española, vol 45, nº152, pp.22 a 54 Índice Gini
Índice E Índice Gini
TABLA DE CONSTRUCCIÓN DEL ÍNDICE E xi n qi Mi x1 1 (x1/mtv)100 M1= ( )100 [1+2+...+n1] (2x1/mtv)100 . (n1x1/mtv)100 x2 (n1x1+x2/mtv)100 M2= n2 ( )100+ ( )100 [1+2+...+n2] (n1x1+2x2/mtv)100 (n1x1+n2x2/mtv)100 x3 (n1x1+n2x2+x3 /mtv)100 M3= n3( )100+( )100[1+2+...+n3] (n1x1+n2x2+2x3 /mtv)100 (n1x1+n2x2+n3x3 /mtv)100 (n1x1+..+ni-1xi-1 +xi /mtv)100 Mi= ni ( )100 +( )100 [1+2+...+ni] (n1x1+..+ni-1xi-1+2xi /mtv)100 (n1x1+..+ni-1xi-1 + nixi /mtv)100 xn (n1x1+..+nn-1xn-1+xn/mtv)100 Mn= nn ( )100 + ( )100 [1+2+...+nn] (n1x1+..+nn-1xn-1+2xn/mtv)100 (n1x1+..+nn-1xn-1+(nk-1)xn/mtv)100 (n1x1+..+nnxn/mtv)100 = 100
Índice E
Índice E donde: - qi-1 el porcentaje de la masa salarial acumulado por los trabajadores que perciben salarios inferiores al i-ésimo. - propi el porcentaje de la masa salarial que percibe un individuo con salario i. - es la suma de los ni primeros números naturales.
Índice E
Índice E Ventas (miles €) Nº empleados 50-100 30 100-200 25 200-500 40 Ejemplo: Ventas (miles €) Nº empleados 50-100 30 100-200 25 200-500 40 500-1.000 50 1.000-2.000 2.000-5.000 Calcule el índice E y compruebe que si las frecuencias no son unitarias no coincide con el índice de Gini (mal aplicado)
Índice E xi ni xini Ni Ui pi qi 75 30 2250 15 1’125 150 25 3750 55 6000 27’5 3 350 40 14000 95 20000 47’5 10 750 50 37500 145 57500 72’5 28’75 1500 170 95000 85 3500 105000 200 200000 100
Índice E xi ni xini Ni Ui pi qi Mi suma prop i 75 30 2250 15 1,125 465 0,0375 17,4375 150 25 3750 55 6000 27,5 3 325 0,075 52,5000 350 40 14000 95 20000 47,5 10 820 0,175 263,5000 750 50 37500 145 57500 72,5 28,75 1275 0,375 978,1250 1500 170 95000 85 0,75 962,5000 3500 105000 200 200000 100 1,75 2238,7500 total 4512,8125
Índice de Theil Coeficiente de Theil El mensaje contiene mayor cantidad de información cuanto menor sea la probabilidad de ocurrencia del suceso Coeficiente de Theil Consideremos N trabajadores cuyos salarios son: x1, x2, .. ,xN La proporción de masa total de la variable(MTV) que corresponde al individuo i-ésimo será: Es un indicador del grado de desigualdad (desorden) en el reparto de la masa total de la variable Experimento con 1.000 posibles resultados: -todos con la misma probabilidad de ocurrir desorden -si 2 de ellos acaparan una probabilidad del 90% orden, mando Entropía
El valor de equidistribución es superior al de máxima concentración. Índice de Theil Entropía Si todos ganan lo mismo: Máx concentración: no negativa En caso de equidistribución vale Ln(N). Inconveniente: El valor de equidistribución es superior al de máxima concentración. En caso de máxima concentración vale 0.
El valor máximo depende del nº total de observaciones Índice de Theil Coeficiente de Theil o redundancia: En caso de equidistribución vale 0. En caso de máxima concentración vale Ln(N). Inconveniente: El valor máximo depende del nº total de observaciones Índice de Theil relativo o redundancia relativa:
Inconveniente: El valor máximo depende del nº total de observaciones Índice de Theil Coeficiente de Theil o redundancia: máxT = Ln(N) Inconveniente: El valor máximo depende del nº total de observaciones xi ni xini propi Ln(1/propi) 1 2 xi ni xini propi Ln(1/propi) 1.999.999 1 2.000.000 Índice Theil= Ln(2) Índice Theil= Ln(2.000.000) xi ni 1.000.000 1 T = Ln(2)
No requiere la ordenación Índice de Theil No requiere la ordenación de los valores de la variable de menor a mayor Ejemplo: Dada la siguiente distribución de salarios semanales (€), determine el coeficiente de Theil xi ni 80 10 150 20 200 15 240 5 xini propi 800 0,01 3000 0,019 0,025 1200 0,03 8000 log(1/propi) nipropilog(1/propi) 4,605 0,4605 3,963 1,5059 3,688 1,3830 3,506 0,5259 3,8753
1º Descomposición de la Entropía intergrupos e intragrupos Descomposición del índice de Theil intergrupos (entre grupos) e intragrupos (dentro de cada grupo) 1º Descomposición de la Entropía intergrupos e intragrupos
Entropía de los elementos del grupo g respecto del total de elementos de dicho grupo
Suma de las entropías intragrupos ponderadas por sus proporciones Entropía intergrupos Suma de las entropías intragrupos ponderadas por sus proporciones
2º Descomposición del Índice de Theil intergrupos e intragrupos
2º Descomposición del Índice de Theil intergrupos e intragrupos Expresión relacionada con la Entropía intergrupos Suma de los índices de Theil intragrupos ponderados por sus proporciones
2º Descomposición del Índice de Theil intergrupos e intragrupos Expresión relacionada con la Entropía intergrupos No es exactamente el índice de Theil intergrupos Sólo coincidirían en el caso de que todos los grupos tuvieran el mismo número de elementos
Índice de Theil entre las G comunidades autónomas Supóngase que se dispone del número total de contratos temporales en G comunidades autónomas El índice de Theil de la distribución de contratos temporales entre las G comunidades autónomas sería Supóngase ahora que se conoce la misma información sobre contratos temporales pero desagregada a escala provincial (N provincias) El índice de Theil de la distribución de contratos temporales entre las N provincias sería Índice de Theil entre las G comunidades autónomas Concentración intragrupos global Residuo
Ejemplo: En la siguiente tabla se muestran los datos relativos al número de contratos registrados en las oficinas del INEM en el mes de marzo de 2006 en las tres comunidades autónomas con mayor volumend e contratación en dicho mes. Determine el coeficiente de Theil y realice su descomposición intragrupos e intergrupos Nºcontratos Andalucía 370.153 Cataluña 246.860 Almería 26.283 Barcelona 189.126 Granada 37.729 Tarragona 24.559 Málaga 63.673 Lleida 12.001 Cádiz 46.611 Girona 21.174 Huelva 39.194 Com. Valenciana 154.962 Sevilla 87.897 Valencia 86.063 Córdoba 41.987 Castellón 18.123 Jaén 26.779 Alicante 50776
Solución Por provincias xi ni xi ni propi ln propi ni propi ln propi Almería 26.283 1 0,03404644 -3,38002982 -0,11507798 Granada 37.729 0,04887334 -3,01852314 -0,14752532 Málaga 63.673 0,08248065 -249519156 -0,20580502 Cádiz 46.611 0,0603789 -2,8071156 -0,16949055 Huelva 39.194 0,05077107 -2,98042849 -0,15131956 Sevilla 87.897 0,1138599 -2,17278649 -0,24739326 Córdoba 41.987 0,05438907 -2,91159212 -0,15835878 Jaén 26.779 0,03468895 -3,36133417 -0,11660114 Barcelona 189.126 0,2449898 -1,40653871 -0,34458763 Tarragona 24.559 0,03181321 -3,44787378 -0,10968792 Lleida 12.001 0,01554584 -4,16396219 -0,06473229 Girona 21.174 0,02742835 -3,59617815 -0,09863723 Valencia 86.063 0,11148418 -2,19387258 -0,24458209 Castellón 18.123 0,02347615 -3,75177032 -0,08807712 Alicante 50.776 0,06577415 -2,72152836 -0,17900622 15 771.975 -2,44088211 Por provincias
Por Comunidades Autónomas xi ni xi ni propi ln propi ni propi ln propi Andalucía 370.153 1 0,47948833 -0,73503573 -0,35244105 Cataluña 246.860 0,31977719 -1,14013079 -0,36458783 Comun. Valenciana 154.962 0,20073448 -1,60577224 -0,32233386 3 771.975 -1,03936273
Coeficientes Intragrupos Andalucía ni xi ni propi ln propi ni propi ln propi Almería 26.283 1 0,07100577 -2,64499409 -0,18780985 Granada 37.729 0,10192812 -2,2834874 -0,23275158 Málaga 63.673 0,17201806 -1,76015582 -0,30277859 Cádiz 46.611 0,1259236 -2,07207987 -0,26092377 Huelva 39.194 0,10588594 -2,24539276 -0,23775553 Sevilla 87.897 0,23746127 -1,43775076 -0,34141012 Córdoba 41.987 0,11343147 -2,17655639 -0,24689 Jaén 26.779 0,07234576 -2,62629844 -0,19000156 370.153 -2,00032099
Coeficientes Intragrupos Cataluña xi ni xini propi ln propi ni*propi*ln propi Barcelona 189.126 1 0,76612655 -0,26640791 -0,20410218 Tarragona 24.559 0,09948554 -2,30774299 -0,22958705 Lleida 12.001 0,0486146 -3,02383139 -0,14700235 Girona 21.174 0,08577331 -2,45604736 -0,21066332 246.860 -0,7913549
Coeficientes Intragrupos Comun. Valenciana xi ni xini propi ln propi ni*propi*ln propi Valencia 86.063 1 0,55538132 -0,58810034 -0,32661994 Castellón 18.123 0,11695125 -2,14599808 -0,25097716 Alicante 50.776 0,32766743 -1,11575612 -0,36559694 154.962 -0,943194045
propg Tg propg*Tg 0.47948833 0.0791 0.037937383 0.31977719 0.5949 0.190248072 0.20073448 0.1554 0.0311978 0.25938326
Descomposición del índice de Theil 0,267168 Porcentaje respecto del total Intergrupos 0,007785 2,91% Intragrupos 0,259383 97,08% 0,079120 0,594939 0,155418
INCOME DISTRIBUTIONS OF WHITE FAMILIES AND NONWHITE FAMILIES Ejemplo: INCOME DISTRIBUTIONS OF WHITE FAMILIES AND NONWHITE FAMILIES IN THE UNITED STATES, 1963 income interval ($) white(%) nonwhite(%) midpoint of the interval <1000 3.2 9.2 500 1000-1500 2.6 8.3 1250 1500-2000 8 1750 2000-2500 3.6 9.6 2250 2500-3000 3.3 2750 3000-3500 4.3 7.4 3250 3500-4000 3.9 6.1 3750 4000-5000 8.8 10.9 4500 5000-6000 11.3 8.7 5500 6000-7000 10.5 7.3 6500 7000-8000 4.7 7500 8000-9000 8.2 4.4 8500 9000-10000 6 1.7 9500 10000-12000 8.9 2.5 11000 12000-15000 6.7 1.6 13500 15000-25000 4.8 1.4 20000 >25000 1.1 0.2 37500 total number of families 42663000 4773000
Descomposición del índice de Theil 0,233110 Porcentaje respecto del total Intergrupos 0,009907 4,25% Intragrupos 0,223203 95,75% 0,219345 0,282506 Lo que permite concluir que prácticamente la totalidad de la desigualdad existente en la distribución de las rentas de las familias de Estados Unidos en el año 1963 procede de la desigualdad entre las familias, sea cual sea su raza
Índice E e Índice de Theil MEDIDAS DE CONCENTRACIÓN ECONÓMICA: Índice E e Índice de Theil Beatriz Larraz Iribas Prof. Estadística Universidad de Castilla-La Mancha Valencia, 28 de noviembre de 2006