La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Indicadores y Técnicas Cuantitativas de Análisis Económico Diploma en Economía para no Economistas 2009 Docentes: Zuleika Ferre Gabriela Fachola Giorgina.

Presentaciones similares


Presentación del tema: "Indicadores y Técnicas Cuantitativas de Análisis Económico Diploma en Economía para no Economistas 2009 Docentes: Zuleika Ferre Gabriela Fachola Giorgina."— Transcripción de la presentación:

1 Indicadores y Técnicas Cuantitativas de Análisis Económico Diploma en Economía para no Economistas 2009 Docentes: Zuleika Ferre Gabriela Fachola Giorgina Piani

2 Presentación Análisis exploratorio de los datos
1. Estadística Descriptiva Distintos formas de generación de la información 2. Técnicas de recolección de datos Construcción de indicadores que muestren aspectos relevantes de la información 3. Indicadores económicos Entender la combinación de estos indicadores en marcos conceptuales diversos. 4. Análisis de datos y modelos estadísticos Derivar las conclusiones obtenidas a un conjunto de datos más amplio Curso Estadística: Inferencia estadística y teoría de la probabilidad

3 A modo de introducción …

4 ¿Qué entendemos por Estadística?
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, de manera tal que sea posible, a partir de ellos, realizar inferencias válidas sobre los fenómenos bajo análisis Esto permite: Entender su comportamiento Asociar riesgos a las decisiones que se toman bajo condiciones de incertidumbre Realizar predicciones.

5 La estadística une dos campos de estudio:
El estudio sistemático de datos numéricos, comprendiendo el resumen y el análisis de la información contenida en ellos La teoría del azar y de la incertidumbre: la teoría de la probabilidad Pag. 1 CC

6 Descriptiva vs Inferencial
Objetivo: Describe los datos que se tienen porque importan en sí mismos La descripción de los datos que se tiene importa como indicador del comportamiento de un conjunto más amplio Caracterización del conjunto de datos: Sobre un conjunto cualquiera, representativo o no de algo más amplio Solo para conjuntos representativos de un universo específico Alcance de las conclusiones: Acotada para ese conjunto de datos Concluye para el universo a partir de las observaciones que se tienen

7 Población y muestra Población o universo: conjunto total objetos.
Ej: Estudiantes de la universidad, hogares de una ciudad, empresas productoras de ciertos bienes y servicios. Muestra: Subconjunto representativo de la población. Un estadístico utiliza las observaciones de la muestra (datos) para hacer inferencia acerca de la población.

8 La estadística y la economía
La Estadística interviene en la generación de datos económicos La Estadística es el fundamento del análisis econométrico. Econometría: es el estudio sistemático de fenómenos económicos mediante el uso de datos observados y, en general, en un marco de interpretación dado por la Teoría Económica

9 Tema 1 Análisis exploratorio de los datos Estadística descriptiva

10 Estadística descriptiva
Principal tarea: describir un conjunto de datos usando ciertos instrumentos. Su utilidad refiere a: La organización de datos de manera informativa, para que “hablen por sí mismos” La detección de errores o comportamientos excepcionales La simplificación del análisis de datos usando ciertas medidas de resumen que destacan sus características relevantes La posibilidad de brindar alguna evidencia que ayude a corroborar/rectificar los supuestos que se harán en caso de pretender hacer uso de la EI a partir de ese conjunto de datos

11 ¿Qué observamos en los datos?
Con qué frecuencia se observan los diferentes valores obtenidos (definibles como un valor puntual o un conjunto de valores dentro de cierto intervalo) La evolución del fenómeno de estudio en el tiempo o entre individuos. Se puede observar la forma del gráfico que resulta de considerar cada dato como un punto. Dónde se concentran los valores observados, ¿cuál es el valor que en promedio se observa, cuál es el valor más frecuentemente observado y cuál es el valor que separa en dos todo el rango de valores observados? A estos indicadores se les conoce como medidas de tendencia central. Y, por último: Qué tan dispersos están los datos respecto al valor promedio? Se observan más/menos valores menores/mayores al promedio y con qué concentración? Estas son medidas dispersión (desvío estándar, simetría y kurtosis).

12 Conceptos básicos

13 Variable: función que asocia ciertas características de un fenómeno a un número real o a un subconjunto de los reales Dato estadístico: es el valor observado que tomó una variable Unidad de observación: es el sujeto a partir del cual se recoge el dato estadístico

14 En función del tipo de dominio, las variables se pueden clasificar en:
El recorrido/rango/dominio de las variables es el conjunto de valores posibles que toma la variable Notación: Cuando hablemos de variable haremos referencia a un símbolo (X, Y, A, B,...p, q, i) En función del tipo de dominio, las variables se pueden clasificar en:

15 Clasificación de variables
1. Variables cualitativas o nominales: sólo admiten ser clasificadas en grupos homogéneos y numerables, a los que no se puede asignar un orden de prelación, de acuerdo a ningún criterio Ejemplos: religión, raza, sexo, deporte practicado, ocupación, jefe de hogar, etc. 2. Variables ordinales: son las que, aún siendo nominales, son factibles de ordenar Ejemplos: nivel educativo, nivel socioeconómico Típicamente, las variables discretas resultan de un conteo.

16 Clasificación de variables
3. Variables cuantitativas: tienen como recorrido cantidades numéricas, por lo que podemos operar aritméticamente con ellas. Dos categorías: Discretas - Pueden asumir un número finito de valores. Su dominio o rango de variación son los números naturales. Ejemplos número de habitaciones en un hogar, número de hijos de una familia, etc. Continuas - Pueden asumir cualquier valor dentro de un intervalo acotado o no acotado, es decir, su dominio es infinito. Ejemplos: tasa de empleo, tasa de inflación, ingresos, etc. Observación: Hay variables que siendo continuas no son observables más que como discretas: años de educación

17 Descripción de Variables

18 Un primer paso…. Observar la frecuencia con que se observan los datos individuales o rangos de valores de esos datos A través de una tabla (frecuencia simple, frecuencia relativa La información también puede presentarse en términos de frecuencias acumuladas de los distintos valores A través de gráficos: Valores de la variable en las abcisas y el número de veces que se repite ese valor en las ordenadas

19 Datos agrupados Cuando los datos cubren un amplio rango de valores conviene reducir su número Agrupando en una cantidad inferior de rangos o clases Estas clases deben ser construidas de modo que sean exhaustivas y no redundantes, es decir, cada modalidad debe pertenecer a una y sólo una de las clases.

20 Ejemplo: Ingresos de los hogares
Tramos de ingresos [Li, Ui) Frecuencia fi Relativa F Acumulada Facum 109 2,4 290 6,4 8,9 519 11,5 20,4 570 12,7 33,0 605 13,4 46,5 863 19,2 65,6 545 12,1 77,7 520 89,3 242 5,4 94,6 133 3,0 97,6 54 1,2 98,8 24 0,5 99,3 31 0,7 100,0 Total (n) 4505

21 2. Análisis gráfico

22 Principales diagramas según el tipo de variable.
Cualitativa Barras, sectores, pictogramas Discreta Diferencial (barras) Integral (en escalera) Continua Diferencial (histograma, polígono de frecuencias) Integral (diagramas acumulados) Para las variables cuantitativas, los diagramas se dividen según se utilicen las frecuencias (absolutas o relativas) o las frecuencias acumuladas: Diagramas diferenciales: Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada. Diagramas integrales: Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.

23 Variable continua Histograma de ingresos del hogar

24 Diagrama de barras para una variable cualitativa
Diagrama de tortas para una variable cualitativa Fuente: INE

25 Pirámides población Uruguay
Pictogramas

26 Histograma de frecuencias para una variable discreta. Número de hijos

27 Diagrama para una variable continua Tasa de desempleo por departamento Año 2002

28 La evolución temporal de una variable…
Tasa de desempleo – Total país

29

30

31 3. Medidas de posición o tendencia central

32 Este único número puede ser considerado como típico de todos los datos
El objetivo es encontrar un valor único que sea de alguna forma representativo del resto Este único número puede ser considerado como típico de todos los datos ¿Alcanza con mirar mínimo-máximo? Importancia de los casos atípicos

33 Media (aritmética) Como podemos ver, se trata de una suma ponderada, en la que todas las observaciones contribuyen a la suma y todas tienen el mismo ponderador 1/N.

34 Media para datos agrupados
No sirve la fórmula anterior, a menos que se elija algún valor que “represente” a todo el intervalo Suele tomarse el punto medio: mi = (Li + Ui )/2 (Li límite inferior de la clase y Ui es el límite superior) Por tanto la media para datos agrupados es:

35 La Mediana Mediana = si N es impar si N es par
Es el valor que separa en dos todo el rango observado de valores. Es decir, aquel valor para el cual el 50% de los datos resulta en valores menores o iguales a la mediana y el 50% restante es mayor o igual que la mediana. Si el número de datos es impar, la mediana es la observación central. Si se tiene un número de observaciones par, la mediana es el promedio de las dos observaciones centrales.

36 Mediana para datos agrupados
Donde: Li = Limite inferior o frontera inferior del intervalo en el que se encuentra la mediana: intervalo mediano n = Número de observaciones o frecuencia total facum(i-1)= frecuencia acumulada anterior al intervalo mediano fmediana= Frecuencia simple del intervalo mediano A = Amplitud del intervalo en el que se encuentra la mediana

37 Media y Mediana La media y la mediana difieren en la forma en que sus valores son afectados por observaciones ubicadas relativamente lejos de la media (atípicos). Unos pocos valores extremos tienen un alto impacto provocando que la media se desplace del centro de la distribución. Ejemplo

38 Ejemplo Li - Ui fi A mi fi mi facum 0 - 10 60 10 5 300 10 - 20 80 15
1.200 140 30 25 750 170 20 70 65 1.300 190 400 3.000 200 n = 200 6.550 La media aritmética es: La mediana es:

39 Histograma Para ver la representatividad de ambos promedios, realizamos el histograma de la siguiente figura y observamos que dada la forma de la distribución, la mediana es más representativa que la media.

40 Media y Mediana Con lo cual encontramos en esos casos que la media no es muy representativa de los valores de la distribución. El valor extremo “infla” el promedio

41 El modo o moda Valor más frecuente en el caso de datos sin agrupar, y la clase con la frecuencia más alta (intervalo o clase modal) en el caso de datos agrupados Hablar de ventajas de las diferentes medidas

42 Cuartiles, deciles, percentiles
Hay otras medidas de posición (no de tendencia central) análogas a la mediana. Cuartiles: Son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1 = x(N+1)/4 - Q2 = mediana Q3 = x3(N+1)/4 Deciles: Divide a la distribución en 10 Percentiles: Dividen a la distribución en 100 porciones de tamaño igual.

43 Indicadores de actividad y precio del sector inmobiliario

44

45 4. Medidas de dispersión o variabilidad

46 Nuestro objetivo es medir la variabilidad de un conjunto de datos
Nuestro objetivo es medir la variabilidad de un conjunto de datos. Es posible hacerlo a través de distintas medidas: Varianza Desviación típica Rango Recorrido intercuartil

47 Varianza Una serie de medidas de dispersión se basa en las distancias de cada observación respecto a la media Interesa la distancia en términos absolutos, independientemente de si la observación es superior o inferior a la media. El promedio del cuadrado de esas desviaciones respecto a la media es la varianza s2:

48 Desviación standard Al tomar la raíz cuadrada de la varianza obtenemos la desviación estándar, s. Tiene las mismas unidades de medida que la media y que las observaciones

49 La desviación estándar para datos agrupados es análoga a la de la media:

50 Rango y recorrido intercuartil
El rango, que se define como: Rango = xN − x1 El recorrido intercuartil queda definido como el intervalo entre el tercer y el primer cuartil: RI = Q3 − Q1 y corresponde al rango en que están contenidas el 50% de las observaciones centrales

51 Coeficiente de variación
Es una medida relativa de la dispersión Útil para comparar dispersiones a escalas distintas Es útil cuando queremos comparar la variación entre muestras o entre poblaciones. Ejemplo: Población 1: s=10 Media=20 CV=0,50 Población 2: s=20 Media=200 CV=0,10

52 Asimetría Relación entre el "cuerpo" de la distribución (o aquella zona cercana a la media) y las "colas", o valores alejados de la media, donde en general tenemos un número menor de observaciones. Simetría Distribución unimodal Asimetría a la derecha Asimetría a la izquierda

53 Distribución bimodal Distribución simétrica Asimetría a la derecha Asimetría a la izquierda

54 Coeficiente de asimetría
Coef. de asimetría = Si las desviaciones negativas pesan más que las positivas, el coeficiente de asimetría tendrá signo negativo (distribución asimétrica a la izquierda), mientras que valores positivos implican asimetría a la derecha (una distribución simétrica tiene un coeficiente de 0).

55 Kurtosis o apuntamiento
La kurtosis describe la relación que existe entre el cuerpo de una distribución y las colas. La expresión para el coeficiente de kurtosis es la siguiente:

56 Valores reducidos implican que las colas de la distribución pesan poco con respecto al cuerpo (leptokurtica) Valores altos implican una forma más "achatada": las colas tienen un peso importante con respecto al cuerpo de la distribución (platikúrtica)

57 Los cinco números resúmen
Una manera conveniente de describir el centro y la dispersión de un conjunto de datos consiste en la observación mínima, el primer cuartil, la mediana, el tercer cuartil y la observación máxima: Mínimo Q1 Me Q2 Máximo

58 Diagramas de caja Distribución del ingreso por sexo

59 Relaciones entre dos variables

60 Variables cuantitativas
Nos preguntamos si dos variables, X e Y, están relacionados de alguna forma

61 Diagrama de dispersión
Muestra la relación entre dos variables cuantitativas medidas para los mismos individuos. En los datos cada individuo aparece como un punto del diagrama cuya posición depende de los valores que toman las dos variables parta cada individuo.

62 Covarianza Medida de asociación que se calcula como el promedio de los productos de las desviaciones. Puede ser positiva o negativa y no está acotada. Depende de las unidades de medida de X e Y

63 Coeficiente de correlación
Esta comprendido entre -1 y 1 Si r es cero o cercano a cero entonces nula o baja correlación Valores cercanos a 1 y -1 implican alta correlación, positiva y negativa respectivamente.

64 Precauciones Variables latentes Correlaciones espurias

65 Ejercicio

66 Variables cualitativas
Podemos contar el número de casos que caen en cada categoría y podemos comparar un grupo con otro. Para ello elaboramos Tablas de contingencia: Son tablas de doble entrada en las que cada entrada representa un criterio de clasificación (esto es una variable categórica) Como resultado de esta clasificación, las frecuencias (el número o % de casos) aparecen organizadas en casillas que contienen información sobre la relación existente entre ambos criterios.

67 Ejemplo tabla bidimensional

68 Distribución conjunta
Distribución univariada – marginal (frecuencia de la variable) Para comparar entre grupos debemos normalizar los grupos en cuanto al tamaño (ya que 6 es relativo a 20, así como 11 es relativo a 30) Para ello llevamos los valores a % Proporción de hombres que consumen droga= 6/20 = 0,30 Porcentaje = 0,30 *100 = 30%

69 ¿Qué porcentaje de hombres consume droga en comparación a las mujeres?
30% de los hombres consumen drogas, mientras que 37% de las mujeres lo hace. Precaución: muchas veces el utilizar % puede darnos una idea de la magnitud del fenómeno mucho mayor de lo que es en realidad, especialmente en el caso de pocos datos. Lo recomendable es usarlos pero señalando el número de casos al interior de cada celda.

70 Todo cuadro debe tener:
Titulo general que describirá el contenido del cuadro Nombre de cada columna Los datos Fuente de donde se obtuvo la información Comentarios - nota de pie y encabezado (si amerita) Puede ser ilustrado con un gráfico

71 Ejemplo: Distribución de la población por consumo de droga según sexo
Fuente: Elaboración propia en base a datos de la Encuesta sobre consumo de drogas Año XX


Descargar ppt "Indicadores y Técnicas Cuantitativas de Análisis Económico Diploma en Economía para no Economistas 2009 Docentes: Zuleika Ferre Gabriela Fachola Giorgina."

Presentaciones similares


Anuncios Google