La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.

Presentaciones similares


Presentación del tema: "ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO."— Transcripción de la presentación:

1 ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO

2 Medidas de tendencia central Refiere a los valores de las variables que suelen estar en el centro de la distribución. Posición donde se centra una distribución en una escala de valores Moda Mediana Media

3 TEMPORARY. SELECT IF (h12>25 AND h12<45). FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS. Medidas de tendencia central  Variable nominal Moda Valor que presenta la mayor concentración de frecuencia

4 Unimodal Bimodal

5 Mediana  Es el punto o valor numérico que deja por debajo (y por encima) a la mitad de las puntuaciones de la de la distribución  La mediana se calcula en primer lugar ordenando los datos y luego: - Si el número de datos es impar, la mediana es el dato central - Si el número de datos es par, la mediana se considera como el promedio de los dos datos centrales Medidas de tendencia central

6 Mediana

7 Mediana VARIABLE CUANTITATIVA

8 Medidas de tendencia central Media La MEDIA ARITMÉTICA O PROMEDIO es una medida estadística de tendencia central. De una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad.centro de gravedaddistribución

9 Propiedades de la media La media es sensible al valor exacto de todos los datos en la distribución La suma de las desviaciones con respecto a la media es cero La media es muy sensible a los datos extremos NOTA: Dado que cualquier valor extremo distorsiona la media aritmética, no es una buena medida de tendencia central en esas circunstancias. Por ello en presencia de valores extremos, es mas apropiado usar la mediana como medida de tendencia central. La mediana no se afecta con la presencia de valores extremos.

10 Medidas de posición no centrales Percentiles/cuartiles/deciles/n tiles

11 Medidas de posición no centrales Percentiles/cuartiles/deciles/n tiles Percentil 1 Percentil 99 2° Cuartil Percentil 50 5° decil 1° Cuartil3° Cuartil 1° decilDecil 10

12 Medidas de posición. Ejemplo. Ingreso horario

13 Medidas de Dispersión Las distribuciones del ingreso de dos provincias con el mismo ingreso medio por hogar son muy distintas si una de ellas tiene extremos de pobreza y de riqueza, mientras que la otra tiene poca variación de ingresos entre familias. Estamos interesados en la dispersión o variabilidad de los ingresos, además de estarlo en sus centros. Distribución con baja dispersión Distribución con alta dispersión

14 Medidas de Dispersión  Los datos también se deben caracterizar en términos de su dispersión o variabilidad.  Las medidas de variabilidad cuantifican la extensión de la dispersión  La variabilidad tiene que ver con qué tan alejados están los datos de la media.

15 Medidas de dispersión / desviación respecto a la media Miden el grado de cercanía o lejanía de las puntuaciones respecto a la media Permiten describir el grado de homogeneidad / heterogeneidad de la distribución de una variable Máximo y Mínimo Rango Amplitud Intercuartílica Varianza Desvío típico Coeficiente de variabilidad

16 Medidas de dispersión / desviación respecto a la media Mínimo Máximo rango o recorrido y amplitud intercuartílica Mínimo Máximo Máximo - Mínimo 2220 2240 - 20 = 2220 rango o recorrido Distancia entre el máximo valor y el mínimo valor que puede asumir la variable Amplitud intercuartílica Distancia entre el valor del primer cuartil y el valor del tercero 3°cuartil - 1°cuartil 500 800 - 300 = 500

17 Medidas de dispersión / desviación respecto a la media Varianza y desvío típico La desviación estándar (o desviación típica) y la varianza son medidas de dispersión para variables de razón y de intervalo. Son medidas que informan acerca del promedio de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades de medida que la variable de origen. Ambas medidas están estrechamente relacionadas ya que se define una a partir de la otra. N: 54 (X i – u) 2

18 Medidas de dispersión / desviación respecto a la media Varianza y desvío típico (X i – u) 2 Expresión de la varianza: (X i – u) 2 X Expresión de la desviación estándar: N: 54

19 Medidas de dispersión / desviación respecto a la media En dos poblaciones con distinta media qué grupo presenta mayor heterogeneidad ???????

20 Medidas de dispersión / desviación respecto a la media  Coeficiente de variabilidad Es de particular utilidad comparar la variabilidad de 2 o mas conjuntos de datos con medias diferentes. El coeficiente de variabilidad es una medida relativa que se expresa en porcentaje en vez de en términos de las unidades de los datos. Es una forma de estandarizar el desvío Indica la relación entre el desvío y la media

21 Medidas de dispersión / desviación respecto a la media Coeficiente de variabilidad SXSX Si se multiplica por 100 se obtiene el grado de variabilidad respecto de la media 4,3 / 21,9= 0,19 Existe una variabillidad de + - 19% respecto de la media El coeficiente de variación mide la dispersión con relación a la media y se calcula dividiendo la desviación estándar por la media, multiplicando este resultado por 100.

22 CV= S/X M= 477,6 / 441,7 V= 723 / 688,9 1,05 1,08 Medidas de dispersión / desviación respecto a la media

23 La Forma de la distribución  Una tercera característica de un conjunto de datos es la forma, es decir, la manera en que están distribuidas las observaciones.  La distribución de los datos puede ser o no simétrica. Si la distribución de los datos no es simétrica, se llama asimétrica o sesgada.  Para describir la forma se puede comparar la media y la mediana.  También puede observarse a través del coeficiente de asimetría Mide el grado de Simetría / Asimetría de la distribución

24 La Forma de la distribución Mdn Media Si es + indicará muchos casos en los valores más bajos y pocos en los más altos positivamente asimétrica. Media > Mediana: Positivos o con sesgamiento a la derecha Mdn Media Si es - indicará muchos casos en los valores más altos y pocos en los más bajos negativamente asimétrica. Media < Mediana: Negativos o con sesgaminto a la izquierda.

25 Mdn = Media En la distribución Normal es 0 Simétrica Media = Mediana: Simétricos o con sesgamiento cero. La Forma de la distribución

26 . kurtosis El coeficiente de kurtosis mide el grado de apuntamiento de la curva mesocúrticaleptocúrtica (menor dispersión) Platicúrtica (mayor dispersión) Otra manera de apreciar la forma de una distribución es observar el nivel de apilamiento o llanura de la curva

27 Si es + indicará un grado de apilamiento mayor que en la normal leptocúrtica (menor dispersión) Mide el grado de apuntamiento de la curva En la distribución Normal es 0 mesocúrtica Si es – indicará que es más aplanada que la normal platicúrtica (mayor dispersión) kurtosis El coeficiente de kurtosis La Forma de la distribución

28 Componentes Tabla de una contingencia Pobres No pobres Total Aprobaron 40 No aprobaron 60 Total 100 3070 N: total poblacional o muestral Marginales (de fila) Marginales (de columna) Celdas condicionales

29 Análisis bivariados Tablas de contingencia Función descriptiva Rendimiento educativo/cond. Socioec.Pobres No pobres Total 152540 55560 Total 7030100 Aprobaron 37,5 62,5 % fila 91,68,4 %Col 21,4 78,6 70 100 40 60 100 30 83,3 16,7 No aprobaron % fila % del total 15 % del total

30 Variables: aprobó Situación de pobreza Si no Si no categorías v. Nominal dicotómica Análisis bivariados Tablas de contingencia Hipótesis Hipótesis Existe una relación entre los logros educativos de los alumnos y su contexto sociofamiliar.

31 Análisis bivariados Tablas de contingencia La relación encontrada ¿es estadísticamente significativa o se debe al azar? TEST DE HIPÓTESIS Si existe ¿cúal es la fuerza y el sentido de dicha relación? COEFICIENTES DE ASOCIACIÓN COEFICIENTES DE ASOCIACIÓN

32 Si existe la relación ¿cúal es la fuerza y el sentido de dicha relación? Para medir el grado de dependencia o asociación entre las variables X e Y se utilizan medidas de asociación utilizan medidas de asociación Existen diferentes medidas según las características de la tabla, el tipo de hipótesis y las características de las variables

33 Coeficiente phi Medida de asociación para dos variables dicotómicas Basada en el coeficiente ji cuadrado Asume valores entre 0 y 1 Coeficiente V de Cramer Extensión de PHI Variables nominales de más de 2 categ Asume valores entre 0 y 1 Medidas de asociación para dos variables de escala nominal Coeficientes Lambdas Coeficiente Kappa Basada en reducción del error Interpretación distinta de los anteriores Asume valores entre 0 y 1 Proporción en que se reduce el error al predecir los valores de una variable a partir de los de la otra Compara los valores de dos variables nominales tales que sus valores pueden ser los mismos Tablas cuadradas Mide el grado de acuerdo entre las dos variables Asume valores entre -1y 1 Valores próximos a 1 : total acuerdo. Valores próximos a -1 : total desacuerdo

34 Medidas de asociación Medidas de asociación para dos variables de escala ordinal Coeficiente Gamma Medida de asociación para dos variables cualitativas de escala ordinal Asume valores entre -1 y 1 Valores próximos a 1 : fuerte asociación positiva: a medida que aumentan los valores de una variable aumentan los de la otra Valores próximos a -1 : fuerte asociación negativa: a medida que aumentan los valores de una variable disminuyen los de la otra 0 indica que no hay relación ni positiva ni negativa aunque puede haber otro tipo de relación. Puede alcanzar valores extremos cuando la asociación no es total

35 Medidas de asociación Medidas de asociación para dos variables de escala ordinal Coeficiente Tau-b de Kendall Extensión del GammaAsume valores entre -1 y 1 Alcanza valores extremos (-1 y 1) cuando la asociación es total Alcanza valores extremos (-1 y 1) sólo cuando las dos variables tienen el mismo número de categorías (la tabla es cuadrada) Coeficiente Tau-c de Kendall Corrección del tau-b para variables con distinto tipo de categorías Puede subestimar el grado de asociación.

36 TEMPORARY. SELECT IF (h12>25 AND h12<45). FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS. ESTADÍSTICA DESCRIPTIVA VARIABLE CUALITATIVA EN ESCALA ORDINAL

37 FREQUENCIES VARIABLES=xgedad /NTILES= 4 /PERCENTILES= 20 80 /STATISTICS=RANGE MINIMUM MAXIMUM MEDIAN /BARCHART FREQ /ORDER ANALYSIS. ESTADÍSTICA DESCRIPTIVA

38 FREQUENCIES VARIABLES=xh12 /FORMAT=NOTABLE /NTILES= 4 /PERCENTILES= 10 90 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT /HISTOGRAM NORMAL /ORDER ANALYSIS. ESTADÍSTICA DESCRIPTIVA VARIABLE CUANTITATIVA EN ESCALA MÉTRICA


Descargar ppt "ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO."

Presentaciones similares


Anuncios Google