La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.

Presentaciones similares


Presentación del tema: "1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad."— Transcripción de la presentación:

1 1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad. Modelos probabilísticos. Introducción a la inferencia estadística. Contrastes de hipótesis. Estadística I. Finanzas y contabilidad

2 2 1.Representaciones y gráficos. Tablas de frecuencias. Diagrama de barras, Pictogramas, Histograma, Polígono de frecuencias, y Diagrama de caja. 2.Resumen numérico. Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas: Capítulos 2 a 6 del libro de Peña y Romo (1997) Tema 2: Análisis de datos univariantes

3 3 Medidas de localización o posición Moda Mediana Media Cuantiles Diagrama de caja Medidas de dispersión Varianza y desviación típica Coeficiente de variación Rango y rango intercuartílico Lecturas recomendadas: Capítulos 4 y 5 del libro de Peña y Romo (1997) Tema 2: Análisis de datos univariantes

4 4 MEDIDAS DESCRIPTIVAS ¿Para qué nos sirven? ¿Se pueden calcular todas con todo tipo de variables? ¿Cuáles son las más adecuadas en cada caso? ¿De qué forma podemos sacar partido a nuestra calculadora? Medidas de localización o posición

5 5 LA MODA: (Cuando los datos no están agrupados en intervalos) Es el valor que aparece con una frecuencia mayor. Puede haber más de una moda: bimodal-trimodal-plurimodal 777535117 1121174887 1025 ¿Qué valor toma la moda? Medidas de localización o posición

6 6 LA MODA: (Cuando los datos están agrupados en intervalos) Clasesnini Marca de clase [0,5)11 [5,10)13 [10,15)6 [15,20)2 [20,25)1 [25,30)3 Podemos encontrar: La CLASE MODAL ¿En la representación gráfica? Pero, ¿y si queremos calcular exactamente el valor de la MODA? ¿Podemos calcularla para DATOS CUALITATIVOS? Medidas de localización o posición

7 7 EJERCICIO: LA MODA IntervaloFrecuencia absoluta [0,5)6 [5,10)14 [10,15)20 [15,20)10 Calcular el valor exacto de la moda. Medidas de localización o posición

8 8 LA MEDIANA: (Cuando los datos no están agrupados en intervalos) Es la observación que ocupa el lugar central 777535117 1121174887 1025 ¿Qué valor toma la mediana? 1.Ordenamos los datos de menor a mayor. 2.Tenemos en cuenta también los que se repiten. 3.La mediana, es el CENTRO FÍSICO ¿Cómo cambia el cálculo si N es par o impar? Medidas de localización o posición

9 9 LA MEDIANA: (Cuando los datos están agrupados en intervalos) Podemos encontrar: El INTERVALO MEDIANO Pero, ¿y si queremos calcular exactamente el valor de la MEDIANA? ¿Podemos calcularla para DATOS CUALITATIVOS? Medidas de localización o posición ClasesniMarca de clase [0,5)132,5 [5,10)117,5 [10,15)612,5 [15,20)217,5 [20,25)122,5 [25,30)327,5

10 10 LA MEDIA ARITMÉTICA: Es el PROMEDIO de los valores de la muestra 777535117 1121174887 1025 ¿ Qué valor toma la media? 1.Sumamos los datos. 2.Los dividimos por el número total de datos (N). Medidas de localización o posición (Cuando los datos no están agrupados en intervalos)

11 11 LA MEDIA ARITMÉTICA: El valor de la media con los datos agrupados en intervalos utiliza la marca de clase. ¿Podemos calcularla para DATOS CUALITATIVOS? Medidas de localización o posición (Cuando los datos están agrupados en intervalos) ClasesniM.C. (xi)ni xi [0,5)132,532,5 [5,10)117,582,5 [10,15)612,575 [15,20)217,535 [20,25)122,5 [25,30)327,582,5 330Suma 9,17Media

12 12 La MEDIA ARITMÉTICA para datos agrupados en intervalos es entonces: (Cuando los datos están agrupados en intervalos) Medidas de localización o posición

13 13 LOS CUANTILES: (Cuando los datos no están agrupados en intervalos) Nos divide en conjunto de datos en k partes. Si por EJEMPLO tenemos diez datos (N=10), y queremos hacer cuatro partes (k=4), necesitamos tres marcas (c 1, c 2 y c 3 ) Cuando k=4, se llaman CUARTILES; cuando k=10, DECILES; y cuando k=100, CENTILES. Medidas de localización o posición

14 14 CÁLCULO DE CUARTILES Tenemos el siguiente conjunto de datos: 4752525763646971 72727881818691 1.Ordenamos los datos de menor a mayor. 2.Calculamos c 2, que ocupa la posición correspondiente a la mitad, ¿con qué parámetro visto ya coincide este segundo cuartil? 3.Ahora calculamos, la mitad de la primera parte: c 1. 4.Y la mitad de la segunda parte: c 3 Medidas de localización o posición

15 15 Medidas de localización o posición 47 52 57 63 64 69 71 72 78 81 86 91 c2 = 71 c1 = 60 c3 = 79,5

16 16 REPRESENTACIÓN GRÁFICA UTILIZANDO LOS CUARTILES Utilizando el anterior conjunto de datos : 1.Los cálculos: Primer cuartil: 60 Segundo cuartil: 71 Tercer cuartil: 79,5 Media aritmética: 69,07 2. Hay datos que pueden provenir de observaciones mal tomadas: datos atípicos. Para detectarlas, calculamos: LI=c 1 -1,5(c 3 -c 1 ) LS=c 3 +1,5(c 3 -c 1 ) Diagrama de caja

17 17 EJERCICIO 1: DIAGRAMA DE CAJA Construir el diagrama de caja para el anterior conjunto de datos. 5659596167 6973767680 8383849094 Diagrama de caja

18 18 EJERCICIO 2: DIAGRAMA DE CAJA Construir el diagrama de caja para el anterior conjunto de datos. 3545455557626464 6465737474767880 8284869292929394 97112116116123123124128 140143173214255277 Diagrama de caja

19 19 Medidas de localización o posición Moda Mediana Media Cuantiles Diagrama de caja Medidas de dispersión Varianza y desviación típica Coeficiente de variación Rango y rango intercuartílico Tema 2: Análisis de datos univariantes

20 20 PRIMER CONJUNTO DE DATOS (Salarios anuales en de la empresa A) 30700 32500 32900 33800 34100 34500 36000 SEGUNDO CONJUNTO DE DATOS (Salarios anuales en de la empresa B) 27500 31600 31700 33800 35300 34000 40600 Vamos a calcular: MEDIA y MEDIANA de ambos conjuntos de datos: Observa ahora las representaciones gráficas. Señala media y mediana. ¿Tenemos suficiente información? Medidas de dispersión: Varianza

21 21 Parece que la diferencia entre ambos conjuntos de datos son las DISTANCIAS A LA MEDIA, vamos a calcularlas. Empresa A xi-xi- Empresa B xi-xi- 30700-280027500-6000 32500-100031600-1900 32900-60031700-1800 3380030033800300 3410060034000500 345001000353001800 360002500406007100 ¿Cuánto suman nuestras dos nuevas columnas? NUEVA PROPIEDAD: ¿Por qué sucede esto? ¿Podemos solucionarlo de alguna manera? Medidas de dispersión: Varianza

22 22 ¿ Qué hacemos para poder compararlas? Empresa A Empresa B 3070078400002750036000000 325001000000316003610000 32900360000317003240000 33800900003380090000 34100360000340003240000 34500100000035300250000 3600062500004060050410000 16900000 96840000 ¿Qué unidades tiene este nuevo parámetro? ¿Podemos cambiarlas? ¿Qué indica este nuevo parámetro? Medidas de dispersión: Varianza Modificamos nuestro cálculo:

23 23 Cuando la media sea distinta de 0, podemos calcular: Nos permite comparar, porque no tiene unidades. ¿Para qué nos sirve con una única base de datos? EJERCICIO 3: Analizamos el volumen de consultas durante el período de exámenes en 10 bibliotecas universitarias, y se comparan con las anotadas el año anterior. El % de incremento de consultas fue: 10.2 2.9 3.1 6.8 5.9 7.3 7.0 8.2 3.7 4.3 ¿Son los datos homogéneos? Medidas de dispersión: Coeficiente de variación

24 24 Rango : la diferencia entre el mayor y el menor de los datos. EJERCICIO 4: Calcula estas dos medidas para los EJERCICIOS 1 y 2. Medidas de dispersión: Rango y rango intercuartílico Rango intercuartílico : la diferencia entre el tercer y el primer cuartil. Rango intercuartílico Rango


Descargar ppt "1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad."

Presentaciones similares


Anuncios Google