La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 1 Slide Slides Prepared by JOHN S. LOUCKS St. Edwards University © 2002 South-Western /Thomson Learning.

Presentaciones similares


Presentación del tema: "1 1 Slide Slides Prepared by JOHN S. LOUCKS St. Edwards University © 2002 South-Western /Thomson Learning."— Transcripción de la presentación:

1 1 1 Slide Slides Prepared by JOHN S. LOUCKS St. Edwards University © 2002 South-Western /Thomson Learning

2 2 2 Slide Capítulo 3 Estadística descriptiva II: Métodos numéricos (Pág. 62) n Medidas de localización (ó de tendencia centra l) n Medidas de variabilidad n Medidas de localización relativa y detección valores atípicos n Análisis exploratorio de datos n Medidas de asociación entre dos variables n Media ponderada y manejo de datos agrupados x x % %

3 3 3 Slide 3.1. Medidas de localización (ó de tendencia central) (Pág. 65) n Media n Mediana n Moda n Percentiles n Cuartiles

4 4 4 Slide Ejemplo: Apartamentos en renta Abajo encontrara una muestra de los valores de renta mensuales para un departamento de una recamara. Los datos son una muestra de 70 apartamentos en una ciudad de los Estados Unidos. Los datos se presentan en orden ascendente.

5 5 5 Slide Media (Pág. 65) n La Media de un conjunto de datos es el promedio de todos los valores de los datos. n Si los datos son de una muestra el promedio se denota por. Si los datos provienen de una población, el promedio se denota por (mu). Si los datos provienen de una población, el promedio se denota por (mu).

6 6 6 Slide Ejemplo: Apartamentos en renta n Promedio

7 7 7 Slide Mediana (Pág. 66) n La mediana es la medida de localización mas usada para ingresos anuales y datos de valores de propiedad. n Unas pocas valores de ingresos o valores de propiedad, extremadamente grandes, pueden inflar el promedio.

8 8 8 Slide Mediana (Pág. 67) n La mediana de un conjunto de datos es el valor en la mitad cuando los elementos de los datos están en orden ascendente. n Para un numero impar de observaciones, la mediana es el valor de en medio (central) n Para un numero para de observaciones, la mediana es el promedio de los dos valores centrales.

9 9 9 Slide Ejemplo: Apartamentos en renta n Mediana Mediana = percentil 50 Mediana = percentil 50 i = ( p /100) n = (50/100)70 = 35.5 Promediando los valores de los datos 35to y 36to: Mediana = ( )/2 = 475

10 10 Slide Moda (Pág. 68) n La moda de u conjunto de datos es el valor que ocurre con mayor frecuencia. n La mayor frecuencia puede ocurrir a dos o mas valores diferentes n Si los datos tiene exactamente dos modas, el conjunto de datos es bimodal. n Si los datos tienen mas de dos modas, los datso son multimodales.

11 11 Slide Ejemplo: Apartamentos en renta n Moda 450 ocurre más frecuentemente (7 times) 450 ocurre más frecuentemente (7 times) Moda = 450 Moda = 450

12 12 Slide Percentiles (Pág. 68) n Un percentil provee información de cómo los datos están dispersos sobre un intervalo desde el valor mas pequeño hasta el valor mas grande. n Los exámenes de admisión para las universidades (en USA) es frecuente que se reporten en términos de percentiles.

13 13 Slide n El p-èsimo percentil de un conjunto de datos es un valor tal que al menos p por ciento de los elementos toma este valor o menor y al menos (100 - p ) por ciento de los elementos toman este valor o mas. Acomode los datos en orden ascendente. Acomode los datos en orden ascendente. Calcule el índice i, la posición de el percentil p- esimo. Calcule el índice i, la posición de el percentil p- esimo. i = ( p /100) n i = ( p /100) n Si i no es entero, redondee hacia arriba. El percentil p-esimo es el valor en la posición i. Si i no es entero, redondee hacia arriba. El percentil p-esimo es el valor en la posición i. Si i es un entero, el percentil p-esimo es el promedio de los valores en las posiciones i e i +1 Si i es un entero, el percentil p-esimo es el promedio de los valores en las posiciones i e i +1 Percentiles (Pág. 69)

14 14 Slide Ejemplo: Apartamentos en renta n Percentil de 90 i = ( p /100) n = (90/100)70 = 63 Promediando los valores de los datos 63ro y 64to : Promediando los valores de los datos 63ro y 64to : Percentil de 90 = ( )/2 = 585 Percentil de 90 = ( )/2 = 585

15 15 Slide Cuartiles (Pág. 70) n Los Cuartiles son percentiles específicos n Primer Cuartil = Percentil de 25 n Segundo Cuartil = Percentil de 50 = Mediana n Tercer Cuartil = Percentil de 75

16 16 Slide Ejemplo: Apartamentos en renta n Tercer Cuartil Tercer cuartil = Percentil de 75 Tercer cuartil = Percentil de 75 i = ( p /100) n = (75/100)70 = 52.5 = 53 i = ( p /100) n = (75/100)70 = 52.5 = 53 Tercer cuartil = 525 Tercer cuartil = 525

17 17 Slide 3.2. Medidas de variabilidad (Pág. 74) n A menudo es deseable considera medidas de variabilidad (dispersión), asì como medidas de localización. n Por ejemplo, al escoger a al proveedor A o proveedor B debemos considerar no solo el promedio del tiempo de entrega para cada uno, sino también la variabilidad en los tiempos de entrega para cada uno

18 18 Slide 3.2. Medidas de variabilidad (Pág. 74) n Rango n Rango Intercuartil n Varianza n Desviación Estándar n Coeficiente de Variación

19 19 Slide Rango (Pág. 74) n El rango de un conjunto de datos es la diferencia entre los valores más grande y más pequeño n Es la medida mas simple de variabilidad n Es muy sensitivo a los valores muy pequeños o muy grandes

20 20 Slide Ejemplo: Apartamentos en renta n Rango Rango = valor mayor – valor menor Rango = valor mayor – valor menor Rango = = 190 Rango = = 190

21 21 Slide Rango Intercuartil (Pág. 74) n El rango intercuartil de un conjunto de datos es la diferencia entre el tercer cuartil y el primer cuartil. n Es el rango donde se encuentra el 50% central de los datos. n Elimina la sensibilidad de los valores de datos extremos.

22 22 Slide Ejemplo: Apartamentos en renta n Rango intercuartil 3er. Cuartil ( Q 3) = 525 3er. Cuartil ( Q 3) = 525 1er. Cuartil ( Q 1) = 445 1er. Cuartil ( Q 1) = 445 Rango intercuartil = Q 3 - Q 1 = = 80 Rango intercuartil = Q 3 - Q 1 = = 80

23 23 Slide Varianza (Pág. 75) n La varianza es una medida de variabilidad que utiliza todos los datos. Esta basada en la diferencia entre los valores de cada observación ( x i ) y la media. ( x para una muestra, para una población). Esta basada en la diferencia entre los valores de cada observación ( x i ) y la media. ( x para una muestra, para una población).

24 24 Slide Varianza (Pág. 76) n La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media. n Si el conjunto de datos es una muestra, la varianza se denota por s 2. Si el conjunto de datos es una población, la varianza se denota por 2. Si el conjunto de datos es una población, la varianza se denota por 2.

25 25 Slide Desviación Estándar (Pág. 78) n La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la varianza. n Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la variancia, a la media. n Si el conjunto de datos es una muestra, la desviación estándar se denota por s. Si el conjunto de datos es una muestra, la desviación estándar se denota por (sigma). Si el conjunto de datos es una muestra, la desviación estándar se denota por (sigma).

26 26 Slide Coeficiente de Variación (Pág. 78) n El coeficiente de variación indica que tan grande es la desviación estándar rn relación al promedio. n Si un conjunto de datos es una muestra, el coeficiente de variación se calcula como sigue: n Si un conjunto de datos es una población, el coeficiente de variación se calcula como sigue:

27 27 Slide Ejemplo: Apartamentos en renta n Varianza n Desviación estándar n Coeficiente de Variación

28 28 Slide 3.3. Medidas de localización relativa y detección de valores atípicos (Pág. 81) n Valores z n Teorema de Chebyshev n La Regla Empírica n Detección de Valores Atípicos

29 29 Slide Valores z (Pág. 81) n El valor z es frecuentemente llamado el valor estandarizado n Denota el numero de desviaciones estándar que el valor de un dato x i está de la media. n Un dato con valor menor que la media de la muestra tendrá un valor de z menor que cero. n Un dato con valor mayor que el promedio de la muestra tendrá un valor de z mayor que cero n Un dato con valor igual que el promedio de la muestra tendrá un valor de z igual a cero

30 30 Slide n Valro z del menor valor (425) Valores estandarizados para Apartamentos en renta Ejemplo: Apartamentos en renta

31 31 Slide Teorema de Chebyshev (Pág. 82) Al menos (1 - 1/ k 2 ) de los elementos en un conjunto de datos estará dentro de las k desviaciones estándar del promedio donde k es cualquier valor mayor que 1. Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media. Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media. Al menos 89% de los elementos deben estar entre Al menos 89% de los elementos deben estar entre k = 3 desviaciones estándar de la media. Al menos 94% de los elementos deben estar entre k = 4 desviaciones estándar de la media. Al menos (1 - 1/ k 2 ) de los elementos en un conjunto de datos estará dentro de las k desviaciones estándar del promedio donde k es cualquier valor mayor que 1. Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media. Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media. Al menos 89% de los elementos deben estar entre Al menos 89% de los elementos deben estar entre k = 3 desviaciones estándar de la media. Al menos 94% de los elementos deben estar entre k = 4 desviaciones estándar de la media.

32 32 Slide Ejemplo: Apartamentos en renta n Teorema de Chebyshevs Theorem Sea k = 1.5 con = y s = Sea k = 1.5 con = y s = al menos (1 - 1/(1.5) 2 ) = = 0.56 o 56% de los costos de renta deben estar entre de los costos de renta deben estar entre - k ( s ) = (54.74) = k ( s ) = (54.74) = 409 y + k ( s ) = (54.74) = k ( s ) = (54.74) = 573

33 33 Slide n Teorema de Chebyshev (continúa) realmente, 86% de los costos de renta realmente, 86% de los costos de renta están entre 409 y 573. están entre 409 y 573. Ejemplo: Apartamentos en renta

34 34 Slide La Regla Empírica (Pág. 83) Para los datos que tienen una distribución tipo campana: Para los datos que tienen una distribución tipo campana: Aproximadamente 68% de los valores de los datos estarán entre una desviación estándar de la media Aproximadamente 68% de los valores de los datos estarán entre una desviación estándar de la media

35 35 Slide La Regla Empírica (Pág. 83) Para los datos que tienen una distribución tipo campana: Aproximadamente 95% de los valores de los datos estarán entre dos desviaciones estándar de la media

36 36 Slide La Regla Empírica (Pág. 84) Para los datos que tienen una distribución tipo campana: Para los datos que tienen una distribución tipo campana: Casi todos (99.7%) los elementos estarán entre tres desviaciones estándar de la media Casi todos (99.7%) los elementos estarán entre tres desviaciones estándar de la media

37 37 Slide Ejemplo: Apartamentos en renta n Regla empírica Interval o % in Intervalo Interval o % in Intervalo Entre +/- 1 s to /70 = 69% Entre +/- 1 s to /70 = 69% Entre +/- 2 s to /70 = 97% Entre +/- 2 s to /70 = 97% Entre +/- 3 s to /70 = 100% Entre +/- 3 s to /70 = 100%

38 38 Slide Detección de Valores Atípicos (Pág. 84) n Un valor atípico es un valor inusualmente muy pequeño o muy grande para el conjunto de datos. n Un dato con valor de z menor que -3 o mas grande que +3 puede ser considerado como un valor atípico. n Puede ser un valor de dato registrado incorrectamente. n Puede ser un dato n Puede ser un valor de dato que fue incorrectamente incluido en el conjunto de datos. n Puede ser un valor de dato correctamente registrado y que pertenece al conjunto de datos!!!

39 39 Slide Ejemplo: Apartamentos en renta n Detectando valores atípicos Los valores extremos más atípicos son y Usando | z | > 3 como el criterio para un dato atípico, no hay valores atípicos en este conjunto de datos Valores estandarizados para Apartamentos en Renta

40 40 Slide 3.4. Análisis exploratorio de datos (Pág. 86) n Resumen de cinco datos n Diagrama de caja

41 41 Slide Resumen de cinco datos (Pág. 87) n Valor mínimo n Primer cuartil (Q 1 ) n Mediana (Q 2 ) n Tercer cuartil (Q 3 ) n Valor máximo

42 42 Slide Ejemplo: Apartamentos en renta n Resumen de cinco datos Valor mínimo = 425 Primer cuartil (Q 1 ) = 450 Mediana (Q 2 ) = 475 Mediana (Q 2 ) = 475 Tercer cuartil (Q 3 ) = 525 Valor máximo = 615 Tercer cuartil (Q 3 ) = 525 Valor máximo = 615

43 43 Slide Diagrama de caja (Pág. 87) n Una caja se dibuja con sus extremos localizados en el primer y tercer cuartil. n Una línea es dibujada en la caja en la localización de la mediana. n Los límites son localizados (no dibujados) usando el rango intercuartil (RIC) El límite menor se localiza a 1.5(RIC) abajo de Q 1. El límite menor se localiza a 1.5(RIC) abajo de Q 1. El límite mayor se localiza 1.5(RIC) arriba de Q 3. El límite mayor se localiza 1.5(RIC) arriba de Q 3. Los datos fuera de estos límites son considerados atípicos Los datos fuera de estos límites son considerados atípicos … continúa

44 44 Slide Diagrama de caja (Pág. 87) (Continúa) n Bigotes (líneas punteadas) se dibujan desde los extremos de la caja a los valores de los datos menor y mas grandes dentro de los limites. n La localización de cada valor atípico es mostrada con el símbolo *.

45 45 Slide Ejemplo: Apartamentos en renta n Diagrama de caja Limite menor: Q (IQR) = (75) = Limite menor: Q (IQR) = (75) = Limite mayor: Q (IQR) = (75) = Limite mayor: Q (IQR) = (75) = No hay valores atípicos

46 46 Slide 3.5. Medidas de Asociación Entre Dos variables (Pág. 91) n Covarianza n Coeficiente de Correlación

47 47 Slide Covarianza (Pág. 91) n La covarianza es una medida de la asociación lineal entre dos variables. n Valores positivos indican una relación positiva. n Valores negativos indican una relación negativa

48 48 Slide n Si el conjunto de datos es una muestra, la covarianza se denota por s xy. n Si el conjunto de datos es una población, la covarianza se denota por. Covarianza (Pág. 91)

49 49 Slide Coeficiente de correlación (Pág. 95) n El coeficiente puede tomar valores entre -1 y +1. n Valores cercanos a -1 indican un relación lineal negativa fuerte. n Valores cercanos a +1 indican un relación lineal positiva fuerte. n Si el conjunto de datos es una muestra, el coeficiente es r xy. n Si el conjunto de datos es una población, el coeficiente es.

50 50 Slide 3.6. Media ponderada y manejo de datos agrupados (Pág. 100) n Media ponderada n Media para datos agrupados n Varianza para datos agrupados n Desviación estándar para datos agrupados

51 51 Slide Media ponderada (Pág. 101) n Cuando la media es calculada dándole a cada valor de dato un peso que refleja su importancia, es referido como una media ponderada. n En el calculo de promedio de calificaciones (tipo USA), el peso es el numero de créditos obtenidos para cada grado. n Cuando los valores de los datos varían en importancia, el analista debe escoger el peso que refleje la importancia de cada valor.

52 52 Slide Media ponderada (Pág. 101) x = w i x i x = w i x i w i w idonde: x i = valor de observación i x i = valor de observación i w i = peso de observaciòn i w i = peso de observaciòn i

53 53 Slide Datos agrupados (Pág. 102) n El calculo de la media pondera puede ser usado para obtener aproximaciones al promedio, varianza, y desviación estándar de datos agrupados. n Para calcular la media ponderada, tratamos el punto medio de cada clase como si fuera la media de todos los elementos en la clase. n Calculamos una media ponderada de los puntos medios utilizando las frecuencias de la clase como pesos. n Similarmente, al calcular la varianza y desviación estándar las frecuencias de las clases son utilizadas como pesos.

54 54 Slide n Muestra n Población donde: f i = Frecuencia de la clase i f i = Frecuencia de la clase i M i = punto medio de la clase i M i = punto medio de la clase i Media para datos agrupados (Pág. 102)

55 55 Slide Ejemplo: Apartamentos en renta Abajo está la muestra de las rentas mensuales para departamentos de una recamara presentados aquí como datos agrupados en la forma de distribucion de frecuencias Renta ($)Frecuencia

56 56 Slide Ejemplo: Apartamentos en renta n Media para datos agrupados Esta aproximación difiere en $2.41 de la Esta aproximación difiere en $2.41 de la media real de la muestra de $ media real de la muestra de $

57 57 Slide Varianza para datos agrupados (Pág. 103) n Muestra n Población

58 58 Slide Ejemplo: Apartamentos en renta n Varianza para datos agrupados n Desviación Estándar para datos agrupados Esta aproximación difiere en solo $.20 de la desviación estándar de $54.74.

59 59 Slide Fin del capítulo 3


Descargar ppt "1 1 Slide Slides Prepared by JOHN S. LOUCKS St. Edwards University © 2002 South-Western /Thomson Learning."

Presentaciones similares


Anuncios Google