La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1.Introducción a la Estadística 2.Descripción de los conjuntos de datos 3.Uso de la Estadística para sintetizar conjuntos de datos 4.Probabilidad 5.Variables.

Presentaciones similares


Presentación del tema: "1.Introducción a la Estadística 2.Descripción de los conjuntos de datos 3.Uso de la Estadística para sintetizar conjuntos de datos 4.Probabilidad 5.Variables."— Transcripción de la presentación:

1

2 1.Introducción a la Estadística 2.Descripción de los conjuntos de datos 3.Uso de la Estadística para sintetizar conjuntos de datos 4.Probabilidad 5.Variables aleatorias discretas 6.Variables aleatorias normales

3

4 3.1 Introducción 3.2 Media muestral 3.3 Mediana muestral 3.4 Moda muestral 3.5 Varianza muestral y desviación típica muestral 3.6 Conjuntos de datos normales y la regla empírica 3.7 Coeficiente de correlación muestral

5 Se entiende por estadístico cualquier magnitud numérica cuyo valor se pueda determinar a partir de los datos.

6 Primeramente estudiaremos los estadísticos que describen la tendencia central del conjunto de datos; es decir, que describen el centro del conjunto de los valores de los datos. Se entiende por estadístico cualquier magnitud numérica cuyo valor se pueda determinar a partir de los datos.

7 Presentaremos sucesivamente tres estadísticos de este tipo: 1.Media muestral. 2.Mediana muestral. 3.Moda muestral. Se entiende por estadístico cualquier magnitud numérica cuyo valor se pueda determinar a partir de los datos.

8 3.1 Introducción 3.2 Media muestral 3.3 Mediana muestral 3.4 Moda muestral 3.5 Varianza muestral y desviación típica muestral 3.6 Conjuntos de datos normales y la regla empírica 3.7 Coeficiente de correlación muestral

9

10 Supongamos que se dispone de una muestra de n datos cuyos valores serán designados por x 1, x 2, x 3, …,x n.

11 Un estadístico usado para indicar el centro de este conjunto de datos es la media muestral, definida como la media aritmética de los valores de los datos. n datos cuyos valores serán designados por x 1, x 2, x 3, …,x n.

12 La media muestral es la media aritmética de los valores de los datos.

13

14

15

16

17

18

19

20

21

22 Periodo Millones de dólares Inversión extranjera directa en México en el sector agropecuario (millones de dólares):

23 PeriodoAgropecuario

24 PeriodoAgropecuario

25 Inversión extranjera directa en México en el sector agropecuario (millones de dólares): PeriodoAgropecuario Total561.9

26 PeriodoAgropecuario

27 Media muestral

28 PeriodoAgropecuario

29 PeriodoAgropecuario

30 MatemáticasLectura Calificaciones obtenidas en el examen SAT para 15 alumnos:

31 MatemáticasLectura

32 MatemáticasLectura

33 MatemáticasLectura

34

35 MatemáticasLectura

36 MatemáticasLectura

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52 Los datos siguientes reflejan el número total de incendios en Ontario (Canadá), ocurridos en los sucesivos meses del año 2002: 6, 13, 5, 7, 7, 3, 7, 2, 5, 6, 9, 8

53 Los datos siguientes reflejan el número total de incendios en Ontario (Canadá), ocurridos en los sucesivos meses del año 2002: MESNÚMERO DE INCENDIOS Enero6 Febrero13 Marzo5 Abril7 Mayo7 Junio3 Julio7 Agosto2 Septiembre5 Octubre6 Noviembre9 Diciembre8

54

55 MESNÚMERO DE INCENDIOS Enero6 Febrero13 Marzo5 Abril7 Mayo7 Junio3 Julio7 Agosto2 Septiembre5 Octubre6 Noviembre9 Diciembre8 Total78 Media muestral6.5

56 ## #Frecuencia Total78 Media muestral6.5

57 La tienda de bicicletas Latitud 19N vendió en el mes de noviembre las siguientes bicicletas: Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000

58 Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000

59 | Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000 PrecioCantidad , , ,000 1

60 PrecioCantidad , , ,000 1

61

62 | Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000

63 PrecioCantidad , , ,000 1

64 Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000 El precio medio de venta fue de 1,054 pesos. Las bicicletas vendidas en Latitud 19 N en el mes de noviembre fueron:

65 El precio medio de venta fue de 1,054 pesos. Las bicicletas vendidas en una tienda en el mes de noviembre fueron: PrecioCantidadPrecio x Cantidad

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80 Periodo Millones de dólares Inversión extranjera directa en México en el sector agropecuario (millones de dólares):

81 PeriodoAgropecuario Total561.9

82 Inversión extranjera directa en México en el sector agropecuario (millones de dólares): PeriodoMontoMonto menos la media

83 Media muestral

84 3.1 Introducción 3.2 Media muestral 3.3 Mediana muestral 3.4 Moda muestral 3.5 Varianza muestral y desviación típica muestral 3.6 Conjuntos de datos normales y la regla empírica 3.7 Coeficiente de correlación muestral

85

86 Pasamos ahora a estudiar otro estadístico que nos da una medida de la tendencia central del conjunto de datos, la mediana.

87 Para motivar su introducción, y explicar su utilidad, calcularemos la media muestral en dos ejemplos ad hoc, y haremos ver un problema que presenta.

88 Las bicicletas vendidas en Latitud 19N en el mes de diciembre fueron: Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000

89 Diciembre Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000 Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000 Noviembre Comparación entre las ventas de noviembre y diciembre

90 Diciembre Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000 Precio Bici Bici 2 1,500 Bici Bici Bici 5 2,000 Bici 6 1,500 Bici Bici Bici Bici Bici 11 1,000 Bici 12 1,500 Bici 13 1,000 Noviembre

91 Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000

92 Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000 PrecioCantidad , , , ,000 1 Precio Bici Bici Bici Bici Bici Bici Bici Bici 4 1,000 Bici 6 1,000 Bici 1 1,500 Bici 11 1,500 Bici 14 1,500 Bici 10 2,000 Bici 15 2,000 Bici 9 40,000

93 PrecioCantidad , ,550 1, ,000 1, ,500 2, ,000 40, ,450 Media muestral 3,697

94 PrecioCantidad , , , ,000 1

95 Las bicicletas vendidas en una tienda en el mes de diciembre fueron: Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000 El precio medio de venta en diciembre fue de 3,697 pesos El precio medio de venta en noviembre fue de 1,054 pesos

96 Los siguientes datos representan los tiempos de progresión, medidos en meses, de un tipo particular de tumor cerebral, llamado glioblastoma, en 65 pacientes: 6, 5, 37, 10, 22, 9, 2, 16, 3, 3, 11, 9, 5, 14, 11, 3, 1, 4, 6, 2, 7, 3, 7, 5, 4, 8, 2, 7, 13, 16, 15, 9, 4, 4, 2, 3, 9, 5, 11, 3, 7, 5, 9, 3, 8, 9, 4, 10, 3, 2, 7, 6, 9, 3, 5, 4, 6, 4, 14, 3, 12, 6, 8, 12, 7

97 Meses

98 MesesPacientes Total65

99 MesesPacientesMeses x Pacientes Total La media muestral es 7.4 meses

100 Media

101 Una debilidad de la media muestral como indicador del centro de un conjunto de datos es que su valor se encuentra muy afectado por los extremos de los datos.

102 Un estadístico que se utiliza también para representar el centro de un conjunto de datos es la mediana muestral, definida como el valor medio cuando los datos están ordenados de menor a mayor. La mediana muestral será denotada por m.

103 La mediana muestral es el valor central de un conjunto ordenado de datos.

104 Ordene los datos de menor a mayor. Si el número de datos es impar, la mediana muestral coincide con el valor que se encuentra en la posición central en la lista ordenada. Si el número de datos es par, la mediana muestral es la media de los dos valores que ocupan las posiciones centrales.

105 De esta definición se deduce que, si existen tres datos, la mediana muestral coincide con el segundo valor más pequeño; mientras que, si existen cuatro valores, coincide con la media de los valores más pequeños segundo y tercero.

106 Para un conjunto de datos de n valores, la mediana muestral coincide con el (n+1)/2 menor valor ordenado, cuando n es impar.

107 Para un conjunto de datos de n valores, la mediana muestral coincide con la media de los valores ordenados que ocupan las posiciones (n/2) y (n/2+1), cuando n es par.

108

109 Las bicicletas vendidas en Latitud 19N en el mes de diciembre fueron: Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000

110 Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000 Precio Bici Bici Bici Bici Bici Bici Bici Bici 4 1,000 Bici 6 1,000 Bici 1 1,500 Bici 11 1,500 Bici 14 1,500 Bici 10 2,000 Bici 15 2,000 Bici 9 40,000

111 Precio 1Bici Bici Bici Bici Bici Bici Bici Bici 4 1,000 9Bici 6 1,000 10Bici 1 1,500 11Bici 11 1,500 12Bici 14 1,500 13Bici 10 2,000 14Bici 15 2,000 15Bici 9 40,000

112 Las bicicletas vendidas en una tienda en el mes de diciembre fueron: Precio Bici 1 1,500 Bici Bici Bici 4 1,000 Bici Bici 6 1,000 Bici Bici Bici 9 40,000 Bici 10 2,000 Bici 11 1,500 Bici Bici Bici 14 1,500 Bici 15 2,000 El precio medio de venta en noviembre fue de 1,054 pesos

113 Los siguientes datos representan los tiempos de progresión, medidos en meses, de un tipo particular de tumor cerebral, llamado glioblastoma, en 65 pacientes: 6, 5, 37, 10, 22, 9, 2, 16, 3, 3, 11, 9, 5, 14, 11, 3, 1, 4, 6, 2, 7, 3, 7, 5, 4, 8, 2, 7, 13, 16, 15, 9, 4, 4, 2, 3, 9, 5, 11, 3, 7, 5, 9, 3, 8, 9, 4, 10, 3, 2, 7, 6, 9, 3, 5, 4, 6, 4, 14, 3, 12, 6, 8, 12, 7

114 Meses

115 Meses Meses

116 Meses La mediana muestral es 6 meses

117 1.La media muestral es 7.4 meses 2.La mediana muestral es 6 meses MesesPacientes Total65 Meses

118 Media Mediana

119 Periodo Millones de dólares Inversión extranjera directa en México en el sector agropecuario (millones de dólares):

120 Periodo Millones de dólares Periodo Millones de dólares Ordenando de menor a mayor

121 Periodo Millones de dólares

122 MatemáticasLectura Calificaciones obtenidas por 15 alumnos en el examen SAT:

123 Matemáticas Matemáticas Ordenando de menor a mayor

124 AlumnoMatemáticas

125 Ordenando de menor a mayor Lectura Lectura

126 AlumnoLectura

127 Tanto la media muestral como la mediana muestral son estadísticos útiles para describir la tendencia central de un conjunto de datos.

128 La media muestral, siendo la media aritmética, utiliza todos los datos. La mediana muestral, puesto que sólo utiliza un único valor central o bien un par de valores centrales, no se ve afectada por los valores extremos.

129 Para los conjuntos de datos aproximadamente simétricos sobre su valor central, la media muestral y la mediana muestral tienen valores próximos.

130 Por ejemplo, los datos 4, 6, 8, 8, 9, 12, 15, 17, 19, 20, 22 son, grosso modo, simétricos alrededor del valor 12, que es su mediana. La media es 140/11 = 12.73, que se encuentra próxima a 12.

131 #Número

132 La respuesta a la pregunta sobre cuál de los dos estadísticos sumariales es más informativo depende de qué es lo que se pretende conocer del conjunto de datos.

133 Por ejemplo, si el gobierno establece un impuesto sobre la renta con tarifa plana (proporcional) y se pretende averiguar qué recaudación cabe esperar, la renta media de los ciudadanos será más interesante que la mediana (¿por qué?). La respuesta a la pregunta sobre cuál de los dos estadísticos sumariales es más informativo depende de qué es lo que se pretende conocer del conjunto de datos.

134 Por el contrario, si el gobierno estuviera interesado en determinar un valor central de la cantidad de renta que los ciudadanos dedican a la vivienda, la mediana muestral podría ser más informativa (¿por qué?). La respuesta a la pregunta sobre cuál de los dos estadísticos sumariales es más informativo depende de qué es lo que se pretende conocer del conjunto de datos.

135 Aunque es interesante analizar si la media muestral o la mediana muestral es mas informativa en una situación concreta, observe que no debemos restringir nuestro conocimiento a sólo una de dichas magnitudes. Ambas son importantes y, por tanto, las dos se han de calcular cuando se está sintetizando un conjunto de datos.

136

137 La mediana muestral es un caso particular de los estadísticos conocidos como percentiles muestrales de orden 100p por ciento, donde p puede ser cualquier valor comprendido entre 0 y 1.

138 Grosso modo, el percentil muestral de orden 100p por ciento es aquel valor que verifica que el 100p por ciento de los datos son menores que él y que el 100( 1-p)% de los datos son mayores que él. La mediana muestral es un caso particular de los estadísticos conocidos como percentiles muestrales de orden 100p por ciento, donde p puede ser cualquier valor comprendido entre 0 y 1.

139 Si existen dos de los datos que cumplen las condiciones anteriores, el percentil muestral de orden 100p por ciento se define como la media aritmética de ambos.

140 Observe que la mediana muestral se corresponde con el percentil muestral de orden 50%. Es decir, coincide con el percentil muestral de orden 100p por ciento cuando p = 0.50.

141 Supongamos que se han ordenado de menor a mayor todos los datos de una muestra de tamaño n. Para determinar el percentil muestral de orden 100p por ciento se debe encontrar aquel valor que verifica que: 1. Al menos np valores de los datos son menores o iguales que él. 2. Al menos n(1-p) valores de los datos son mayores o iguales que él.

142 Ahora bien, si np no es un entero, el único valor de los datos que cumple ambos puntos es aquel cuya posición de orden coincide con el primer entero superior a np.

143 Por ejemplo, supongamos que se quiere determinar el percentil muestral de orden 90% en una muestra de tamaño n = 12. Puesto que p = 0.9, se tiene np = 10.8 y n(1-p) = 1.2 Ahora bien, si np no es un entero, el único valor de los datos que cumple ambos puntos es aquel cuya posición de orden coincide con el primer entero superior a np

144 1. Al menos 10.8 valores de los datos sean menores o iguales que él (por consiguiente, el dato debe estar en la posición de orden 11 o mayor). 2. Al menos 1.2 valores de datos sean mayores o iguales que él (por tanto, debe ocupar la posición de orden 11 o menor). Ahora bien, si np no es un entero, el único valor que cumple ambos puntos es aquel cuya posición de orden coincide con el primer entero superior a np. Si n=12 y p=0.90 tenemos np = 10.8 y n(1-p) = 1.2

145 Ahora bien, si np no es un entero, el único dato que cumple ambos puntos es aquel cuya posición de orden coincide con el primer entero superior a np. Si n=12 y p=0.90 tenemos np = 10.8 y n(1-p) = Al menos 10.8 valores de los datos sean menores o iguales que él (por consiguiente, el valor de datos debe estar en la posición de orden 11 o mayor). 2. Al menos 1.2 valores de datos sean mayores o iguales que él (por tanto, debe ocupar la posición de orden 11 o menor). Evidentemente, el único dato que cumple ambos puntos es aquél que ocupa la posición de orden 11, y, en consecuencia, éste será el percentil muestral de orden 90%.

146 Por otro lado, si np es un entero, tanto el dato que ocupa la np posición de orden como el dato que ocupa la posición de orden np+1 cumplen las condiciones de las definiciones 1 y 2; en este caso, el percentil muestral de orden 100p por ciento será igual a la media aritmética de los dos datos anteriores.

147 Por ejemplo, supongamos que se desea encontrar el percentil muestral de orden 95% en un conjunto de datos con n = 20 valores Por otro lado, si np es un entero, tanto el valor de los datos que ocupa la np posición de orden como el valor de los datos que ocupa la posición de orden np+1 cumplen las condiciones de las definiciones 1 y 2; en este caso, el percentil muestral de orden 100p por ciento será igual a la media aritmética de los dos valores de los datos anteriores.

148 En este caso, tanto el 19° valor como el 20° valor (los dos valores mayores) serán mayores o iguales que al menos np = 20(0,95) = 19 de los datos, y serán menores o iguales que al menos n(1-p) = 1 de dichos valores. Por otro lado, si np es un entero, tanto el valor de los datos que ocupa la np posición de orden como el valor de los datos que ocupa la posición de orden np+1 cumplen las condiciones de las definiciones 1 y 2; en este caso, el percentil muestral de orden 100p por ciento será igual a la media aritmética de los dos valores de los datos anteriores. n=20, p=0.95, np=19, np+1=20

149 El percentil muestral de orden 95% será, pues, la media aritmética de los valores que ocupan las posiciones de orden 19 y 20 (es decir, los dos mayores). Por otro lado, si np es un entero, tanto el valor de los datos que ocupa la np posición de orden como el valor de los datos que ocupa la posición de orden np+1 cumplen las condiciones de las definiciones 1 y 2; en este caso, el percentil muestral de orden 100p por ciento será igual a la media aritmética de los dos valores de los datos anteriores. n=20, p=0.95, np=19, np+1=20

150 Para encontrar el percentil muestral de orden 100p% de un conjunto de datos de tamaño n: 1. Ordene los datos en sentido creciente. 2. Si np no es un entero, determine el menor entero mayor que np. El dato que ocupa la posición de orden igual a este último entero será el percentil muestral al 100p por ciento. 3. Si np es un entero, el percentil muestral de orden 100p por ciento coincidirá con la media aritmética de los valores que ocupan las posiciones de orden np y np + 1.

151 El percentil muestral de orden 25% se llama primer cuartil. El percentil muestral de orden 50% se denomina mediana o segundo cuartil. El percentil muestral de orden 75% se llama tercer cuartil.

152 Los cuartiles dividen el conjunto de los datos en cuatro partes, de forma que, aproximadamente, un 25% de los valores de datos se encuentran por debajo del primer cuartil, otro 25% de los valores se encuentra entre el primer y el segundo cuartil, un tercer 25% se encuentra entre el segundo y el tercer cuartil y, por último, el 25% restante de los valores supera al tercer cuartil.

153 La siguiente tabla muestra las exportaciones de plátanos, en toneladas métricas, de países iberoamericanos y caribeños. Encuentre los cuartiles.

154 PAÍSTONELADAS MÉTRICAS Ecuador 4,095,191 Costa Rica 2,113,652 Colombia 1,710,949 Guatemala 857,164 Panamá 489,805 Honduras 183,400 México 81,044 Santa Lucía 72,795 Brasil 72,468 Belice 64,400 República Dominicana 62,429 Nicaragua 44,402 San Vicente y las Granadinas 43,810 Jamaica 40,900 Surinam 34,000 Venezuela 33,543 Dominica 29,810 Bolivia 9,377 Perú 856 Granada 707 Argentina 412 Trinidad y Tobago 87 El Salvador 72 Paraguay 66 Chile 18 Guayana 10 TOTAL 10,041,367 La siguiente tabla muestra las exportaciones de plátanos, en toneladas métricas, de países iberoamericanos y caribeños. Encuentre los cuartiles.

155

156 PAÍSTONELADAS MÉTRICAS Ecuador 4,095,191 Costa Rica 2,113,652 Colombia 1,710,949 Guatemala 857,164 Panamá 489,805 Honduras 183,400 México 81,044 Santa Lucía 72,795 Brasil 72,468 Belice 64,400 República Dominicana 62,429 Nicaragua 44,402 San Vicente y las Granadinas 43,810 Jamaica 40,900 Surinam 34,000 Venezuela 33,543 Dominica 29,810 Bolivia 9,377 Perú 856 Granada 707 Argentina 412 Trinidad y Tobago 87 El Salvador 72 Paraguay 66 Chile 18 Guayana 10 TOTAL 10,041,367 PAÍSTONELADAS MÉTRICAS Guayana 10 Chile 18 Paraguay 66 El Salvador 72 Trinidad y Tobago 87 Argentina 412 Granada 707 Perú 856 Bolivia 9,377 Dominica 29,810 Venezuela 33,543 Surinam 34,000 Jamaica 40,900 San Vicente y las Granadinas 43,810 Nicaragua 44,402 República Dominicana 62,429 Belice 64,400 Brasil 72,468 Santa Lucía 72,795 México 81,044 Honduras 183,400 Panamá 489,805 Guatemala 857,164 Colombia 1,710,949 Costa Rica 2,113,652 Ecuador 4,095,191 TOTAL 10,041,367

157 PAÍSTONELADAS MÉTRICAS Guayana 10 Chile 18 Paraguay 66 El Salvador 72 Trinidad y Tobago 87 Argentina 412 Granada 707 Perú 856 Bolivia 9,377 Dominica 29,810 Venezuela 33,543 Surinam 34,000 Jamaica 40,900 San Vicente y las Granadinas 43,810 Nicaragua 44,402 República Dominicana 62,429 Belice 64,400 Brasil 72,468 Santa Lucía 72,795 México 81,044 Honduras 183,400 Panamá 489,805 Guatemala 857,164 Colombia 1,710,949 Costa Rica 2,113,652 Ecuador 4,095,191 TOTAL 10,041,367

158 PAÍSTONELADAS MÉTRICAS Guayana 10 Chile 18 Paraguay 66 El Salvador 72 Trinidad y Tobago 87 Argentina 412 Granada 707 Perú 856 Bolivia 9,377 Dominica 29,810 Venezuela 33,543 Surinam 34,000 Jamaica 40,900 San Vicente y las Granadinas 43,810 Nicaragua 44,402 República Dominicana 62,429 Belice 64,400 Brasil 72,468 Santa Lucía 72,795 México 81,044 Honduras 183,400 Panamá 489,805 Guatemala 857,164 Colombia 1,710,949 Costa Rica 2,113,652 Ecuador 4,095,191 TOTAL 10,041,367

159 PAÍSTONELADAS MÉTRICAS Guayana 10 Chile 18 Paraguay 66 El Salvador 72 Trinidad y Tobago 87 Argentina 412 Granada 707 Perú 856 Bolivia 9,377 Dominica 29,810 Venezuela 33,543 Surinam 34,000 Jamaica 40,900 San Vicente y las Granadinas 43,810 Nicaragua 44,402 República Dominicana 62,429 Belice 64,400 Brasil 72,468 Santa Lucía 72,795 México 81,044 Honduras 183,400 Panamá 489,805 Guatemala 857,164 Colombia 1,710,949 Costa Rica 2,113,652 Ecuador 4,095,191 TOTAL 10,041,367

160 PAÍSTONELADAS MÉTRICAS Guayana 10 Chile 18 Paraguay 66 El Salvador 72 Trinidad y Tobago 87 Argentina 412 Granada 707 Perú 856 Bolivia 9,377 Dominica 29,810 Venezuela 33,543 Surinam 34,000 Jamaica 40,900 San Vicente y las Granadinas 43,810 Nicaragua 44,402 República Dominicana 62,429 Belice 64,400 Brasil 72,468 Santa Lucía 72,795 México 81,044 Honduras 183,400 Panamá 489,805 Guatemala 857,164 Colombia 1,710,949 Costa Rica 2,113,652 Ecuador 4,095,191 TOTAL 10,041,367

161 3.1 Introducción 3.2 Media muestral 3.3 Mediana muestral 3.4 Moda muestral 3.5 Varianza muestral y desviación típica muestral 3.6 Conjuntos de datos normales y la regla empírica 3.7 Coeficiente de correlación muestral

162

163 Otro indicador de la tendencia central es la moda muestral, que se define como el dato que aparece con mayor frecuencia.

164 Si no existe un único valor que aparezca con mayor frecuencia en el conjunto de datos, aquellos valores que tengan la máxima frecuencia se denominan valores modales. En esta situación se dice que no existe un valor único de la moda muestral.

165 Resulta muy sencillo obtener el valor modal a partir de una tabla de frecuencias, puesto que coincide con aquel valor que tenga mayor frecuencia.

166 Los siguientes datos representan los tiempos de progresión, medidos en meses, de un tipo particular de tumor cerebral, llamado glioblastoma, en 65 pacientes: 6, 5, 37, 10, 22, 9, 2, 16, 3, 3, 11, 9, 5, 14, 11, 3, 1, 4, 6, 2, 7, 3, 7, 5, 4, 8, 2, 7, 13, 16, 15, 9, 4, 4, 2, 3, 9, 5, 11, 3, 7, 5, 9, 3, 8, 9, 4, 10, 3, 2, 7, 6, 9, 3, 5, 4, 6, 4, 14, 3, 12, 6, 8, 12, 7

167 Meses

168 MesesPacientes Total65 De esta tabla de frecuencias es claro que la moda muestral es 3 meses.

169

170 Moda

171 Meses Pacientes Total 65 Moda

172 Meses La media muestral es 7.4 meses 2.La mediana muestral es 6 meses 3.La moda muestral es 3 meses MesesPacientes Total65

173 Media Mediana Moda

174 Se tira un dado 200 veces. La tabla muestra los resultados obtenidos

175 Número obtenidoFrecuencia Total200

176 Número obtenidoFrecuencia Moda muestral

177

178 What is the modal cause of death due to accidents or violence for white males? Can the mean or median be calculated for the cause of death? Distribución de las causas de muerte de hombres blancos debido a accidentes o a violencia: Causa de muerteNúmero Coche 30,500 Otros accidentes 27,500 Suicidio 20,234 Homicidio 8,342

179 Causa de muerteNúmero Coche 30,500 Otros accidentes 27,500 Suicidio 20,234 Homicidio 8,342

180 Dado que se trata de datos nominales, la media y la mediana no tienen sentido. La moda es accidentes de coche. Distribución de las causas de muerte de hombres blancos debido a accidentes o a violencia. Causa de muerteNúmero Coche 30,500 Otros accidentes 27,500 Suicidio 20,234 Homicidio 8,342

181 3.1 Introducción 3.2 Media muestral 3.3 Mediana muestral 3.4 Moda muestral 3.5 Varianza muestral y desviación típica muestral 3.6 Conjuntos de datos normales y la regla empírica 3.7 Coeficiente de correlación muestral

182

183 Aunque hasta ahora se han introducido estadísticos que miden la tendencia central de un conjunto de datos, todavía no se han considerado aquellos que miden su dispersión o variabilidad.

184 Una forma de medir la variabilidad de un conjunto de datos consiste en considerar las desviaciones de los datos de un valor central. El valor central que se utiliza más frecuentemente para este propósito es la media muestral.

185 Los siguientes datos representan los tiempos de progresión, medidos en meses, de un tipo particular de tumor cerebral, llamado glioblastoma, en 65 pacientes: 6, 5, 37, 10, 22, 9, 2, 16, 3, 3, 11, 9, 5, 14, 11, 3, 1, 4, 6, 2, 7, 3, 7, 5, 4, 8, 2, 7, 13, 16, 15, 9, 4, 4, 2, 3, 9, 5, 11, 3, 7, 5, 9, 3, 8, 9, 4, 10, 3, 2, 7, 6, 9, 3, 5, 4, 6, 4, 14, 3, 12, 6, 8, 12, 7

186 Meses Pacientes Total 65

187 Meses La media muestral es 7.4 meses 2.La mediana muestral es 6 meses 3.La moda muestral es 3 meses MesesPacientes Total65

188 Media Mediana Moda

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210 En la tabla siguiente se muestran los consumos per cápita de leche, en los años comprendidos entre 1983 y 1987, en Estados Unidos. Los datos provienen del Departamento de Agricultura de Estados Unidos, Consumo de alimentos, precios y gastos, anuario. AñoConsumo (galones per cápita)

211 AñoConsumo (galones per cápita)

212 Año Consumo (galones per cápita) TOTAL131.1

213 AñoConsumo (galones per cápita)xi-x(xi-x)

214 PeriodoMillones de dólares Inversión extranjera directa en México en el sector agropecuario (millones de dólares):

215 PeriodoAgropecuario

216 PeriodoAgropecuario

217 Inversión extranjera directa en México en el sector agropecuario (millones de dólares) PeriodoAgropecuario Total561.9

218 Inversión extranjera directa en México en el sector agropecuario (millones de dólares): PeriodoMontoMonto menos la mediaAl cuadrado , , , , , , , , ,795.21

219 Los siguientes datos representan los tiempos de progresión, medidos en meses, de un tipo particular de tumor cerebral, llamado glioblastoma, en 65 pacientes: 6, 5, 37, 10, 22, 9, 2, 16, 3, 3, 11, 9, 5, 14, 11, 3, 1, 4, 6, 2, 7, 3, 7, 5, 4, 8, 2, 7, 13, 16, 15, 9, 4, 4, 2, 3, 9, 5, 11, 3, 7, 5, 9, 3, 8, 9, 4, 10, 3, 2, 7, 6, 9, 3, 5, 4, 6, 4, 14, 3, 12, 6, 8, 12, 7

220 Meses Pacientes Total 65

221 Meses La media muestral es 7.4 meses 2.La mediana muestral es 6 meses 3.La moda muestral es 3 meses MesesPacientes Total65

222 Media Mediana Moda

223 Mf MxfM- (M- )^2[(M- )^2]xf ,

224 Meses La varianza es de meses cuadrados. 2.La desviación típica es de 5.64 meses. 1.La media muestral es 7.4 meses 2.La mediana muestral es 6 meses 3.La moda muestral es 3 meses

225 Media Desviación típica

226

227

228

229

230

231 En las estadísticas, un valor atípico es una observación que es numéricamente distante del resto de los datos.

232 Las estadísticas derivadas de los conjuntos de datos que incluyen valores atípicos serán frecuentemente engañosas. Un valor atípico es una observación que es numéricamente distante del resto de los datos.

233 Por ejemplo, en el cálculo de la temperatura media de 10 objetos en una habitación, si la mayoría tienen entre 20 y 25 ºC, pero hay un horno a 350 °C, la mediana de los datos puede ser 23, pero la temperatura media será 55. En este caso, la mediana refleja mejor la temperatura de la muestra al azar de un objeto que la media.

234 Los valores atípicos pueden ser indicativos de datos que pertenecen a una población diferente del resto de la muestra establecida. Un valor atípico es una observación que es numéricamente distante del resto de los datos.

235 Tomando como referencia la diferencia entre el primer cuartil Q 1 y el tercer cuartil Q 3, o valor intercuartil, se considera un valor atípico el que se encuentra 1,5 veces esa distancia de uno de esos cuartiles (atípico leve) o a 3 veces esa distancia (atípico extremo).

236

237

238 Los valores atípicos pueden tener como origen muchas causas anómalas.

239 Un aparato físico para tomar mediciones puede haber sufrido una falla temporal. Puede haber habido un error en la transmisión de los datos o la transcripción. Puede haber habido un fraude o un boicot. Los valores atípicos pueden tener como origen muchas causas anómalas.

240 Los valores atípicos surgen debido a los cambios en el comportamiento del sistema, al comportamiento fraudulento, a errores humanos, a errores instrumentales o simplemente por las desviaciones naturales en las poblaciones. La muestra puede haber sido contaminada con elementos de fuera de la población que se está examinando.

241 Alternativamente, un valor atípico podría ser el resultado de un error en la teoría supuesta, y exigiría una investigación más exhaustiva por parte del investigador.

242 Precaución: A menos que se pueda determinar que la desviación no es significativa, es poco aconsejable hacer caso omiso de la presencia de valores atípicos. Los valores extremos que no se puede explicar fácilmente exigen atención especial.

243

244 Un diagrama de caja es una gráfica, basada en cuartiles, mediante el cual se visualiza un conjunto de datos.

245 Es una gráfica que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución

246 Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no está en el centro del rectángulo, la distribución no es simétrica. Son útiles para ver la presencia de valores atípicos.

247 Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".

248 1. Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el intervalo intercuartil (IQR) 2. Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea. 3. Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos. 4. Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).

249

250

251

252

253

254 Los datos siguientes representan la acidez de 40 precipitaciones de lluvia sucesivas en el estado de Minnesota. La acidez se mide en una escala de pH que varía de 1 (muy ácida) a 7 (neutra): 3.71, 4.23, 4.16, 2.98, 3.23, 4.67, 3.99, 5.04, 4.55, 3.24, 2.80, 3.44, 3.27, 2.66, 2.95, 4.70, 5.12, 3.77, 3.12, 2.38, 4.57, 3.88, 2.97, 3.70, 2.53, 2.67, 4.12, 4.80, 3.55, 3.86, 2.51, 3.33, 3.85, 2.35, 3.12, 4.39, 5.09, 3.38, 2.73, 3.07

255 Los datos siguientes representan la acidez de 40 precipitaciones de lluvia sucesivas en el estado de Minnesota. La acidez se mide en una escala de pH que varía de 1 (muy ácida) a 7 (neutra) : PH de la lluvia

256 PH de la lluvia Suma de todos los datos Número total de datos40 Media muestral3.61

257 PH de la lluviaPH de la lluvia Media muestral3.61 Diferencias a la media Cuadrados de las diferencias

258 PH de la lluviaPH de la lluvia Media muestral3.61 Cuadrados de las diferencias Suma de las diferencias al cuadrado25.25 Número total de datos40 Varianza0.65

259 PH de la lluvia Acomodando los datos de menor a mayor PH de la lluviaPH de la lluvia

260 PH de la lluviaPH de la lluvia

261 PH de la lluviaPH de la lluvia

262 PH de la lluviaPH de la lluvia

263 PH de la lluviaPH de la lluvia

264 PH de la lluviaPH de la lluvia

265 PH de la lluviaPH de la lluvia

266 PH de la lluviaPH de la lluvia Media muestral Mediana muestral

267 PH de la lluviaPH de la lluvia Media muestral Desviación típica

268 PH de la lluviaPH de la lluvia Mediana muestral IRQ

269

270 PH de la lluviaPH de la lluvia

271 3.1 Introducción 3.2 Media muestral 3.3 Mediana muestral 3.4 Moda muestral 3.5 Varianza muestral y desviación típica muestral 3.6 Conjuntos de datos normales y la regla empírica 3.7 Coeficiente de correlación muestral

272 En la práctica, la mayoría de los conjuntos de datos grandes que uno encuentra tienen histogramas similares en cuanto a la forma.

273 Por lo general, esos histogramas son simétricos con respecto al punto de máxima frecuencia y decrecen a ambos lados de ese máximo, siguiendo una forma acampanada. En la práctica, la mayoría de los conjuntos de datos grandes que uno encuentra tienen histogramas similares en cuanto a la forma.

274 Tales conjuntos de datos se dice que son normales. Sus histogramas se denominan histogramas normales. En la práctica, la mayoría de los conjuntos de datos grandes que uno encuentra tienen histogramas similares en cuanto a la forma. Por lo general, esos histogramas son simétricos con respecto al punto de máxima frecuencia y decrecen a ambos lados de ese máximo siguiendo una forma acampanada

275 Se dice que un conjunto de datos es normal si el histograma que lo describe tiene las propiedades siguientes: 1. La máxima altura se alcanza en el intervalo central. 2. Si nos movemos desde el intervalo central en cualquier dirección, la altura declina de tal modo que el histograma completo tiene una forma acampanada. 3. El histograma es simétrico con respecto al intervalo central.

276 Calificación Número de alumnos TOTAL75

277

278

279

280

281 ÍndiceAltura (m)Peso (kg)ÍndiceAltura (m)Peso (kg)ÍndiceAltura (m)Peso (kg)ÍndiceAltura (m)Peso (kg) Alturas y pesos de 60 individuos

282

283 Altura (m)

284 Altura (m)Peso (kg) Media Varianza Desviación típica Alturas y pesos de los 60 individuos

285

286 Intervalo de claseCantidad a a a a a a a a a

287

288

289 Altura (m) Altura (m) Media 1.73 Desviación típica 0.046

290 Altura (m) Altura (m) Media 1.73 Desviación típica 0.046

291 Altura (m) Altura (m) Media 1.73 Desviación típica 0.046

292 Altura (m) Altura (m) Media 1.73 Desviación típica 0.046

293

294 Las alturas de los 60 hombres siguen una distribución aproximadamente normal.


Descargar ppt "1.Introducción a la Estadística 2.Descripción de los conjuntos de datos 3.Uso de la Estadística para sintetizar conjuntos de datos 4.Probabilidad 5.Variables."

Presentaciones similares


Anuncios Google