Medidas de Ubicación y Dispersión Profesor Antonio Millán A.

Slides:



Advertisements
Presentaciones similares
Descripción de los datos: medidas de ubicación
Advertisements

Capítulo 3 Descripción de datos, medidas de tendencia central
Tratamiento de datos y azar
Descripción de los datos: medidas de dispersión
Descripción de los datos: medidas de ubicación
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
ESTADÍSTICAS DESCRIPTIVAS MEDIDAS DE TENDENCIA CENTRAL Psic. Gerardo A. Valderrama M.
Medidas de tendencia central Profesor Alberto Alvaradejo IVº Medio 2016 Estadística y Probabilidad.
ESTADÍSTICA DESCRIPTIVA MEDIDAS DE VARIABILIDAD Psic. Gerardo A. Valderrama M.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
ESTADÍSTICA Medidas de Tendencia no Central. Medidas de Tendencia no Central. Medidas de Variabilidad Medidas de Variabilidad.
1. Parámetros estadísticos: Medidas de Centralización: Medias, moda y Mediana Medidas de Posición:Cuartiles,Deciles,Centiles Medidas de Dispersión: Rango,
MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS.. MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS  ¿Qué son las medidas de dispersión?  Parámetros estadísticos que.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
DETERMINACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL POBLACIONAL Y MUESTRAL. POR: JUDITH MARITZA JUAN CARLOS ANA MARTIN AXEL GILBERTO FÁTIMA.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
1  Las medidas de dispersión miden la variabilidad de los datos con relación a una medida de tendencia central.  Las medidas descriptivas más comunes.
1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS 8° BÁSICO
Profesora: Susana Abraham C.
ESTADÍSTICA UNIDIMENSIONAL
DISTRIBUCION DE PROBABILIDAD NORMAL
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
Medidas de Tendencia Central
ESTADÍSTICA UNIDIMENSIONAL
Clase 8: Contraste de Hipótesis
ESTADÍSTICA DESCRIPTIVA: OBTENCIÓN Y ORGANIZACIÓN DE LOS DATOS
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
ESTADÍSTICA UNIDIMENSIONAL
estadistica
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
ANALISIS DE DATOS CUANTITATIVOS
Estadística.
Estadística Unidimensional Conceptos básicos.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS Y PARA TABLAS.
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Dispersión. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión.
ETAPA DE ANÁLISIS E INTERPRETACIÓN DE DATOS: MEDIDAS DE RESUMEN
FACULTAD DE CIENCIAS JURÍDICAS (RELACIONES LABORALES)
ANÁLISIS ESTADÍSTICO PROFESOR: PIA VEGA CODOCEO. MEDIA ARITMÉTICA Es la suma de los valores de una variable dividida por, él numero de ellos. La media.
Universidad Peruana de Ciencias Aplicadas Matemática Básica (C.C.) Sesión 13.1 Ciclo
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
MEDIA GEOMÉTRICA BACHILLERATO NO. 17 “ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN” MAESTRA: ERNESTINA CAMPOS MARTÍNEZ. REGINA GUADALUPE RADILLO MASIAS. 5°
AJUSTE DE CURVAS TEMA #10. AJUSTE DE CURVAS Si se necesita la versión simplificada de una función complicada. Una manera de hacerlo es calcular valores.
Excel Estadístico Medidas de Dispersión.
Contenidos Medidas de Tendencia Central Medidas de Variabilidad
PROBABILIDAD Y ESTADISTICA APLICADA A LOS NEGOCIOS
ESTADÍSTICA.
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Medidas centrales Por E. Skerrett.
Rango = Valor máximo – Valor mínimo
CONCEPTO DE ESTIMADOR ES UNA REGLA O MÉTODO QUE DICE COMO CALCULAR LA ESTIMACIÓN DE UN PARÁMETRO BASÁNDOSE EN LA INFORMACIÓN DE UNA MUESTRA, GENERALMENTE.
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando.
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Parámetros y estadísticos  Parámetro: Es una cantidad numérica calculada sobre una población - La altura media de los individuos de un país - La idea.
Medidas de variabilidad o dispersión RANGO-DESVIACIÓN ESTÁNDAR- VARIANZA-COEFICIENTE DE VARIACIÓN- RANGO INTERCUARTÍLICO.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
MEDIDAS DE TENDENCIA CENTRAL. Tendencia central Se encarga de encontrar un dato de una distribución alrededor del cual giran todos los demás. Los indicadores.
Transcripción de la presentación:

Medidas de Ubicación y Dispersión Profesor Antonio Millán A. Descripción de datos: Medidas de Ubicación y Dispersión Profesor Antonio Millán A. Monterrey, N. L. Sep 17 de 2015 (Cap. 3)

Objetivos Explicar el concepto de tendencia central. Identificar y calcular la media aritmética. Calcular e interpretar la media ponderada. Determinar la mediana. Identificar la moda. Calcular la media geométrica. Explicar y aplicar medidas de dispersión. Calcular e interpretar la varianza y la desviación estándar. Explicar el teorema de Chebyshev y la regla empírica. Calcular la media y la desviación estándar de datos agrupados.

Ubicación y Dispersión Medidas de Ubicación: Centro de un conjunto de valores Promedios Medidas de dispersión: Variabilidad de los datos

Media poblacional Para datos no agrupados, la media poblacional es la suma de los valores de los elementos de la población entre el valor total de la población: Es un parámetro, porque es una medida característica de una población. donde µ es la media poblacional N es el número total de observaciones en la población. X es un valor particular.  indica la operación de suma. μ = ΣX / N

EJEMPLO La familia López posee cuatro vehículos. A continuación se muestra el kilometraje leído en cada vehículo: 56 000, 23 000, 42 000 y 73 000. Encuentre el kilometraje promedio. La media es: = (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500 μ = ΣX / N

Media muestral Para datos no agrupados, la media muestral es la suma de los valores de los elementos de la muestra divididos entre el número total de observaciones de la muestra. Es un estadístico porque es una medida característica de la muestra. Donde X es la media muestral n es el número de observaciones en la muestra X = ΣX / n

EJEMPLO Una muestra de cinco empleados recibió el año pasado un bono con estas cantidades: $14 000, $15 000, $17 000, $16 000 y $15 000. Encuentre el promedio de bonificación para estos empleados. Como estos valores representan un tamaño de muestra igual a 5, la media muestral es: (14 000 + 15 000 +17 000 + 16 000 +15 000)/5 = $15 400. x=15400

Propiedades de la media aritmética Cada conjunto de datos de intervalo o de razón tiene una media única. En el cálculo de la media se incluyen todos los valores. La media se altera al aparecer valores grandes o pequeños de los datos. La media aritmética es la única medida de tendencia central donde la suma de las desviaciones de cada valor con respecto a la media siempre es igual a cero.

EJEMPLO Considere el conjunto de valores : 3, 8 y 4. La media es 5. Ilustrando la cuarta propiedad, (3-5) + (8-5) + (4-5) = -2 +3 - 1 = 0. En otras palabras:

Actividad en clase Trabajar en parejas y responder los incisos del problema 1 Discutir resultados y proceso de solución Resolver el problema 2 y sus incisos

Media ponderada La media ponderada de un conjunto de números X1, X2, ..., Xn, con sus pesos correspondientes w1, w2, ...,wn, se calcula por medio de la siguiente fórmula:

EJEMPLO En un sábado por la tarde, durante una hora, el barman de la taberna La cabaña de Pedro sirvió cincuenta bebidas. Calcule la media ponderada del precio de las bebidas. (precio [$], número de bebidas): (50,5), (75,15), (90,15), (110,15). La media ponderada es: (50x5 + 75x15 + 90x15 + 110x15)/(5 + 15 + 15 + 15) = $4375/50 = $87.5

La mediana Mediana: punto medio de los valores después de que han sido ordenados del menor al mayor (ascendente) o del mayor al menor (descendente). Hay una determinada cantidad de valores tanto arriba como debajo de la mediana en el arreglo de los datos. Nota: para un conjunto par de valores la mediana será la media aritmética de los dos números localizados a la mitad.

Propiedades de la mediana Solamente existe una mediana por cada conjunto de datos. A la mediana no la afectan valores extremadamente grandes o pequeños, en consecuencia es una medida de tendencia central valiosa cuando aparecen ese tipo de valores. Se puede calcular para datos de nivel de razón, de intervalo y ordinales. Se puede calcular para distribuciones de frecuencia con extremos abiertos si la mediana no se ubica en una clase abierta.

EJEMPLO Calcule la mediana de los siguientes datos. En una muestra de cinco estudiantes las edades son: 21, 25, 19, 20 y 22. Arreglando los datos de manera ascendente se obtiene: 19, 20, 21, 22, 25. Entonces la mediana es 21. Las alturas de cuatro jugadores de basquetbol, en pulgadas, son 76, 73, 80 y 75. Arreglando los datos de manera ascendente se obtiene : 73, 75, 76, 80. Entonces la mediana es 75.5.

La moda La moda es el valor de la observación que aparece con mayor frecuencia.

EJEMPLO Las calificaciones de un examen para diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificación 81 es la que más veces aparece, la calificación modal es 81. Si hubiera 2 repetidas, sería bimodal. Más de 2 polimodal.

Posiciones relativas de la Media, Mediana y Moda en tres tipos genéricos de distribución de datos

Las Posiciones relativas de la Media, Mediana y la Moda

Las Posiciones relativas de la Media, Mediana y la Moda

Las Posiciones relativas de la Media, Mediana y la Moda

Las Posiciones relativas de la Media, Mediana y la Moda

¿Cómo se vive la sexualidad alrededor del mundo? Son los Brasileños quienes se inician en el sexo antes que nadie, según se afirma en un estudio reciente global. El Brasileño medio tiene su primera relación a los 17 años y tres meses. Los Indúes son los que más esperan, reservándose, en promedio hasta los 22 años y cinco meses. El promedio de edad para perder la virginidad en el mundo, combinando los 13 países, es de 19 años y tres meses. The face of global sex, estudio de la empresa Durex con adultos entre los 18 y 64 años en 37 países.

País Promedio India 22.5 Singapur 22 Japón 20.4 España 19.5 Italia 19.4 Sudáfrica México 19.1 Francia 18.7 USA 18.4 Reino Unido 18.3 Australia 18.1 Alemania 17.8 Brasil 17.3 19.3 ddd

País Promedio Población India 22.5 1080 Singapur 22 5 Japón 20.4 127 España 19.5 45 Italia 19.4 58 Sudáfrica 44 México 19.1 110 Francia 18.7 60 USA 18.4 300 Reino Unido 18.3 Australia 18.1 21 Alemania 17.8 82 Brasil 17.3 191 19.3 2183  

País Promedio Población   India 22.5 1080 24300 Singapur 22 5 110 Japón 20.4 127 2590.8 España 19.5 45 877.5 Italia 19.4 58 1125.2 Sudáfrica 44 853.6 México 19.1 2101 Francia 18.7 60 1122 USA 18.4 300 5520 Reino Unido 18.3 1098 Australia 18.1 21 380.1 Alemania 17.8 82 1459.6 Brasil 17.3 191 3304.3 19.3 2183 44842.1 20.5

Media Geométrica Datos NO enlazados en el tiempo La media geométrica (MG) de un conjunto de n números se define como la raíz n-ésima del producto de n números. La fórmula es: La media geométrica es útil para el promedio de porcentajes, proporciones, índices o tasas de crecimiento.

EJEMPLO (interés en bonos) Datos NO enlazados en el tiempo La tasa de interés en tres bonos fue de 5, 7 y 4 por ciento. La media geométrica es =5.192. La media aritmética es (7 + 5 + 4)/3 =5.333. La MG proporciona un valor para la ganancia más conservador, ya que no está muy ponderada por la tasa del 7 o del 4 por ciento.

Media Geométrica (interés en bonos) Datos enlazados en el tiempo Suponga que este año recibe un 5% de incremento en sueldo y un 15% porciento el siguiente año. El porcentaje promedio anual de incremento es 9.886, no 10.0

EJEMPLO (retorno sobre inversión) Datos enlazados en el tiempo El retorno sobre la inversión ganado por la compañía Atkins construction durante cuatro años sucesivos fue: 30, 20, - 40 y 200 porciento. ¿Cuál es la media geométrica de la tasa de retorno sobre la inversión? MG = 29.4%

Media Geométrica Datos enlazados en el tiempo no porcentuales La media geométrica también permite determinar el porcentaje promedio del incremento en las ventas, la producción o cualquier serie económica o administrativa de un periodo a otro. La fórmula para este tipo de problemas es:

EJEMPLO (Escuelas Estadounidenses) El número total de mujeres que se encuentran en las escuelas estadounidenses se incrementó de 755 000 en 1990 a 835 000 en 1999. De aquí; n = 9, resultado de 1999 - 1990. Es decir, la tasa media de crecimiento geométrico es 1.13%.

Actividad en clase Trabajar en parejas y responder los incisos del problema 1 Discutir resultados y proceso de solución Resolver el problema 2 y sus incisos

Dispersión ¿Por qué estudiar la dispersión? Una medida de localización como la media o la mediana, solo describen el centro de los datos, pero no indican algo sobre la dispersión de los mismos. Por ejemplo, si el guía en de una excursión le dijo que el río que tiene frente a Ud. tiene en promedio 1 metro de profundidad, ¿lo cruzaría a pie sin información adicional? Probablemente no, ya que le gustaría conocer algo acerca de la variación de la profundidad. Una segunda razón para estudiar la dispersión es comparar la homogeneidad (heterogeneidad), en dos o más distribuciones.

Ejemplos de Dispersiones

Medidas de Dispersión: datos no agrupados Para datos no agrupados, el rango es la diferencia entre el valor mayor y el menor en un conjunto de datos. RANGO = valor mayor – valor menor EJEMPLO: Una muestra de cinco graduados en contabilidad reveló los sueldos siguientes: $22,000, $28,000, $31,000, $23,000, $24,000. El rango es: $31,000 – $22,000 = $9,000

Desviación media Desviación media: la media aritmética del valor absoluto de las desviaciones con respecto a la media aritmética.

EJEMPLO Los pesos de una muestra de canastillas que contienen libros en un almacen son 103, 97, 101, 106, 103 (en libras). X = 510/5 = 102 lbs. IX – X)I = 1+5+1+4+1 = 12 DM = 12/5 = 2.4 Entonces, la desviación media de los pesos de las canastillas son 2.4 libras para un peso medio de 102 lbs.

3-34 Varianza poblacional La varianza poblacional para datos no agrupados es la media aritmética de las desviaciones al cuadrado para la media poblacional.

EJEMPLO Las edades de la familia Dunn son 2, 18, 34 y 42 años. ¿Cuál es la varianza poblacional?

Varianza poblacional continuación Una fórmula alternativa para la varianza poblacional es:

La desviación estándar poblacional La desviación estandar poblacional ( ) es la raíz cuadrada de la varianza poblacional. Para el EJEMPLO 13 la desviación estándar de la población es 15.19 (raíz cuadrada de 230.81).

Varianza muestral La varianza muestral permite estimar la varianza de la población.

EJEMPLO Una muestra de cinco salarios (en dólares) por hora para diversos trabajos es: $7, $5, $11, $8, $6. Encuentre la varianza. X = 37/5 = 7.40 = 21.2/(5-1) = 5.3

Desviación estándar muestral La desviación estándar muestral es la raíz cuadrada de la varianza muestral. Para el ejemplo anterior la desviación estándar de la muestra es = 2.30

Actividad en clase Trabajar en parejas Resolver el planteamiento Sacar foto y depositar en foro “Ejercicios de clase”

Interpretación y usos de la desviación estándar Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de los valores que se encuentra dentro de k desviaciones estándar es al menos 1 – (1/ k2), donde k es una constante mayor que 1.

Interpretación y usos de la desviación estándar Regla empírica: para cualquier distribución simétrica en forma de campana, aproximadamente el: 68% de las observaciones estarán entre de la media ( ); 95% de las observaciones estarán entre de la media ( ); 99.7% de las observaciones estarán entre de la media ( ).

m-3s m-2s m-1s m m+1s m+2s m+ 3s

Dispersión relativa El coeficiente de variación es el cociente de la desviación estándar entre la media aritmética, expresado en porcentaje como:

La media de datos agrupados La media de una muestra de datos organizados en una distribución de frecuencias se calcula con la siguiente fórmula:

EJEMPLO En una muestra de diez cines en una área metropolitana grande se contó el total de películas que exhibieron la semana pasada. Calcule el número medio de exhibiciones en los cines. X = marca de clase

EJEMPLO continuación 61/10 = 6.1 películas

La mediana de datos agrupados La mediana de una muestra de datos organizados en una distribución de frecuencias se calcula con la fórmula siguiente: Mediana = L + [(n/2 - FA)/f] (i) donde L es el límite inferior de la clase donde se encuentra la mediana; FA, la frecuencia acumulada anterior a la clase de la mediana; f, la frecuencia de la clase donde está la mediana, e i, el intervalo de la clase mediana.

Búsqueda de la clase mediana 3-23 Búsqueda de la clase mediana Para determinar la clase mediana en datos agrupados: Construya una distribución de frecuencia acumulada. Divida el número total de datos entre 2. Determine la clase que contiene este valor. Por ejemplo, si n=50, 50/2 = 25, entonces determine la clase que contiene el valor 25, ésta será la clase mediana.

3-24 EJEMPLO La clase mediana es 5-6, debido a que ésta contiene el valor 5 (n/2 =5)

EJEMPLO continuación De la tabla, L=5, n=10, f=3, i=2, CF=3. 3-25 EJEMPLO continuación De la tabla, L=5, n=10, f=3, i=2, CF=3. Entonces, mediana= 5 + [((10/2) - 4)/3](2)= 6.33

La moda para datos agrupados La moda para datos agrupados se aproxima con el punto medio de clase que contiene la mayor frecuencia de clase. Las modas en el EJEMPLO 10 son 5.5 y 9.5. Cuando dos valores se presentan el mayor número de veces, la distribución se denomina bimodal.

La moda para datos agrupados También puede usarse la siguiente fórmula: Moda = L + [Da/(Db+Da)] (I ) Donde: L=Límite inferior de la clase modal. Da=Diferencia entre la frecuencia de la clase modal y la clase que la antecede. Db=Es la diferencia entre la frecuencia de la clase modal y la clase que le sigue. i=Intervalo de la clase modal. La clase modal es o son aquellas clases con mayor frecuencia

La moda para datos agrupados Tomado de la tabla del ejemplo anterior. L = 5, Da = 3-2 = 1, Db = 3-1 = 2, I = 2 Moda = 5 + [1/(2+1)] (2) = 5.67 Pero como existe otra clase con el mismo número de frecuencias entonces tenemos 2 modas (bimodal). Tenemos: L = 9, Da = 3-1 = 2, Db = 3-0 = 3, I = 2 Moda = 9 + [2/(3+2)] (2) = 9.8

Varianza muestral para datos agrupados La fórmula de la varianza muestral para datos agrupados se usa como una estimación de la varianza poblacional: donde f es la frecuencia de clase y X es el punto medio de la clase.

Actividad en clase Trabajar en parejas Resolver el planteamiento Sacar foto y depositar en foro “Ejercicios de clase”

Medidas de Dispersión: datos no agrupados Para datos no agrupados, el rango es la diferencia entre el valor mayor y el menor en un conjunto de datos. Rango = valor mayor – valor menor Desviación media: la media aritmética del valor absoluto de las desviaciones con respecto a la media aritmética.

3-34 Varianza poblacional varianza poblacional para datos no agrupados es la media aritmética de las desviaciones al cuadrado para la media poblacional. Desviación estandar poblacional ( ) es la raíz cuadrada de la varianza poblacional.

Interpretación y usos de la desviación estándar Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de los valores que se encuentra dentro de k desviaciones estándar es al menos 1 – (1/ k2), donde k es una constante mayor que 1.

m-3s m-2s m-1s m m+1s m+2s m+ 3s

Dispersión relativa Coeficiente de variación es el cociente de la desviación estándar entre la media aritmética, expresado en porcentaje como: