Medidas de la tendencia central y de la dispersión

Slides:



Advertisements
Presentaciones similares
Curso: Seminario de estadística Aplicada a la investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio.
Advertisements

La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
MEDIDAS DE TENDENCIA CENTRAL
Instructor: Lic. Cristian R. Arroyo L.
Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
Medidas de centralización para datos no agrupados
ESTADÍSTICA DESCRIPTIVA
Descripción de los datos: medidas de ubicación
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Métodos Cuantitativos Aplicados a Los Negocios.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
MÉTODOS ESTADÍSTICOS.
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Estadística Administrativa I
Capítulo 3: Medidas de posición
MEDIDAS DE TENDENCIA CENTRAL A.7.1.
ESTADISTICA I Medidas de tendencias centrales
Parámetros estadísticos
FRANCISCO JAVIER RODRÍGUEZ
UNIVERCIDAD JUAREZ DE ESTADO DE DURANGO COLEGIO DE CIENCIAS Y HUMANIDADES MATERIA ESTADISTICA RUTH Y KARLA.
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Dispersión Estadística E.S.O.
ESTADIGRAFOS DE DISPERSION
MEDIDAS DE TENDENCIA CENTRAL
UNIVERSIDAD TECNICA DE COTOPAXI
Medidas de resumen.
Estadística Descriptiva continuación
ESTADÍSTICA 4° MEDIO
Datos: Estadística.
Tema 2: Parámetros Estadísticos
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Medidas de Posición y Centralización Estadística E.S.O.
ESTADÍSTICA DESCRIPTIVA
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
ESTADÍSTICA.
ANALISIS ,GRAFICOS Y MEDIDAS ESTADISTICAS
Historia de la Estadística
ANÁLISIS E INTREPRETACIÓN DE DATOS
Descripción de los datos: medidas de ubicación
Medidas de Dispersión.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Medidas De Localización
MEDIDAS DE TENDENCIA CENTRAL
Métodos Cuantitativos
Sesión 8 Tema: Estadística descriptiva Objetivo:
ESTADÍSTICA UNIDIMENSIONAL
Estadística Reporte Ejecutivo
MEDIDAS DE TENDENCIA CENTRAL
Medidas de dispersión: Varianza y desviación estándar
Objetivo: Recordar elementos presentes en el estudio de la estadística
MEDIDAS DE TENDENCIA CENTRAL
Coeficiente de variación
Historia de la Estadística
DIPLOMADO DE POSTGRADO
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Estadística descriptiva
Estadística y probabilidad aplicada a los negocios
ESTADÍSTICA DOCENTE :JUDITH PATRICIA MARTÍN HERMOSILLO MULTIVERSIDAD LATINOAMERICANA CAMPUS TONALÁ BLOQUE IX. APLICA LA ESTADÍSTICA ELEMENTAL.
LOGO Medidas de posición Pedro Godoy G. Media Aritmética Valor representativo de un conjunto de datos Para datos no agrupados 1, x2, x3, x4,…………………………,
Medidas de tendencia central
Estadística y probabilidad
Transcripción de la presentación:

Medidas de la tendencia central y de la dispersión Datos no agrupados Datos no agrupados Recorrido Media aritmética Desviación media absoluta Mediana Moda Varianza y desviación típica Media aritmética ponderada Percentiles Media geométrica Datos agrupados Datos agrupados Percentiles Media aritmética Varianza y desviación típica Mediana Moda Conceptos relacionados Teorema de Chebyshev Regla empírica Sesgo Coeficiente de variación

Medidas de la tendencia central y de la dispersión Las medidas de tendencia central ttienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

MEDIA ARITMETICA Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio. Ejemplo Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.

Ejemplo: MEDIANA Encontrar la mediana para los siguientes datos: 4 1 2 3 4 2 2 1 5 5 3 SOLUCIÓN 1: Ordenar los datos. 1 1 2 2 2 3 3 4 4 5 5 2: Localizar el valor que divide en dos parte iguales el número de datos. La mediana es 3, dejando 5 datos a cada lado. Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.

ejemplo: “hallar la moda del siguiente conjunto de datos.” 14,15,16,18,5,7,5,9,15,5. se ordenan: 5,5,5,7,9,14,15,15,16,18. la moda es igual a 5.. La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. a una distribucion que tiene una sola moda se le denomina unimodal, si tiene dos datos que se repiten igualmente, se le conoce como bimodal, y si tiene tres o mas modas se le conoce como multimodal. si ningun dato se repite, entonces no tiene moda.

MEDIA ARITMETICA PONDERADA Tiene en cuenta la importancia relativa de las observaciones, es superior a la media aritmética simple

Por ejemplo, la media geométrica de 2 y 18 es MEDIA GOMETRICA Por ejemplo, la media geométrica de 2 y 18 es En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (digamos n números) es la raíz n-ésima del producto de todos los números.

DATOS AGRUPADOS En la mayor parte de casos tenemos un número grande de datos y tomamos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo cuando se trata de datos agrupados es diferente a la de los no agrupados.

MEDIA ARITMETICA Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es: La media aritmética es igual a la división de la sumatoria del producto de las clases por la frecuencia sobre el número de datos.

MEDIANA EJEMPLO Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla: Calificaciones 1 2 3 4 5 6 7 8 9 Número de alumnos 2 2 4 5 8 9 3 4 2 Se halla las frecuencias absolutas acumuladas .Asociada a la mediana para n impar, se obtiene . Ni-1< n/2 < Ni = N19 < 19.5 < N20 Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más. En el ámbito de la estadística, una mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos.

MODA Ejemplo Encontrar la estatura modal de un grupo que se encuentra distribuido de la siguiente forma: Entre 1.80 y 1.70 hay 6 estudiantes. Resolviendo: Se suma 0.075 (la distancia parcial) a 1.60 (el límite inferior), obteniéndose la moda. la moda es la observación que se presenta mas a menudo, se encontrara en la clase de frecuencia mas alta. Esta clase de máxima frecuencia se llama clase modal.

MEDIDAS DE DISPERSIÓN Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Datos no agrupados Ejemplo: 5,7,2,15,2,6,12,5,5,20,10. numero de personas que ayudaron a una causa. Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos.

EL RANGO O RECORRIDO ( R ): Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin) en un conjunto de datos. Rango para datos no agrupados; R = Xmáx.-Xmín = Xn-X1 Ejemplo: Se tienen las edades de cinco estudiantes universitarios de 1er año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que: R = Xn-X1 ) = 34-18 = 16 años

Desviación media absoluta La desviación media es la media de las diferencias en valor absoluto de los valores a la media. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable. Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética por la mediana M. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.

Ejemplo: Desviación media para datos no agrupados Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional. El número de preguntas buenas por materia se muestra a continuación: Materia Carlos Pedro Juan 1 2 7 5 9 6 3 10 4 8 SOLUCIÓN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?. Complementemos el análisis anterior calculando la desviación media: Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6).

CENTILES O PERCENTILES Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.

DATOS AGRUPADOS En la mayor parte de casos tenemos un número grande de datos y tomamos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo cuando se trata de datos agrupados es diferente a la de los no agrupados.

PERCENTILES: Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Para datos agrupados los deciles se calculan mediante la fórmula. k= 1,2,3,... 9 Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k

Como son datos agrupados, se utiliza la fórmula EJEMPLO.- Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla: Como son datos agrupados, se utiliza la fórmula Salarios No. De fa (I. De Clases) Empleados (f1) 200-299 85 300-299 90 175 400-499 120 295 500-599 70 365 600-699 62 427 700-800 36 463 Como son datos agrupados, se utiliza la fórmula Siendo

Varianza El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. El coeficiente de variación: Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.

Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 - 1/k2, donde k es una constante mayor que 1.

Regla empírica: Para una distribución de frecuencias simétrica de campana, aproximadamente 68% de las observaciones estará a más y menos una desviación estándar desde la media, aproximadamente 95% de tales observaciones se encontrará a más y menos dos desviaciones estándares de la misma; y prácticamente todas las observaciones (99,7%) se hallarán a más y menos tres desviaciones con respecto a la media.

SESGO No todas las distribuciones son normales, algunas están sesgadas a la izquierda o a la derecha, en ambos casos la moda es, por definición aquella observación que ocurre con más frecuencia .por consiguiente esta en el pico de la distribución ,por su propia naturaleza la media aritmética resulta afectada, sobre todo, por observaciones extremas, así pues, está desviada a la dirección del sesgo más que la mediana, que queda situada en algún punto entre la media aritmética y moda.

El coeficiente de variación Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación (las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea.

Ejemplo: Una distribución tiene x = 140 y σ = 28 Ejemplo: Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?