Contenidos Medidas de Tendencia Central Medidas de Variabilidad

Slides:



Advertisements
Presentaciones similares
MÉTODOS ESTADÍSTICOS.
Advertisements

Coeficiente de Variación
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
DIPLOMADO DE POSTGRADO
Medidas de tendencia central
Métodos Cuantitativos de Análisis de Datos I. Puntuaciones Típicas Escalas Derivadas.
Bloque IX - Estadística. Población vs muestra Medidas de dispersión Medidas de tendencia central.
REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
Bioestadística Escala Cuantitativa.. Trabajadores en una fábrica. RegistroSexoEdad (años)Talla (m)Peso (kg) 1Fem Masc Masc
ESTADÍSTICAS DESCRIPTIVAS MEDIDAS DE TENDENCIA CENTRAL Psic. Gerardo A. Valderrama M.
ESTADÍSTICA DESCRIPTIVA MEDIDAS DE VARIABILIDAD Psic. Gerardo A. Valderrama M.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
ESTADÍSTICA Medidas de Tendencia no Central. Medidas de Tendencia no Central. Medidas de Variabilidad Medidas de Variabilidad.
1. Parámetros estadísticos: Medidas de Centralización: Medias, moda y Mediana Medidas de Posición:Cuartiles,Deciles,Centiles Medidas de Dispersión: Rango,
MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS.. MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS  ¿Qué son las medidas de dispersión?  Parámetros estadísticos que.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
DETERMINACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL POBLACIONAL Y MUESTRAL. POR: JUDITH MARITZA JUAN CARLOS ANA MARTIN AXEL GILBERTO FÁTIMA.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
1  Las medidas de dispersión miden la variabilidad de los datos con relación a una medida de tendencia central.  Las medidas descriptivas más comunes.
1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS 8° BÁSICO
Profesora: Susana Abraham C.
ESTADÍSTICA UNIDIMENSIONAL
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
Medidas de Tendencia Central
ESTADÍSTICA UNIDIMENSIONAL
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
Estadística: conceptos básicos y definiciones.
INTERVALOS ES EL RECORRIDO DE TODOS LOS DATOS DENTRO DE UNA CLASE (Li-Ls) CANTIDAD DE CLASES: Raíz cuadrada N AMPLITUD DEL INTERVALO: 1. POR CONVENIENCIA.
estadistica
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
ANALISIS DE DATOS CUANTITATIVOS
Estadística.
Estadística Unidimensional Conceptos básicos.
Medidas de tendencia central y dispersión
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Dispersión. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión.
ETAPA DE ANÁLISIS E INTERPRETACIÓN DE DATOS: MEDIDAS DE RESUMEN
FACULTAD DE CIENCIAS JURÍDICAS (RELACIONES LABORALES)
ANÁLISIS ESTADÍSTICO PROFESOR: PIA VEGA CODOCEO. MEDIA ARITMÉTICA Es la suma de los valores de una variable dividida por, él numero de ellos. La media.
1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características.
Universidad Peruana de Ciencias Aplicadas Matemática Básica (C.C.) Sesión 13.1 Ciclo
Excel Estadístico Medidas de Dispersión.
Medidas de Tendencia Central
PROBABILIDAD Y ESTADISTICA APLICADA A LOS NEGOCIOS
CUANTILES.
ESTADÍSTICA.
BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO.
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
Medidas de tendencia central Cuartiles, Deciles, Percentiles.
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Rango = Valor máximo – Valor mínimo
MEDIDAS DE DISPERSION absolutas y relativas. INTRODUCCION La estadística es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos.
ESTADISTICA DESCRIPTIVA
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
Estadística Descriptiva
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
PROBABILIDAD Y ESTADISTICA.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Parámetros y estadísticos  Parámetro: Es una cantidad numérica calculada sobre una población - La altura media de los individuos de un país - La idea.
Medidas de variabilidad o dispersión RANGO-DESVIACIÓN ESTÁNDAR- VARIANZA-COEFICIENTE DE VARIACIÓN- RANGO INTERCUARTÍLICO.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Transcripción de la presentación:

Contenidos Medidas de Tendencia Central Medidas de Variabilidad Taller práctico 07/11/2018

Medidas Descriptivas Orden o Posición Centralización Dispersión Forma Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. (percentiles, cuantiles, etc.) Centralización Indican valores con respecto a los que los datos parecen agruparse ( Media, mediana y moda) Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización ( Varianza, desviación estándar, rango, coef. De variación, etc.) Forma Asimetría Apuntamiento o curtosis 07/11/2018

MEDIDAS DE TENDENCIA CENTRAL 07/11/2018

Medidas de tendencia central Corresponde a aquellos valores hacia los cuales tienden a aglomerarse los datos de una muestra. Las principales medidas de tendencia central son tres: promedio o media aritmética, mediana y moda. 07/11/2018

PROMEDIO O MEDIA ARITMÉTICA Estadígrafo de tendencia central más conocido y usado. Dada una colección de datos, el promedio se define como LA SUMA DE LOS DATOS DIVIDIDA POR LA CANTIDAD DE DATOS. Es aplicable a variables cuantitativas y no es aplicable a escalas nominales. La media aritmética, a menudo, puede mal interpretarse si los datos no entran en un grupo homogéneo. 07/11/2018

Si xi es el valor de la variable y ni su frecuencia, tenemos que: Si los datos están agrupados utilizamos las marcas de clase, es decir ci en vez de xi. 07/11/2018

Ventajas y desventajas de usar la media Concepto familiar para la mayoría de las personas y es intuitivamente claro. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es única debido a que cada conjunto de datos posee una y sola una media. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.  . DESVENTAJAS Puede verse afectada por valores extremos que no son representativos del resto de los datos. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro cálculo. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala. 07/11/2018

MEDIANA Es aquel valor que divide la muestra en dos partes iguales, esto es la mitad de los casos caen por debajo de la mediana y la otra mitad se ubican por encima de la mediana. Requiere una ordenación previa de los datos; escala ordinal y de intervalos. 07/11/2018

07/11/2018

Ventajas y desventajas de usar la mediana Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de datos – incluso a partir de datos agrupados con clases de extremo abierto – a menos que la mediana entre en una clase de extremo abierto.  . Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar de números. DESVENTAJAS. Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que utilizan la media. Debido a que la mediana es una posición promedio, debemos ordenar los datos antes de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran número de elementos. Por consiguiente, si deseamos utilizar una estadística de muestra para estimar un parámetro de población, la media es más fácil de usar que la mediana.  . 07/11/2018

Ejemplo Mediana Se tiene la edad de siete pacientes : 44, 42, 45, 42, 47, 52, 65 Se ordenan según magnitud 42, 42, 44, 45, 47, 52, 65 Cuando el número de datos es impar, la mediana es el valor central => 45 Cuando el número de datos es par, la mediana es el promedio aritmético de los dos datos centrales (44 + 45)/ 2 = 44,5 07/11/2018

MODA O MODO Es una categoría que ocurre con mayor frecuencia. ( valor que más se repite en una muestra). Se usa con cualquier nivel de medición. Para niveles de medición nominal , es la única medida de posición que se puede determinar. 07/11/2018

07/11/2018

Ventajas y desventajas de usar la moda La moda, al igual que la mediana, se puede utilizar como una posición central para datos tanto cualitativos como cuantitativos.   También, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor más frecuente del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qué tan grandes o qué tan pequeños sean los valores del conjunto de datos, e independientemente de cuál sea su dispersión. La podemos utilizar aun cuando una o más clases sean de extremo abierto.  DESVENTAJAS Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se presenten más de una vez. En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta el mismo número de veces. Otra desventaja consiste en que cuando los datos contienen dos, tres o más modas, resultan difíciles de interpretar y comparar. 07/11/2018

MEDIDAS DE VARIABILIDAD 07/11/2018

La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir qué presentan esa dispersión antes de abordar esos problemas. 07/11/2018

Tipos de medidas de dispersión ABSOLUTAS Están expresadas en la misma unidad de medida que los datos Ejemplo: desv. estándar, recorrido,fractiles RELATIVAS Se definen como el cuociente entre una medida de dispersión absoluta y una medida de tendencia central. Están expresadas independientemente d la unidad de medida de los datos (excepto a la varianza) Ejemplo : coeficiente de variación media de Pearson 07/11/2018

Cuales son las que veremos........... Amplitud, Rango, Recorrido,Recorrido intercuartilico Fractiles Varianza Desviación Estándar Coeficiente de variación media de Pearson 07/11/2018

AMPLITUD, RANGO O RECORRIDO Se define como la diferencia entre el valor máximo y el valor mínimo de una serie. Se define como XM - Xm (valor máx. – valor mín.). Cuando más grande sea el rango mayor será la dispersión de los datos de una distribución. Su limitación es que este estadígrafo depende sólo de dos valores, y frente a valores muy extremos no reflejaría la variabilidad real de los valores. Ignora la naturaleza de la variación entre todas las demás observaciones, y se ve muy influido por los valores extremos. 07/11/2018

Amplitud, Rango, Recorrido y Recorrido Intercuartilico Las distribuciones de extremo abierto no tienen alcance, pues no existe un valor más alto o más bajo en la clase de extremo abierto. Cuando los valores próximos al mínimo y al máximo de los datos están excesivamente alejados del resto, es más representativo trabajar con un recorrido más corto. Para ello se usa el recoorido intercualitico que se define como : RI = Q3 – Q1 ó RI = P75 – P25 07/11/2018

FRACTILES En una distribución de frecuencias, una fracción o proporción dada de los datos cae en un fractil o por debajo de éste. La mediana, por ejemplo, es el fractil 0,5, puesto que la mitad de los datos es menor o igual a este valor. Los fractiles dividen a la serie de observaciones ordenadas según magnitud ,son parecidos a los porcentajes. Los fractiles tienen nombres especiales, dependiendo del número de partes iguales en que se dividen los datos. Los fractiles que los dividen en 10 partes iguales se conocen como deciles. Los cuartiles dividen los datos en cuatro partes iguales. Los percentiles (p) dividen el conjunto de datos en 100 partes iguales. El punto fractil es siempre el punto en el o debajo del cual cae la proporción establecida de valores. 07/11/2018

Ejemplos Mediana: Cuartil Déciles Fractil 0,5 Percentil 50 Cuartil 2 07/11/2018

VARIANZA DE LA POBLACIÓN La varianza y la desviación estándar estiman “cuánto se desvía, en promedio, un conjunto de observaciones, respecto a su media. Cada población tiene una varianza, que se simboliza con s 2 (sigma cuadrada). Para calcular la varianza de una población, dividimos la suma de las distancias al cuadrado entre la media y cada elemento de la población entre el número total de observaciones de dicha población. σ2 = å (x - m )2 / N s 2 = varianza de la población. X = elemento u observación. = media de la población. N = nº de elementos de la población. La raíz cuadrada de un número positivo puede ser tanto positiva como negativa. Cuando tomamos la raíz cuadrada de la varianza para calcular la desviación estándar, los estadísticos solamente consideran la raíz cuadrada positiva. 07/11/2018

VARIANZA DE LA MUESTRA s2 = å (x - x)2 / (n – 1) Cada muestra tiene una varianza, que se simboliza con s 2 (sigma cuadrada). Para calcular la varianza de una muestra, dividimos la suma de las distancias al cuadrado entre la media y cada elemento de la población entre el número total de observaciones de dicha población. s2 = å (x - x)2 / (n – 1) Estos resultados indican a cuántas desviaciones estándar se halla una observación en particular por arriba o por debajo de la media de la muestra. 07/11/2018

DESVIACIÓN ESTANDARD La varianza y la desviación estándar estiman “cuánto se desvía, en promedio, un conjunto de observaciones, respecto a su media. Se expresa en las mismas unidades de la escala de medición de la variable. Cuanto mayor es la dispersión de los datos alrededor de la media, mayor es la desviación estándar. la desviación estardard se simboliza con “s” para la muestra y con σ para la población La desviación estándar de la población, o s , es simplemente la raíz cuadrada de la varianza de la población. 07/11/2018

Coef. de variación de Pearson Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson Se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética CV = S / I x I CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.   07/11/2018

NO OLVIDAR   Las letras griegas siempre se refieren a parámetros de la población y las letras latinas se refieren a estadísticas de la muestra. Recordar utilizar N como denominador cuando se calcula la desviación estándar de la población,pero n – 1 para calcular la desviación estándar de la muestra. 07/11/2018