Medidas de Posición y Dispersión

Slides:



Advertisements
Presentaciones similares
Programa Académico de Maestría en Educación para Docentes de la Región Callao ESTADISTICA PARA LA INVESTIGACIÓN PSICOPEDAGÓGICA II José Luis Morón Octubre.
Advertisements

ESTIMACION DE PARAMETRO
ESTADÍSTICA DESCRIPTIVA
La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
Tema 4: Medidas de posición individual.
Tema. 4. Medidas de posición. Medidas de posición individual, centiles
ANALISIS DE DATOS CUANTITATIVOS
Décima sexta clase, Medidas de Dispersión
Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
ESTADÍGRAFOS DE DISPERSIÓN
Medidas de centralización para datos no agrupados
ESTADÍSTICA DESCRIPTIVA
Descripción de los datos: medidas de ubicación
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Métodos Cuantitativos Aplicados a Los Negocios.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
MÉTODOS ESTADÍSTICOS.
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Capítulo 4: Medidas de dispersión
Capítulo 3: Medidas de posición
Estimación de parámetros poblacionales
MEDIDAS DE TENDENCIA CENTRAL A.7.1.
FUNCIONES DE UNA VARIABLE REAL
Parámetros estadísticos
DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
Clase 2: Datos agrupados
¡Primero mira fijo a la bruja!
FRANCISCO JAVIER RODRÍGUEZ
DISTINTOS TIPOS DE FRECUENCIAS
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
DISTRIBUCIÓN DE FRECUENCIAS
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Dispersión Estadística E.S.O.
ESTADIGRAFOS DE DISPERSION
ESTADISTICA LABORAL Relaciones Laborales Facultad de Derecho 2008
Mg. LIC. ANANI BASALDUA GALARZA
Curso de Estadística Básica
Medidas Descriptivas Numéricas
Bioestadística III. Escala cuantitativa. n Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna.
MEDIDAS DE TENDENCIA CENTRAL
Tema 2: Parámetros Estadísticos
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Laboratorio de Estadística administrativa
Medidas de Posición y Centralización Estadística E.S.O.
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Page 1 ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
UNIDAD III DESCRIPTORES NUMÉRICOS
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Descripción de los datos: medidas de dispersión
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Métodos Cuantitativos
MEDIDAS DE TENDENCIA CENTRAL
Coeficiente de variación
DIPLOMADO DE POSTGRADO
Estadística descriptiva
Estadística descriptiva
Medidas de tendencia central
Medidas de tendencia central o posición
Transcripción de la presentación:

Medidas de Posición y Dispersión BIOESTADISTICA 2008 Medidas de Posición y Dispersión

Objetivo: Al término de la clase el estudiante estará en condiciones de calcular, interpretar y saber usar las medidas de tendencia central y dispersión.

Medidas de tendencia central Las medidas de tendencia central (denominadas también promedios) permiten hallar un solo valor numérico alrededor del cual los datos parecen agruparse de cierta manera, como si fuera el “centro de gravedad de los datos”. Debido a estas circunstancias, suelen ser llamados de POSICIÓN O TENDENCIA CENTRAL.

Principales medidas de tendencia central Media Aritmética. Mediana. Moda. Cuantiles.

Media Aritmética Es un valor representativo de un conjunto de datos que se está estudiando y caracteriza a toda una distribución. Se le conoce también como promedio. En su cálculo intervienen todo los valores que se están estudiando.

Definición Si tenemos n datos representados por: x1, x2, x3, ......xn. La media aritmética de estos n datos está dado por: __ X1 + X2 + X3 +..........+ Xn X = ____________________________ n

Simbólicamente lo podemos representar como: Xi  = _______ N es el tamaño N de la población —  Xi X = _______ n es el tamaño n de la muestra

Media Aritmética en datos agrupados fi es frecuencia — fi Xi absoluta simple. X = ________ n Xi es una marca de clase.

Propiedades de la Media Aritmética 1. Es única, puede ser un valor positivo, cero o un valor negativo. 2. Si a los valores que estudiamos le sumamos o restamos una constante, el valor de la nueva media quedaría como la media aritmética de los datos originales más o menos la constante que se ha agregado. 3. Si a cada valor de la serie le multiplicamos por una constante, la nueva media aritmética sería igual a la media aritmética original multiplicada por la constante.

Propiedades de la Media Aritmética 4. La suma de las desviaciones de los datos con respecto a la media es cero, es decir N _  ( xi - X) = 0 i=1 Como incluye todos los datos, puede estar afectado por valores extremos. Es usada para variables medidas en escala de intervalo o de razón.

Ejemplo 1: Los siguientes datos son edades de 10 madres que asisten a un centro de salud en un día : 30, 43, 58, 61, 70, 42, 58, 39, 60, 55. La edad promedio de estas madres será: — 30 + 43 + 58 + ..... + 55 516 X = _____________________ = _____ = 51.6 años 10 10 En promedio los valores de edad de las 10 madres es 51.6 años.

Ejemplo 2: 30,43,58,61,70,42,58,3960,55,71,70,65,39,40,6165,56,38,57,49,61,69,4346,69,44,59, 62,66 A continuación se presenta las edades de 30 personas con cáncer pulmonar que pasan a consulta en el Hospital María Auxiliadora. Lima. Julio 2007: Tabla 1 Edad fi Xi fi . Xi 30 - 36 1 33 33 37 - 43 7 40 280 44 - 50 3 47 141 51 - 57 3 54 162 58 - 64 8 61 488 65 - 71 8 68 544 Total 30 1648

PROCEDIMIENTO: — fi Xi 1648 X = ________ = ______ = 54.9 n 30 En promedio los valores de la edad de los 30 pacientes es de 54.9 años.

MEDIANA ( Me ) Reemplazar iconos de ejemplo porconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” La mediana es un valor que divide a la distribución ordenada en forma ascendente o descendente en dos grupos iguales. 50% | 50% V. min. Me. V. máx.

Propiedades de la Mediana 1. Es única , existe solamente una mediana para un conjunto de datos. 2. Los valores extremos no tienen efectos importantes sobre la mediana. 3. Se aplica también a variables que pertenecen a la escala ordinal. 4. Es muy variable de muestra a muestra.

Reemplazar iconos de ejemplo por iconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” Ejemplo: Dado los valores: 11, 8, 13, 20, 14, 3, 7, 12. Hallar la mediana Ordenando ascendentemente: 3, 7, 8, 11, 12, 13, 14, 20. Me = 11 + 12 = 11.5 2 Por debajo de 11.5 existe un 50% de observaciones.

Ejemplo: Calcular la mediana dado los valores: 1, 9, 2, 6, 3, 5, 7 días. Ordenando los valores: 1, 2, 3, 5, 6, 7, 9. Es decir por debajo de 5 existe un 50 % de observaciones .

Mediana en datos agrupados. Reemplazar iconos de ejemplo por iconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” Me = Li + (n/2 - Fi-1) x C f Me n/2 Posición de la mediana Li Límite real inferior de la clase que contiene a la Me n Número total de observaciones Fi-1 Frecuencia absoluta acumulada de la clase anterior a la que contiene a la Me. f Me Frecuencia absoluta de la clase que contiene a la Me C Amplitud de la clase que contiene a la Me

Ejemplo: Calcular la Me de la siguiente distribución:

Procedimiento: 1. Calcular las frecuencias acumuladas Fi 2. Calcular n/2 = 40/2 = 20 sirve para detectar la clase mediana. 3. Clase mediana: clase cuyo Fi excede a 20 (15 - 19) 4. De la clase mediana se obtiene: L i = 14.5 Fi - 1 = 12 C = 5 fMe = 15 . Los valores encontrados en (2), (3) y (4) lo reemplazamos en la formula y se tiene: Me = 14.5 + 20 - 12 x 5 Me = 17.17 15 Interpretación: El 50% de los puntajes están por debajo de 17.17 y el 50% está por encima de 17.17 puntos.

LA MODA Ejemplo: Se tiene la siguiente información: Se utiliza mayormente cuando la característica en estudio se ha medido en escala nominal u ordinal. La MODA es la observación que mayormente se repite (observación más COMÚN) Ejemplo: Se tiene la siguiente información: 2, 3, 4, 5, 5, 6, 4, 5 Mo = 5

Propiedades de la Moda 1. Si todos los valores son diferentes, no hay moda. 2. En una distribución puede existir dos o más modas 3. Es usada para variables categóricas o cualitativas.

Ejemplo:

Ejemplo:Moda para datos agrupados En una tabla de distribución de frecuencias es aproximadamente la marca de clase o punto medio de la clase que tiene la mayor frecuencia absoluta simple. Variable fi 5 - 9 3 10 - 14 9 15 - 19 15 20 - 24 8 25 - 29 5 total 40 La moda estará ubicado en el intervalo: 15 - 19 15

Por lo tanto la marca de clase será: 14.5 + 19.5 = 17.0 2 Luego la Mo = 17.0

SIMETRÍA

SIMETRÍA

LOS CUANTILES Cuartiles. Deciles. Percentiles. Son aquellos que dividen a la distribución en cuatro, diez o cien partes iguales: Cuartiles. Deciles. Percentiles.

Cuartiles (Q). Son aquellos que dividen a la distribución en cuatro partes iguales, en donde cada uno de ellos incluye el 25% de las observaciones. __25%_._25%__.__25%__.__25%__ Q1 Q2 Q3 Me

DECILES (D) Son aquellos que dividen a la distribución en diez partes iguales en donde cada uno de ello incluye el 10% de las observaciones _10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ D1 D2 D3 D4 D5 D6 D7 D8 D9 Q2 Me

PERCENTILES (P) Son aquellos que dividen a la distribución en cien partes iguales en donde cada uno de ello incluye el 1% de las observaciones: _1%_._1%_. 1%_._1%_._1%_. .........._1%_._1%_._1%_._1%_._1%_ P1 P2 P3 P4 ........... P96 P97 P98 P99 P10 = Li + (10/100 N - F i-1 ) x C fP10 P60 = Li + (60/100 N - F i-1 ) x C fP60 C = ancho de la clase que contiene el P10 ó P60

Ejemplo: Variable fi Fi 55 - 58 20 20 59 - 62 30 50 63 - 66 80 130 55 - 58 20 20 59 - 62 30 50 63 - 66 80 130 67 - 70 70 200 71 - 74 40 240 75 - 78 10 250 Total 250

Recordar: Q1 = P25 Q2 = Mediana = P50 Q3 = P75 Reemplazar iconos de ejemplo por iconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” Q1 = P25 Q2 = Mediana = P50 Q3 = P75

Medidas de dispersión

Las medidas de dispersión Llamadas también medidas de variabilidad, miden el grado de separación de los datos respecto a un valor central. Son útiles porque: Permiten juzgar la confiabilidad de la medida de tendencia central. Los datos demasiados dispersos tienen un comportamiento especial. Es posible comparar dispersión de diversas muestras.

Medidas que calculan la dispersión RANGO ( Amplitud Total ) Es la medida más simple de dispersión A = Obs Max - Obs Min

La varianza Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la Media Arítmetica.

Definición: Si tenemos N datos X1, X2, X3, ...., XN . La varianza de estos datos se define como:  ( Xi _ μ )2 V(x) = ____________ N Para una muestra de tamaño n tendremos: __  ( Xi _ X )2 V(x) = ____________ n-1

Varianza Poblacional ( Xi)2  Xi2 _ __________ N V( x ) = ________________________

Varianza Muestral ( xi)2  xi2 _ __________ n v(x ) = ________________________ n-1

Ejemplo Consideremos los siguientes datos de una muestra : 4, 7, 8, 3, 5, 9, 10, 2. __ 4+7+8+....+ 2 X = ____________ = 6 8 (4-6)2 + ( 7-6)2 +...+(2-6)2 V(x) = _____________________ = 8.57 8-1

Ejemplo: Se tiene la siguiente distribución de frecuencias: Variable fi Xi fi . Xi fi . Xi2 55-58 20 56.5 1130 63845 59-62 30 60.5 1815 109807.5 63-66 80 64.5 5160 332820 67-70 70 68.5 4795 328457.5 71-74 40 72.5 2900 210250 75-78 10 76.5 765 5852.25 total 250 16565 1051032.25

Formula para datos agrupados (fi Xi)2 fi Xi2 _ __________ n V( x ) = ________________________ n-1

Resultados (16565)2 1051032.25 - _________ 250 1051032.25 - _________ 250 V(x) = _______________________ 250-1 = 186.26

Desviación estándar Es la medida de dispersión más común para definir datos médicos y del área de la salud. Es la raiz cuadrada de la varianza s=V(X). Tanto la desviación estándar como la media aritmética requieren datos numéricos.

El coeficiente de variación Es una medida relativa de variabilidad de los datos entre la media y la desviación estándar de una población o muestra. Permite comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes (por ejemplo peso en Kg. y libras). a) Cálculos a partir de datos no agrupados para la muestra: para la población:

Ejemplo: Supongamos que de dos poblaciones se han obtenido los siguientes datos: Grupo 1 Grupo 2 __ Edad X = 25 años 11 años Peso X = 72.5 Kgs. 40 Kgs s = 5 Kgs. 5 Kgs. n = 15 15 ¿Que grupo es más homogéneo o menos variable en relación al peso?

Grupo 1 Grupo 2 5 5 C.V = ______. 100 C.V = _____.100 72.5 40 = 6.9% = 12.5% La muestra 1 posee menos dispersión de los pesos con respecto a la media en relación a las muestra 2.

Consideraciones SI: C.V  10% hay poca dispersión 10%  C.V < 33% Dispersión aceptable 33% < C.V < 50% Dispersión alta C.V > 50% La dispersión es muy alta.

Uso de las diferentes medidas de dispersion La desviación estándar se emplea cuando también es apropiado el uso de la media, es decir, con distribuciones simétricas(no sesgadas) de datos numéricos. Desviación cuartil se emplea cuando la distribución no es simétrica(sesgada) y es apropiado el uso de la mediana.

El rango es una medida apropiada para datos numéricos cuando el propósito es enfatizar valores extremos. El coeficiente de variación es útil cuando la intención es comparar dos distribuciones numéricas medidas en escalas diferentes.

El “Boxplot” (Diagrama de Caja) Al igual que el histograma y los gráficos de Tallo y Hoja permite tener una idea visual de la distribución de los datos (simetría y variabilidad). Permite detectar outliers (valores extremos). Permite comparar la media y la variabilidad de varios grupos (alternativa gráfica a pruebas estadísticas)

Boxplot: Procedimiento Dibujar una caja cuyo límite inferior será Q1 y el superior Q3. Dentro de la caja trazar una línea que localice la mediana. Calcular el rango intercuartílico: R.I. (Q) = RIQ = Q3 – Q1 Dibujar un “bigote” del borde inferior de la caja hasta Q1-1.5xRIQ o hasta el valor mínimo de los datos (se elige el mayor de estos dos resultados)

Boxplot: Procedimiento Dibujar otro“bigote” del borde superior de la caja hasta Q3+1.5xRIQ o hasta el valor máximo de los datos (se elige el menor de estos dos resultados) Dibujar cualquier observación que se ubique fueras de los bigotes (estos serán los outliers).

BoxPlot: Ejemplo Recordar la posición de los cuartiles: Construir un boxplot con el siguiente grupo de datos que corresponde a diámetros (cm) de sarcomas puros extirpados del pecho de 20 mujeres: 0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0 4.2 4.5 5.0 5.0 5.0 5.0 6.0 6.5 7.0 8.0 9.5 13.0 Recordar la posición de los cuartiles:

BoxPlot: Ejemplo Proceso: Q1=(20+1)/4=5.25 2.5+(0.25)(3.0-2.5)= 2.625 Me= 4.75 Q3=3(20+1)/4=15.75 6.0+(0.75)(6.5-6.0)=6.375 RIQ=Q3-Q1= 6.375-2.625=3.75 Outlier> Q3+1.5xRIQ= 6.375 + (1.5)(3.75)= 12.00 Outlier< Q1-1.5xRIQ = 2.625 – (1.5)(3.75) = -3.00

BoxPlot: Ejemplo

Medidas de resumen numérico para variables cualitativas Las medidas de resumen numérico empleadas para variables cualitativas son: Razón Proporción Tasa

380 camas hospitalarias/95 enfermeras=4 camas/enfermera RAZON Es la comparación por cociente entre dos cifras de diferentes o similar naturaleza en donde el numerador y el denominador son excluyentes. Por ejemplo, si tenemos 380 camas hospitalarias y 95 enfermeras y queremos encontrar la razón entre ellas, tenemos que dividir: 380 camas hospitalarias/95 enfermeras=4 camas/enfermera Este número constituye un valor que refleja una relación. En este caso, el número 4 se interpreta como que por cada cuatro camas hospitalarias hay una enfermera.

PROPORCIÓN Es la comparación por cociente entre el número de elementos de un subconjunto y el número de elementos de un conjunto al que pertenece dicho subconjunto. En este caso el numerador está incluido en el denominador, por este motivo los valores siempre van a ser menores que la unidad. Por ejemplo, si en la población hubo 175 casos de cáncer pulmonar de un total de 1925 casos de todos los tipos de cáncer, la proporción se calculará. 175 / 1925 = 0.09

TASA Es la comparación por cociente entre un número de eventos ocurridos en un tiempo y lugar determinados y la población que estuvo expuesta al riesgo de que le ocurriera dichos eventos en la misma época y en ese lugar.

Cada esfuerzo en el presente nos permite avanzar hacia el éxito.