Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Medidas de Posición y Dispersión
BIOESTADISTICA 2008 Medidas de Posición y Dispersión
2
Objetivo: Al término de la clase el estudiante estará en condiciones de calcular, interpretar y saber usar las medidas de tendencia central y dispersión.
3
Medidas de tendencia central
Las medidas de tendencia central (denominadas también promedios) permiten hallar un solo valor numérico alrededor del cual los datos parecen agruparse de cierta manera, como si fuera el “centro de gravedad de los datos”. Debido a estas circunstancias, suelen ser llamados de POSICIÓN O TENDENCIA CENTRAL.
4
Principales medidas de tendencia central
Media Aritmética. Mediana. Moda. Cuantiles.
5
Media Aritmética Es un valor representativo de un conjunto de datos que se está estudiando y caracteriza a toda una distribución. Se le conoce también como promedio. En su cálculo intervienen todo los valores que se están estudiando.
6
Definición Si tenemos n datos representados por: x1, x2, x3, xn. La media aritmética de estos n datos está dado por: __ X X2 + X Xn X = ____________________________ n
7
Simbólicamente lo podemos representar como:
Xi = _______ N es el tamaño N de la población — Xi X = _______ n es el tamaño n de la muestra
8
Media Aritmética en datos agrupados
fi es frecuencia — fi Xi absoluta simple. X = ________ n Xi es una marca de clase.
9
Propiedades de la Media Aritmética
1. Es única, puede ser un valor positivo, cero o un valor negativo. 2. Si a los valores que estudiamos le sumamos o restamos una constante, el valor de la nueva media quedaría como la media aritmética de los datos originales más o menos la constante que se ha agregado. 3. Si a cada valor de la serie le multiplicamos por una constante, la nueva media aritmética sería igual a la media aritmética original multiplicada por la constante.
10
Propiedades de la Media Aritmética
4. La suma de las desviaciones de los datos con respecto a la media es cero, es decir N _ ( xi - X) = 0 i=1 Como incluye todos los datos, puede estar afectado por valores extremos. Es usada para variables medidas en escala de intervalo o de razón.
11
Ejemplo 1: Los siguientes datos son edades de 10 madres que asisten a un centro de salud en un día : 30, 43, 58, 61, 70, 42, 58, 39, 60, 55. La edad promedio de estas madres será: — X = _____________________ = _____ = 51.6 años En promedio los valores de edad de las 10 madres es 51.6 años.
12
Ejemplo 2: 30,43,58,61,70,42,58,3960,55,71,70,65,39,40,6165,56,38,57,49,61,69,4346,69,44,59, 62,66 A continuación se presenta las edades de 30 personas con cáncer pulmonar que pasan a consulta en el Hospital María Auxiliadora. Lima. Julio 2007: Tabla 1 Edad fi Xi fi . Xi Total
13
PROCEDIMIENTO: — fi Xi X = ________ = ______ = n En promedio los valores de la edad de los 30 pacientes es de 54.9 años.
14
MEDIANA ( Me ) Reemplazar iconos de ejemplo porconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” La mediana es un valor que divide a la distribución ordenada en forma ascendente o descendente en dos grupos iguales. 50% | % V. min Me V. máx.
15
Propiedades de la Mediana
1. Es única , existe solamente una mediana para un conjunto de datos. 2. Los valores extremos no tienen efectos importantes sobre la mediana. 3. Se aplica también a variables que pertenecen a la escala ordinal. 4. Es muy variable de muestra a muestra.
16
Reemplazar iconos de ejemplo por iconos de
documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” Ejemplo: Dado los valores: 11, 8, 13, 20, 14, 3, 7, 12. Hallar la mediana Ordenando ascendentemente: 3, 7, 8, 11, 12, 13, 14, 20. Me = = 11.5 2 Por debajo de 11.5 existe un 50% de observaciones.
17
Ejemplo: Calcular la mediana dado los valores: 1, 9, 2,
6, 3, 5, 7 días. Ordenando los valores: 1, 2, 3, 5, 6, 7, 9. Es decir por debajo de 5 existe un 50 % de observaciones .
18
Mediana en datos agrupados.
Reemplazar iconos de ejemplo por iconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” Me = Li + (n/2 - Fi-1) x C f Me n/2 Posición de la mediana Li Límite real inferior de la clase que contiene a la Me n Número total de observaciones Fi-1 Frecuencia absoluta acumulada de la clase anterior a la que contiene a la Me. f Me Frecuencia absoluta de la clase que contiene a la Me C Amplitud de la clase que contiene a la Me
19
Ejemplo: Calcular la Me de la siguiente distribución:
20
Procedimiento: 1. Calcular las frecuencias acumuladas Fi
2. Calcular n/2 = 40/2 = 20 sirve para detectar la clase mediana. 3. Clase mediana: clase cuyo Fi excede a 20 ( ) 4. De la clase mediana se obtiene: L i = Fi - 1 = 12 C = 5 fMe = 15 . Los valores encontrados en (2), (3) y (4) lo reemplazamos en la formula y se tiene: Me = x Me = 17.17 15 Interpretación: El 50% de los puntajes están por debajo de 17.17 y el 50% está por encima de puntos.
21
LA MODA Ejemplo: Se tiene la siguiente información:
Se utiliza mayormente cuando la característica en estudio se ha medido en escala nominal u ordinal. La MODA es la observación que mayormente se repite (observación más COMÚN) Ejemplo: Se tiene la siguiente información: 2, 3, 4, 5, 5, 6, 4, 5 Mo = 5
22
Propiedades de la Moda 1. Si todos los valores son diferentes, no hay moda. 2. En una distribución puede existir dos o más modas 3. Es usada para variables categóricas o cualitativas.
23
Ejemplo:
24
Ejemplo:Moda para datos agrupados
En una tabla de distribución de frecuencias es aproximadamente la marca de clase o punto medio de la clase que tiene la mayor frecuencia absoluta simple. Variable fi total 40 La moda estará ubicado en el intervalo:
25
Por lo tanto la marca de clase será:
= 17.0 2 Luego la Mo = 17.0
26
SIMETRÍA
27
SIMETRÍA
28
LOS CUANTILES Cuartiles. Deciles. Percentiles.
Son aquellos que dividen a la distribución en cuatro, diez o cien partes iguales: Cuartiles. Deciles. Percentiles.
29
Cuartiles (Q). Son aquellos que dividen a la distribución en cuatro partes iguales, en donde cada uno de ellos incluye el 25% de las observaciones. __25%_._25%__.__25%__.__25%__ Q Q Q3 Me
30
DECILES (D) Son aquellos que dividen a la distribución en diez partes iguales en donde cada uno de ello incluye el 10% de las observaciones _10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ D D D D D D D D D9 Q2 Me
31
PERCENTILES (P) Son aquellos que dividen a la distribución en cien partes iguales en donde cada uno de ello incluye el 1% de las observaciones: _1%_._1%_. 1%_._1%_._1%_ _1%_._1%_._1%_._1%_._1%_ P P P P P P P P99 P10 = Li + (10/100 N - F i-1 ) x C fP10 P60 = Li + (60/100 N - F i-1 ) x C fP60 C = ancho de la clase que contiene el P10 ó P60
32
Ejemplo: Variable fi Fi 55 - 58 20 20 59 - 62 30 50 63 - 66 80 130
Total
33
Recordar: Q1 = P25 Q2 = Mediana = P50 Q3 = P75
Reemplazar iconos de ejemplo por iconos de documentos activos así: En el menú Insertar, seleccione Objeto... Haga clic en “Crear desde archivo” Ubique el nombre de archivo en el cuadro “Archivo” “Mostrar como icono” debe estar activado Haga clic en Aceptar Seleccione un icono En el menú Presentación, seleccione “Configuración de la acción” Haga clic en “Acción de objeto” y seleccione “Modificar” Q1 = P25 Q2 = Mediana = P50 Q3 = P75
34
Medidas de dispersión
35
Las medidas de dispersión
Llamadas también medidas de variabilidad, miden el grado de separación de los datos respecto a un valor central. Son útiles porque: Permiten juzgar la confiabilidad de la medida de tendencia central. Los datos demasiados dispersos tienen un comportamiento especial. Es posible comparar dispersión de diversas muestras.
36
Medidas que calculan la dispersión
RANGO ( Amplitud Total ) Es la medida más simple de dispersión A = Obs Max Obs Min
37
La varianza Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la Media Arítmetica.
38
Definición: Si tenemos N datos X1, X2, X3, ...., XN . La varianza de estos datos se define como: ( Xi _ μ )2 V(x) = ____________ N Para una muestra de tamaño n tendremos: __ ( Xi _ X )2 V(x) = ____________ n-1
39
Varianza Poblacional ( Xi)2 Xi2 _ __________ N
V( x ) = ________________________
40
Varianza Muestral ( xi)2 xi2 _ __________ n
v(x ) = ________________________ n-1
41
Ejemplo Consideremos los siguientes datos de una muestra :
4, 7, 8, 3, 5, 9, 10, 2. __ X = ____________ = (4-6)2 + ( 7-6) (2-6)2 V(x) = _____________________ =
42
Ejemplo: Se tiene la siguiente distribución de frecuencias:
Variable fi Xi fi . Xi fi . Xi2 total
43
Formula para datos agrupados
(fi Xi)2 fi Xi2 _ __________ n V( x ) = ________________________ n-1
44
Resultados (16565)2 1051032.25 - _________ 250
_________ 250 V(x) = _______________________ 250-1 =
45
Desviación estándar Es la medida de dispersión más común para definir datos médicos y del área de la salud. Es la raiz cuadrada de la varianza s=V(X). Tanto la desviación estándar como la media aritmética requieren datos numéricos.
46
El coeficiente de variación
Es una medida relativa de variabilidad de los datos entre la media y la desviación estándar de una población o muestra. Permite comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes (por ejemplo peso en Kg. y libras). a) Cálculos a partir de datos no agrupados para la muestra: para la población:
47
Ejemplo: Supongamos que de dos poblaciones se han obtenido los siguientes datos: Grupo Grupo 2 __ Edad X = 25 años años Peso X = 72.5 Kgs Kgs s = 5 Kgs Kgs. n = ¿Que grupo es más homogéneo o menos variable en relación al peso?
48
Grupo Grupo 2 C.V = ______ C.V = _____.100 = 6.9% = 12.5% La muestra 1 posee menos dispersión de los pesos con respecto a la media en relación a las muestra 2.
49
Consideraciones SI: C.V 10% hay poca dispersión
10% C.V < 33% Dispersión aceptable 33% < C.V < 50% Dispersión alta C.V > 50% La dispersión es muy alta.
50
Uso de las diferentes medidas de dispersion
La desviación estándar se emplea cuando también es apropiado el uso de la media, es decir, con distribuciones simétricas(no sesgadas) de datos numéricos. Desviación cuartil se emplea cuando la distribución no es simétrica(sesgada) y es apropiado el uso de la mediana.
51
El rango es una medida apropiada para datos numéricos cuando el propósito es enfatizar valores extremos. El coeficiente de variación es útil cuando la intención es comparar dos distribuciones numéricas medidas en escalas diferentes.
52
El “Boxplot” (Diagrama de Caja)
Al igual que el histograma y los gráficos de Tallo y Hoja permite tener una idea visual de la distribución de los datos (simetría y variabilidad). Permite detectar outliers (valores extremos). Permite comparar la media y la variabilidad de varios grupos (alternativa gráfica a pruebas estadísticas)
53
Boxplot: Procedimiento
Dibujar una caja cuyo límite inferior será Q1 y el superior Q3. Dentro de la caja trazar una línea que localice la mediana. Calcular el rango intercuartílico: R.I. (Q) = RIQ = Q3 – Q1 Dibujar un “bigote” del borde inferior de la caja hasta Q1-1.5xRIQ o hasta el valor mínimo de los datos (se elige el mayor de estos dos resultados)
54
Boxplot: Procedimiento
Dibujar otro“bigote” del borde superior de la caja hasta Q3+1.5xRIQ o hasta el valor máximo de los datos (se elige el menor de estos dos resultados) Dibujar cualquier observación que se ubique fueras de los bigotes (estos serán los outliers).
55
BoxPlot: Ejemplo Recordar la posición de los cuartiles:
Construir un boxplot con el siguiente grupo de datos que corresponde a diámetros (cm) de sarcomas puros extirpados del pecho de 20 mujeres: Recordar la posición de los cuartiles:
56
BoxPlot: Ejemplo Proceso: Q1=(20+1)/4=5.25 2.5+(0.25)(3.0-2.5)= 2.625
Me= 4.75 Q3=3(20+1)/4= (0.75)( )=6.375 RIQ=Q3-Q1= =3.75 Outlier> Q3+1.5xRIQ= (1.5)(3.75)= 12.00 Outlier< Q1-1.5xRIQ = – (1.5)(3.75) =
57
BoxPlot: Ejemplo
58
Medidas de resumen numérico para variables cualitativas
Las medidas de resumen numérico empleadas para variables cualitativas son: Razón Proporción Tasa
59
380 camas hospitalarias/95 enfermeras=4 camas/enfermera
RAZON Es la comparación por cociente entre dos cifras de diferentes o similar naturaleza en donde el numerador y el denominador son excluyentes. Por ejemplo, si tenemos 380 camas hospitalarias y 95 enfermeras y queremos encontrar la razón entre ellas, tenemos que dividir: 380 camas hospitalarias/95 enfermeras=4 camas/enfermera Este número constituye un valor que refleja una relación. En este caso, el número 4 se interpreta como que por cada cuatro camas hospitalarias hay una enfermera.
60
PROPORCIÓN Es la comparación por cociente entre el número de elementos de un subconjunto y el número de elementos de un conjunto al que pertenece dicho subconjunto. En este caso el numerador está incluido en el denominador, por este motivo los valores siempre van a ser menores que la unidad. Por ejemplo, si en la población hubo 175 casos de cáncer pulmonar de un total de casos de todos los tipos de cáncer, la proporción se calculará. 175 / 1925 = 0.09
61
TASA Es la comparación por cociente entre un número de eventos ocurridos en un tiempo y lugar determinados y la población que estuvo expuesta al riesgo de que le ocurriera dichos eventos en la misma época y en ese lugar.
62
Cada esfuerzo en el presente nos permite avanzar hacia el éxito.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.