La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO.

Presentaciones similares


Presentación del tema: "BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO."— Transcripción de la presentación:

1 BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO dpauta@uees.edu.ec

2 Medidas de resumen Para describir un conjunto de datos, además de la tabulación y la representación gráfica, se utilizan valores numéricos llamadas medidas de resumen. Entre las medidas que permiten resumir información proveniente de una población o muestra, podemos considerar las medidas de centralización, medidas de ubicación, medidas de dispersión, medidas de forma, entre otras. Para hallar estas medida resumen debemos aplicar fórmulas o procedemos a hallar mediantes herramientas como Excel o el SPSS

3 Clasificación de las medidas de resumen 1. Medidas de Tendencia central o posición Son: i. Media ii. Mediana iii. Moda 2. Medidas de Ubicación Son: i. Percentiles ii. Cuartiles iii. Deciles 3. Medidas de Dispersión Son: i. Rango ii. Recorrido Intercuartílico iii. Varianza iv. Desviación estándar v. Coeficiente de variación. 4. Medidas de Forma Son: i. Asimetría ii. Apuntamiento

4 Tienen por objeto, obtener un valor que resuma en sí todas las mediciones. La mayoría de ellas trata de ubicar el centro de la distribución, razón por la cual, se llaman MEDIDAS DE TENDENCIA CENTRAL. Medidas de Tendencia Central o Posición

5 Promedio o Media Aritmética o Media Es una de las medidas de tendencia central de mayor uso. Se la puede utilizar sólo para datos cuantitativos.

6 Forma de calcular el promedio: Datos no tabulados Ejemplo Un ingeniero agrónomo visita 8 haciendas agrarias turísticas de naranjas en el valle “Los naranjos” y en cada una anotó el número de plantas atacadas por cierto tipo de gusano, de lo cual resultaron los siguientes datos: Para los datos no tabulados, puede usar la opción promedio: (Insertar/función/estadística/ average )

7 En este ejemplo el promedio, media o media aritmética del número de plantas atacadas por hacienda, está dada por: Respuesta: El promedio es de 14,5 plantas atacadas

8 La mediana es el dato en el cual a cada uno de sus lados se encuentran el 50 % de los datos, se puede utilizar para datos cualitativos ordinales y para datos cuantitativos. Se la representa como: Me. El cuartil 2 es la mediana en un grupo de datos. Mediana para datos no tabulados

9 Moda para datos no tabulados  La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.  Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según sea el caso.  Se la simboliza como: Mo

10 La moda es 17 años, lo cual significa que de los fumadores encuestados, la mayoría respondieron que tenía 17 años al fumar su primer cigarrillo. Para calcular la moda, se toma el que se repite más veces Ejemplo Una investigadora de mercado, encuestó a 8 fumadores eventuales en la ciudad de Guayaquil y se les preguntó: ¿Qué edad tenía al fumar su primer cigarrillo?, de lo cual resultaron los siguientes datos: Moda para datos no tabulados Para los datos no tabulados, puede usar la opción moda: (Insertar/función/estadística /mode )

11 Media aritmética para datos tabulados: Sin clases o con clases. (La media o promedio se puede utilizar sólo para datos cuantitativos) Sin clases Sin clases (Muestra)

12 Mediana para datos tabulados y sin clases

13

14 Moda La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.

15 La moda, se puede utilizar para datos cualitativos nominales u ordinales y para datos cuantitativos

16 Ejercicio 1 SexoEdadEstado civilAcompañantes Cómo considera el lugar? Frecuencia de visitas (semestral) femenino25divorciado1Bueno4 femenino28soltero4Muy bueno3 femenino19soltero5Regular5 masculino30casado1Bueno4 masculino40divorciado7Muy bueno5 femenino30casado3Regular3 femenino18soltero0Muy bueno4 femenino28divorciado4Muy bueno3

17 Ejercicio 1 - Preguntas a. Construya la tabla de frecuencias sin clase para la variable “ Como considera el lugar”.(Use la herramienta SPSS ) b. ¿Qué proporción de visitantes asiste con más de 4 acompañantes? c. Para la variable “Frecuencias de visitas” determine Q1, Q2, Q3, el valor máximo, el valor mínimo, el Rango, el Rango Intercuartílico, la distancia entre el valor mínimo y Q1, la distancia entre Q1 y Q2, la distancia entre Q2 y Q3, la distancia entre Q3 y el valor máximo. Construya el diagrama de cajas para esta variable. (Mediante SPSS y transponerlo). d. De los resultados del literal c) compare la distancias entre Q1 y Q2 con la distancia entre Q2 y Q3. Interprete e. Determine para las variables cuantitativas (escala): las medidas de tendencia central y variabilidad.

18 Medidas de Dispersión o Variabilidad

19 Algunas medidas de variabilidad son:  Rango  Varianza  Desviación estándar  Coeficiente de variación  Rango Intercuartílico  Entre otras….

20 Rango Una alternativa como medida de dispersión es el RANGO Corresponde a la diferencia entre el dato mayor y el dato menor de nuestras observaciones Claramente influenciado por valores extremos Por esta razón no es una buena medida de dispersión.

21 Varianza Cuantifica la cantidad de variabilidad o dispersión en relación a la media (o promedio) de las observaciones. Se la representa como S² O σ ². 21

22 Desviación Estándar  En la práctica, la desviación estándar se utiliza con más frecuencia que la varianza  Una de las razones es que se expresa en las mismas unidades de medida de la variable.

23 Coeficiente de variación Es una medida relativa de variabilidad de los datos. Permite comparar la variabilidad de dos o más conjuntos de datos. Y así decidir qué conjunto de datos es más homogéneo o más estable, más equitativo. Mientras más grande es el coeficiente de variación, más variación tiene el conjunto de datos, por consiguiente es menos equitativo, menos homogéneo, menos estable. 23

24 Como el coeficiente de variación no tiene unidad de medida, permite comparar variabilidad entre distintos conjuntos de datos. Se define como el cociente entre “LA DESVIACIÓN ESTÁNDAR y LA MEDIA”, se representa matemáticamente como: Relación matemática para determinar el Coeficiente de variación

25 Cualidades del coeficiente de variabilidad 1. Recopilando un conjunto de datos de variable su media jamás podrá ser nula; en otras palabras, nunca valdrá cero. La desviación típica, en cambio, sí puede ser nula: ellos sucede cuando los datos del conjunto coinciden todos con su media. 2. Por lo tanto, dado que el coeficiente de variación define como la relación que guarda la desviación estándar a la media aritmética de un conjunto de datos (CV= S/X), el valor mínimo que puede adoptar un coeficiente de variación es cero, lo cual significa la inexistencia de dispersión de los datos. 25

26 Ejercicio 2 La base de datos dada a continuación, muestra los resultados del examen de salud hecha a un grupo de hombres: 26 EdadEstaturaPesoCintura 5870,8169,190,6 2266,2144,278,1 3271,7179,396,5 3168,7175,887,7 2867,6152,687,1 4669,2166,892,4 4166,5135,278,8 5667,2201,5103,3 2068,3169,189,1 5465,6139,182,5 1763,1156,386,7 7368,3186,6103,3 5273,1191,191,3 2567,6151,375,6 2968,1209,4105,5 1771,1237,1108,7 3261,3176,7104,1 5276,2220,6103,1 3266,3166,191,3 2069,7137,475,2

27 Ejercicio 2: Preguntas Para la base de datos dada, determine: a. Para las variables cuantitativas (escala): Media, mediana, moda, rango, dato máximo, dato mínimo, número de datos, varianza, desviación típica, cuartiles. (Mediante SPSS) b. Determine el Coeficiente de variación o variabilidad para cada variable. c. Para la variable “ Estatura ” el valor de: Rango intercuartílico, la distancia entre el valor mínimo y Q1, la distancia entre Q3 y el valor máximo, la distancia entre Q1 y Q2, la distancia entre Q2 y Q3. Interprete sus resultados. Interprete sus resultados. 27

28 Desarrollo del ejercicio 2: Literal a) a. Para las variables cuantitativas (escala): Media, mediana, moda, rango, dato máximo, dato mínimo, número de datos, varianza, desviación típica, cuartiles. (Mediante SPSS) Cuadro de resultados – SPSS 28

29 Desarrollo del ejercicio 2: Literal b) b. Determine el Coeficiente de variación o variabilidad para cada variable. Cuadro de resultados – Excel 29 EdadEstaturaPesoCintura Desviación estándar 16,1188843,33420828,13634610,49623 Media 36,8568,33173,2691,545 C.V. 16,118884/36,85 = 0,4374183,334208/68,33 = 0,04879528,136346/173,26 = 0,14507810,49623/ 91,545 = 0,1146565 C.V. (%) 0,4374,18*100 % = 43,7418 %0,048795*100 % = 4,8795 %0,145078*100 % = 14,5078 %0,1146565*100 % = 11,46565 %

30 Desarrollo del ejercicio 2: Literal c) c. Para la variable “ Estatura ” el valor de: Rango intercuartílico, la distancia entre el valor mínimo y Q1, la distancia entre Q3 y el valor máximo, la distancia entre Q1 y Q2, la distancia entre Q2 y Q3. Interprete sus resultados. Cuadro de resultados – Excel 30 Valor mínimo61,30 Q1Q1 66,45 Q2Q2 68,20 Q3Q3 69,975 Valor máximo76,2 Q 1 – Valor mínimo 66,45 – 61,30 = 5,15 Q 2 – Q 1 68,20 – 66,45 = 1,75 Q 3 – Q 2 69,975 – 68,20 = 1,775 Valor máximo – Q 3 76,2 – 69,975 = 6,225 RIC 69,975 – 66,45 = 3,525

31 Interpretación de resultados Q 1 : El 25 % de los datos tienen medidas inferiores a 66,45 inch. o el 75 % de los datos tienen medidas superiores a 66,45 inch. Q 2 : El 50 % de los datos tienen medidas inferiores a 68,20 inch. O el 50 % de los datos tienen medidas superiores a 68,20 inch. Q 3 : El 75 % de los datos tienen medidas inferiores a 69,975 inch. o el 25 % de los datos tienen medidas superiores a 69,975 inch. o La distancia entre Q 1 y Q 2 es aproximadamente igual a la distancia entre Q 2 y Q 3, se puede asumir que la distribución (dispersión o concentración) de datos es la misma entre el 25 % y 50% comparados con el 50 % y 75 %. 31

32 Ejercicio 3 La Base de datos dada corresponde a los nacimientos en el año 2013 en las Canarias, España Determine: a. El promedio de nacimientos y la desviación típica. b. El coeficiente de variabilidad. 32 Edades de las madresNacimientos De 15 a 19403 De 20 a 241.682 De 25 a 293.277 De 30 a 345.313 De 35 a 393.964 De 40 a 441.137 De 45 a 4969 TOTAL15.845

33 Desarrollo del ejercicio 3: Literal a) a. El promedio de nacimientos y la desviación típica. 33 Edades de las madresCanarias m.c.mc* fimc. – prom(mc. – prom)²(mc. – prom)²* fi De 15 a 19403 (15 + 19)/2 = 1717 * 403 = 685117 – 31,56 = –14,56(–14,56)² = 211,9936211,9936 * 403 = 85433,42 De 20 a 241.682 (20 + 24)/2 = 2222 * 1.682 = 3700422 – 31,56 = –9,56(–9,56)² = 91,393691,3936 * 1682 = 153724,04 De 25 a 293.277 (25 + 29)/2 = 2727 * 3.277 = 8847927 – 31,56 = –4,56(–4,56)² = 20,793620,7936 * 3277 = 68140,63 De 30 a 345.313 (30 + 34)/2 = 32 32 * 5.313 = 170016 32 – 31,56 = +0,44(0,44)² = 0,19360,1936 * 5313 = 1028,59 De 35 a 393.964 (35 + 39)/2 = 37 37 * 3.964 = 146668 37 – 31,56 = +5,44(5,44)² = 29,593629,5936 * 3964 = 117309,03 De 40 a 441.137 (40 + 44)/7 = 4242 * 1.137 = 4775442 – 31,56 = +10,44(10,44)² = 108,9936 108,9936 * 1137 = 123925,84 De 45 a 4969 (45 + 49)/2 = 4747 * 69 = 324347 – 31,56 = +15,44(15,44)² = 238,3936238,3936 * 69 = 16449,16 TOTAL15.845 500015566010,71 Promedio500015/15845 = 31,56 Varianza566010,71/15845 = 35,7217 DesviaciónRaíz (35,7217) = 5,976765

34 Desarrollo del ejercicio 3: Literal b) b. El coeficiente de variabilidad. 34 Promedio500015/15845 = 31,56 Varianza566010,71/15845 = 35,7217 DesviaciónRaíz (35,7217) = 5,976765 C.V.5,976765/31,56 = 0,1893778 C.V. (%) 0,1893778 * 100 = 18,93778 %


Descargar ppt "BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO."

Presentaciones similares


Anuncios Google