La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Curso de Bioestadística Parte 3 Tipos de datos, resumen y presentación Dr. en C. Nicolás Padilla Raygoza Facultad de Enfermería y Obstetricia de Celaya.

Presentaciones similares


Presentación del tema: "Curso de Bioestadística Parte 3 Tipos de datos, resumen y presentación Dr. en C. Nicolás Padilla Raygoza Facultad de Enfermería y Obstetricia de Celaya."— Transcripción de la presentación:

1 Curso de Bioestadística Parte 3 Tipos de datos, resumen y presentación Dr. en C. Nicolás Padilla Raygoza Facultad de Enfermería y Obstetricia de Celaya Universidad de Guanajuato México

2 Presentación Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic International University. Profesor Asociado B, Facultad de Enfermería y Obstetricia de Celaya, Universidad de Guanajuato.

3 Competencias Describirá los tipos de variables. Analizará como resumir y presentar los diferentes tipos de variables. Aplicará fórmulas para calcular medidas de tendencia central y las localizará en gráficas. Aplicará fórmulas para calcular medidas de dispersión y las localizará en gráficas.

4 Definiciones Datos se colectan sobre las características específicas de cada sujeto, formándose grupos para ser comparados. Estas características se llaman variables, ya que cambian de sujeto a sujeto. La variable se obtiene por ser: Un resultado de interés-variable dependiente O explica a la variable dependiente - factor de riesgo- exposición-variable independiente.

5 Tipos de datos Clasificación por su escala de medición: Cualitativas Dicotómicas-binarias Ordinales Nominales Cuantitativas Discretas Continuas

6 Tipos de datos-Ejemplos Cualitativas Dicotómicas-binarias Sexo: masculino o femenino. Status de empleo: empleado o desempleado. Ordinales Nivel socioeconómico: alto, medio o bajo. Nominales Sitio de residencia: centro, sur, norte, este, oeste Estado civil: soltero, casado, viudo, divorciado, unión libre Cuantitativas Discretas Número de hijos: 1,2,3,4. Continuas Nivel de glucosa en sangre: 110 mg/dl, 145 mg/dl.

7 Resumen de datos Generalmente queremos presentar los datos en forma resumida. El número de veces que un dato ocurre, es de interés ya que nos presenta la distribución de una variable. Se puede generar una lista de frecuencias para variables cuantitativas o cualitativas.

8 Resumen de datos categóricos Podemos obtener frecuencias de datos categóricos y resumirlos en una tabla o gráfica. Ejemplo: tenemos 21 diagnósticos de parásitos aislados en heces de niños. Giardia lamblia Entamoeba histolytica Ascaris lumbricoides Enterobius vermicularis Ascaris lumbricoides Enterobius vermicularis Giardia lamblia Entamoeba histolytica Ascaris lumbricoides Enterobius vermicularis Ascaris lumbricoides Enterobius vermicularis Giardia lamblia Entamoeba histolytica Ascaris lumbricoides Enterobius vermicularis Ascaris lumbricoides Enterobius vermicularis Giardia lamblia

9 Resumen de datos categóricos La lista de parásitos detectados nos da una idea de la frecuencia de cada parásito, pero no es una forma clara. Si los ordenamos, nos clarifica la presentación. Giardia lamblia Ascaris lumbricoides Enterobius vermicularis Entamoeba histolytica

10 Resumen de datos categóricos Podemos presentar los resultados en una distribución de frecuencias. Parásiton Giardia lamblia6 Ascaris lumbricoides6 Enterobius vermicularis6 Entamoeba histolytica3 Total21 Distribución de frecuencias de parásitos intestinales detectados en niños en el CAISES Celaya, n=21 Fuente: Reporte de Laboratorio

11 Resumen de datos categóricos Es de utilidad, presentar los frecuencia de cada categoría, expresada como el porcentaje de la frecuencia total. Se le llama distribución de frecuencias relativas Distribución de frecuencias relativas de parásitos intestinales detectados en niños en el CAISES Celaya, n=21 Fuente: Reporte de Laboratorio Parásiton% Giardia lamblia Ascaris lumbricoides Enterobius vermicularis Entamoeba histolytica Total

12 Resumen de datos categóricos En ocasiones el número de categorías puede ser elevado y debemos procurar disminuir el número de categorías. Causa de defunciónn% Enfermedad cardiovascular12, Cáncer10, Infecciones de vías respiratorias bajas 8, Otras25, Total57, Distribución por causa de muerte en Celaya, Gto. durante 2007 Fuente: Certificados de defunción

13 Distribución de frecuencias para datos cuantitativos Con datos cuantitativos, necesitamos agrupar los datos, antes de presentarlos en una tabla de frecuencias o de frecuencias relativas. Edad en añosn% Total Distribución de frecuencias de estudiantes de la FEOC que han fumado al menos una vez. N=534 Fuente: Encuesta de salud

14 Distribución de frecuencias para datos cuantitativos Con datos cuantitativos, es de utilidad calcular la frecuencia acumulada. Distribución de frecuencias de estudiantes de la FEOC que han fumado al menos una vez. N=534 Fuente: Encuesta de salud Edad en añosn% acumulado Total

15 Distribución de frecuencias para datos cuantitativos agrupados Con frecuencia hay muchas categorías de datos cuantitativos, por lo tanto tenemos que calcular intervalos para cada categoría. Distribución de frecuencias de edades de niños con faingoamigdalitis aguda Fuente: Padilla N, Moreno M. Comparación entre claritromicina, azitromicina y propicillina en el manejo de faringoamigdalitis aguda estreptocóccica en niños. Archivos de Investigación Pediátrica de México 2005; 8:5-11. Edad en añosn% < Total

16 Distribución de frecuencias para datos cuantitativos agrupados Distribución de frecuencias de edades de niños con faingoamigdalitis aguda Fuente: Padilla N, Moreno M. Comparación entre claritromicina, azitromicina y propicillina en el manejo de faringoamigdalitis aguda estreptocóccica en niños. Archivos de Investigación Pediátrica de México 2005; 8:5-11. Edad en añosn% < Total

17 Agrupamiento de datos Guía Obtenga el valor mínimo y máximo y decida el número de intervalos. Número de intervalos entre Asegurar los límites del intervalo. Asegurar que los intervalos sean de la misma amplitud. Evitar que el primer y/o último intervalo queden abiertos.

18 Datos categóricos Gráfica de barras Gráfica de pastel Datos numéricos Histograma Polígono de frecuencias Gráficas

19 Gráfica de barras La frecuencia o frecuencia relativa de una variable categórica, se puede mostrar fácilmente con una gráfica de barras. Se usan para datos categóricos o numéricos discretos. Cada barra representa una categoría y su altura es la frecuencia o frecuencia relativa. Las barras deben estar separadas. Es importante que el eje Y inicie en 0.

20 Gráfica de barras

21 Gráfica de barras agrupadas Si tenemos una variable categórica nominal, dividida en dos categorías, podemos mostrar los datos con una gráfica de barras agrupadas. Permite fácil comparación entre grupos.

22 Gráfica de barras agrupadas

23 Gráfica de pastel Son una alternativa para mostrar una variable categórica. Cada rebanada corresponde a la frecuencia o frecuencia relativa de las categorías de la variable. Sólo muestra una variable a la vez. Si se quiere hacer comparaciones se tienen que hacer dos pasteles.

24 Gráfica de pastel

25

26 Gráficas de distribuciones de frecuencias: histogramas De utilidad para variables numéricas. No hay espacios entre las barras. El área de la barra, no su altura, representan su frecuencia. El eje X debe ser continuo. El eje Y debe iniciar en 0. La amplitud representa el intervalo de cada grupo.

27 Gráficas de distribuciones de frecuencias: histogramas

28 Gráficas de distribuciones de frecuencias: polígono de frecuencias Es otra forma de representar la distribución de frecuencias de una variable numérica. Se construye uniendo el punto medio más alto de cada barra del histograma. Debe tomarse en cuenta la amplitud de las barras. Se puede trazar más de un polígono de frecuencias en una gráfica, para poder hacer comparaciones.

29 Gráficas de distribuciones de frecuencias: polígono de frecuencias

30 Gráficas de distribuciones de frecuencias: histograma acumulado Se puede trazar directamente de una tabla de frecuencias acumuladas. No es necesario hacer ajustes en la altura de las barras, ya que las frecuencias acumuladas representan la frecuencia total superior, incluyendo el límite superior del intervalo en cuestión.

31 Gráficas de distribuciones de frecuencias: histograma acumulado

32 Gráficas de distribuciones de frecuencias: polígono de frecuencias acumulado Se usan para ver proporciones por debajo o por arriba de un punto de la curva. Podemos leer la mediana y los percentiles directamente. Si la distribución es simétrica, tendrá forma de S simétrica. Si esta sesgada a la derecha o a la izquierda estará aplanada de ese lado.

33 Gráficas de distribuciones de frecuencias: histograma acumulado

34 Otras gráficas: tronco y hoja Se usan para exhibición directa de datos cuantitativos o paso preliminar para la construcción de una distribución de frecuencias. Se organizan los datos, determinando el número de divisiones (5-15). Se traza una línea vertical y se coloca el primer dígito (tronco) de la categoría a la izquierda de la línea y el segundo dígito (hojas) a la derecha de la línea vertical.

35 Otras gráficas: tronco y hoja Pacie nte Eda d

36 Otras gráficas: caja y línea Se traza una línea vertical que representa el rango de la distribución. Se traza una línea horizontal que representa el tercer cuartil y otra que representa el primer cuartil. El punto medio de la distribución se señala con una línea horizontal dentro de la caja.

37 Otras gráficas: caja y línea

38 Medidas de localización Para una variable categórica: porcentaje Para variable cuantitativa: Medidas de tendencia central: Media Mediana Modo Medidas de dispersión: Desviación estándar Percentiles Rango

39 Medidas de tendencia central Media Es el promedio convencional. Si decimos de n observaciones tiene un valor x i, entonces el valor de la media será: _ X =Σx i /n

40 Medidas de tendencia central en una distribución de frecuencias Cada valor de los datos (x i ) ocurre con una frecuencia (f i ), entonces: En una distribución agrupada, utilizamos los puntos medios de los intervalos como valor de x _ X =Σx i f i /n

41 Medidas de tendencia central en una distribución de frecuencias Intervalo Punto medio Frecuencia (fi) _________________________________ 1 – – – – – _________________________________ Total 114 Ejemplo de la media para una distribución agrupada (2 x 18) + (5 x 27) + (8 x 34) + (11 x 22) + (14 x 13) Media = = = = 7.61 ( ) Media = 7.61 años

42 Medidas de tendencia central Mediana Es el valor que divide a la distribución en dos mitades iguales. Si es un número par de observaciones, los valores centrales, se suman y se dividen entre dos. 51.2, 53.5, 55.6, 65.0, 74.2 la mediana es el valor que está a la mitad, así: Mediana = , 53.5, 55.6, 61.4, 65.0, 74.2, /2 = Mediana 58.5

43 Medidas de tendencia central para distribuciones de frecuencias Mediana Es el valor donde está el 50%.

44 Medidas de tendencia central Modo Es el valor que ocurre más frecuentemente Intervalo Punto medio Frecuencia (fi) _________________________________ 1 – – – – – _________________________________ Total 114

45 Medidas de tendencia central Propiedades La media es sensible a las colas, la mediana y el modo, no El modo puede ser afectado por pequeños cambios en los datos, la media y la mediana no. El modo y la mediana se puede localizar en una gráfica. Las tres medidas son iguales en una distribución Normal.

46 Medidas de tendencia central ¿Cuál medida usar? Para distribuciones sesgadas, se usa la mediana. Para análisis estadístico e inferencia, se usa más la media.

47 Medidas de dispersión Rango Se señalan el valor mínimo y máximo y la diferencia entre ellos. 51.2, 53.5, 55.6, 61.4, 65.0, 74.2 El rango de esta distribución es 51.2 – 74.2 kg. Sin embargo los valores extremos de esta distribución están alejados del centro de la distribución, oscureciendo el hecho de que la mayoría de los datos están 53.5 y 65 kg.

48 Medidas de dispersión Percentiles Un percentil o centil es el valor abajo del cual, un porcentaje dado de los datos, ha ocurrido. Examine la distribución de la estatura en esta población. ¿Cuál es el rango, mediana, percentil 25 y percentil 75? Estatura en cm. n Frecuencia relativa (%) Frecuencia acumulada (%) Total

49 Medidas de dispersión Desviación estándar Es la forma más común de cuantificar la variabilidad de una distribución. Mide que tan alejando está cada valor de su media. Sujeto Altura Valor Σ Xi - X Desviación media = n _ X= 1.7 Desviación media = (-1)+(0)+(+1)/3 = 0

50 Medidas de dispersión Desviación estándar Debemos interesarnos más por la magnitud de las desviaciones. Si elevamos al cuadrado cada desviación, tendremos valores positivos. Si dividimos esa suma entre n -1, obtendremos la varianza y si obtenemos la raíz cuadrada, tendremos la desviación estándar. Sujeto Altura Valor 2 Σ (Xi - X) Desviación estándar = n _ X= 1.7 Desviación estándar = 0.2/2 = 0.32

51 Medidas de dispersión para datos agrupados Desviación estándar Se usa el punto medio de cada intervalo. Σ f(Xi - X) 2 Desviación estándar = f - 1 También puede expresarse: Σfx 2 - (Σfx) 2 /Σf Desviación estándar = Σ f -1

52 Medidas de dispersión para datos agrupados Para datos distribuidos normalmente Alrededor del 68% de los datos están dentro de 1 desviación estándar. Alrededor del 95% de los datos están dentro de 2 desviaciones estándar. Alrededor del 99.9% de los datos están dentro de 3 desviaciones estándar. La desviación estándar es una medición de la anchura de la distribución. Si la desviación estándar cambia, también cambia la distribución.

53 Bibliografía 1.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991.


Descargar ppt "Curso de Bioestadística Parte 3 Tipos de datos, resumen y presentación Dr. en C. Nicolás Padilla Raygoza Facultad de Enfermería y Obstetricia de Celaya."

Presentaciones similares


Anuncios Google