La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Bioestadística Aplicada I NMRCD – Programa GEIS UPCH – FASPA ABE Perú.

Presentaciones similares


Presentación del tema: "Bioestadística Aplicada I NMRCD – Programa GEIS UPCH – FASPA ABE Perú."— Transcripción de la presentación:

1 Bioestadística Aplicada I NMRCD – Programa GEIS UPCH – FASPA ABE Perú

2 Bioestadística Aplicada Segunda clase: n Repaso clase anterior n Inferencia estadística y estimación n Tipos de datos (énfasis en categóricos) n Intervalos de confianza (énfasis en proporciones)

3 Bioestadística Aplicada Tipos de archivos: n Bases de datos n Programas o comandos n Resultados n Gráficos

4 Bioestadística Aplicada Guía del buen analista: n Grabar siempre sus resultados: log using xxx al inicio de la sesion, y log close al final n Siempre crear un programa.do con los comandos utilizados (Review) para poder repetirlos si fuera necesario n No editar los datos directamente (a mano) y crear variables de trabajo con los cambios n Documentar sus programas.do

5 Bioestadística Aplicada INFERENCIA ESTADISTICA

6 Bioestadística Aplicada Cualquier persona con malaria en el norte del Perú Casos de malaria en Sullana Universo teórico Universo “real”: marco muestral Casos enero- marzo 2004 Sujetos bajo estudio: muestra MUESTREO GENERALIZACION Proceso: DELIMITACION

7 Bioestadística Aplicada Tipos de inferencia estadística: n Estimación: –Cálculo numérico de un cierto parámetro en la población –En forma puntual y con intervalo de variabilidad n Prueba de hipótesis: –Respuesta a una hipótesis o pregunta sobre el valor de un parámetro en la población –No se logra tener certeza: la respuesta se da como una probabilidad

8 Bioestadística Aplicada TIPOS DE VARIABLES

9 Bioestadística Aplicada Cuantificando observaciones: n Variables n Estados o valores n Probabilidades

10 Bioestadística Aplicada

11 Clasificación general: CategóricaCuantitativa o numérica NominalOrdinalDiscretaContinua

12 Bioestadística Aplicada Ejemplos: n Nominales: Sexo, estado civil, presencia de morbilidad, resultado del tratamiento n Ordinales: Severidad de morbilidad, riesgo quirúrgico, resistencia a antibioticos n Discretas: Cociente intelectual, tiempo de tratamiento u hospitalización n Contínuas: concentración de alcohol en la sangre

13 Bioestadística Aplicada En la base de datos: id_reg Región inf_sexo Sexo inf_edad Edad p35 ¿Cuál es el nivel de educación alcanzado? p56 En su grupo de amigos, ¿Con qué frecuencia fuma? p58 ¿Cuándo fue la primera vez que Ud. fumó cigarrillos? p59 ¿Qué edad tenía cuando fumó cigarrillos por primera vez? p62 Y, ¿Cuándo fue la última vez que Ud. fumó cigarrillos? p64 ¿Con qué frecuencia fuma Ud. cigarrillos? p65 Más o menos, ¿Cuántos cigarrillos al día fuma Ud.? p66 Más o menos, ¿Cuántos cigarrillos fumó en los últimos 30d? p87 ¿Cuándo fue la primera vez que Ud. bebió? p88 La primera vez que Ud. bebió, ¿Qué bebida tomó? p89 ¿A que edad Ud. bebió por primera vez? p90 ¿Con quién estaba Ud. la primera vez que tomó? p92 Y, ¿Cuándo fue la última vez que Ud. bebió? p94 ¿Con qué frecuencia toma Ud. alguna bebida alcohólica? arsoc2 Estrato social

14 Bioestadística Aplicada En sus trabajos, que tipo de dato es su variable respuesta, resultado o desenlace principal?

15 Bioestadística Aplicada Categorización/discretización: n Las variables continuas pueden ser convertida en variables discretas y hasta en categóricas n En este proceso se pierde información (precisión) n La información debe obtenerse al mayor nivel de precisión posible y luego agruparse si fuera necesario (discretización)

16 Bioestadística Aplicada Definiciones especiales: n Categóricas dicotómicas o de más de dos valores n Cuantitativas con distribución normal o no n Discretas tipo conteo: números de casos reportados, CD4, carga viral o parasitaria n Cuantitativas truncadas: ingresos, edad, peso/talla n Tiempo para evento: edad de inicio del consumo (considerando a no consumidores)

17 Bioestadística Aplicada DESCRIBIENDO DATOS CATEGORICOS

18 Bioestadística Aplicada Como podemos describir datos? Para describir la distribución de una variable en un grupo, describamos tanto su tendencia central (agrupación en torno a un valor particular), así como también una medida del grado en que los valores se alejan del centro, brindando una medida de dispersión

19 Bioestadística Aplicada Medidas de tendencia central: n Promedio o media aritmética. Mas sensible a valores extremos n Mediana o percentil 50: Valor que divide una distribución ordenada por la mitad n Moda: Valor mas frecuente. Es mas usada para variables categóricas

20 Bioestadística Aplicada Medidas de dispersión: n Rango n Intervalo intercuartil (diferencia entre los percentiles 25 y 75) n Desviación estándar: en que monto promedio se desvían los valores observados de la media n Varianza: media de las desviaciones (DE) elevada al cuadrado (?)

21 Bioestadística Aplicada

22 Tendencia central en datos categóricos: n Mediana o percentil 50: Valor que divide una distribución ordenada por la mitad (variables ordinales solamente) n Moda: Valor mas frecuente

23 Bioestadística Aplicada n Rango n Intervalo intercuartil (diferencia entre los percentiles 25 y 75, para variables ordinales solamente) Dispersión en datos categóricos:

24 Bioestadística Aplicada DESCRIBIENDO VARIABLES DICOTOMICAS

25 Bioestadística Aplicada Variables dicotómicas:

26 Bioestadística Aplicada Fenómenos tipo Bernoulli: n Se aplican a variables dicotómicas n Representan la ocurrencia o no ocurrencia de UN evento, por ejemplo: el sexo de CADA UNA de las personas encuestadas n Toman solamente dos posibles valores o estados: hombre (1) o mujer (2) n Solo se aplican a nivel unitario: un dato, persona u observación

27 Bioestadística Aplicada Distribución Binomial: n Es un conjunto de variables Bernoulli del mismo tipo, por ejemplo, el sexo de las 4,850 personas encuestadas n La variable en estudio (sexo) tiene también dos valores (hombre/mujer), los cuales ocurren con frecuencias relativas (p) y (1-p) simétricas n El valor p es la frecuencia relativa o proporción de hombres entre las personas encuestadas

28 Bioestadística Aplicada Pero, nos interesa realmente la muestra o la población? n Esta exploración es parte de un proceso de inferencia estadística n Queremos extrapolar conclusiones a la población n Nuestro primer objetivo es hacer una estimación a nivel de la población: –Cálculo numérico de un cierto parámetro en la población –En forma puntual y con intervalo de variabilidad

29 Bioestadística Aplicada Rápidamente:

30 Bioestadística Aplicada Transformando sexo a 0/1:

31 Bioestadística Aplicada Estimación: Puntual: determina que posible valor del parámetro de la población es mas consistente con los datos observados en la muestra. Ejemplo: ell cálculo de una tasa de incidencia, un RR o un promedio Por intervalo: cuantifica la incertidumbre o variabilidad que tiene una estimación. Ejemplo: el cálculo de un intervalo de confianza

32 Bioestadística Aplicada Intervalo de confianza: n Intervalo construido bajo condiciones tales que con una cierta probabilidad (usualmente 95%) contenga al parámetro deseado n Intervalo calculado de acuerdo a principios tales que 95 de cada 100 intervalos similarmente construidos contendrán el valor del parámetro n Uno puede tener 95% de confianza en afirmar que ese intervalo contiene el valor real del parámetro

33 Bioestadística Aplicada Verdadero valor del parámetro Intervalos de confianza de varias muestras (solo teórico) Rango de valores valores del parámetro Intervalo calculado con LA UNICA muestra obtenida Conceptualmente:

34 Bioestadística Aplicada El Teorema del Límite Central da validez a los intervalos de confianza n La media de una muestra “grande” de datos de cualquier tipo sigue una distribución normal n Esto aún se cumple para datos binomiales (sexo, prevalencia, sensibilidad, etc) n Qué es una muestra grande? Eso varía según cada tipo de dato (entre otras cosas) n A medida que el tamaño de muestra crece, la distribución de la media muestral se hace más normal

35 Bioestadística Aplicada n=2 n=5 n=30 n=3 n=15 n=60

36 Bioestadística Aplicada En resumen: n Un intervalo de confianza tiene una cierta probabilidad (usualmente 95%) de contener al parámetro deseado n El TLC da validez a esta afirmación en muestras grandes para todo tipo de datos n En datos binomiales, el IC tiene una probabilidad de 95% de incluir a la prevalencia o proporción de interés

37 Bioestadística Aplicada Hagamos otros ejemplos: n Proporción de personas que no ha completado educacion primaria n Proporción de personas que ha fumado alguna vez n Proporción de personas que ha comenzado a tomar en los últimos 30 dias


Descargar ppt "Bioestadística Aplicada I NMRCD – Programa GEIS UPCH – FASPA ABE Perú."

Presentaciones similares


Anuncios Google