Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porLuis Sandoval Morales Modificado hace 7 años
1
Bioestadística Aplicada I NMRCD – Programa GEIS UPCH – FASPA ABE Perú
2
Bioestadística Aplicada Segunda clase: n Repaso clase anterior n Inferencia estadística y estimación n Tipos de datos (énfasis en categóricos) n Intervalos de confianza (énfasis en proporciones)
3
Bioestadística Aplicada Tipos de archivos: n Bases de datos n Programas o comandos n Resultados n Gráficos
4
Bioestadística Aplicada Guía del buen analista: n Grabar siempre sus resultados: log using xxx al inicio de la sesion, y log close al final n Siempre crear un programa.do con los comandos utilizados (Review) para poder repetirlos si fuera necesario n No editar los datos directamente (a mano) y crear variables de trabajo con los cambios n Documentar sus programas.do
5
Bioestadística Aplicada INFERENCIA ESTADISTICA
6
Bioestadística Aplicada Cualquier persona con malaria en el norte del Perú Casos de malaria en Sullana Universo teórico Universo “real”: marco muestral Casos enero- marzo 2004 Sujetos bajo estudio: muestra MUESTREO GENERALIZACION Proceso: DELIMITACION
7
Bioestadística Aplicada Tipos de inferencia estadística: n Estimación: –Cálculo numérico de un cierto parámetro en la población –En forma puntual y con intervalo de variabilidad n Prueba de hipótesis: –Respuesta a una hipótesis o pregunta sobre el valor de un parámetro en la población –No se logra tener certeza: la respuesta se da como una probabilidad
8
Bioestadística Aplicada TIPOS DE VARIABLES
9
Bioestadística Aplicada Cuantificando observaciones: n Variables n Estados o valores n Probabilidades
10
Bioestadística Aplicada
11
Clasificación general: CategóricaCuantitativa o numérica NominalOrdinalDiscretaContinua
12
Bioestadística Aplicada Ejemplos: n Nominales: Sexo, estado civil, presencia de morbilidad, resultado del tratamiento n Ordinales: Severidad de morbilidad, riesgo quirúrgico, resistencia a antibioticos n Discretas: Cociente intelectual, tiempo de tratamiento u hospitalización n Contínuas: concentración de alcohol en la sangre
13
Bioestadística Aplicada En la base de datos: id_reg Región inf_sexo Sexo inf_edad Edad p35 ¿Cuál es el nivel de educación alcanzado? p56 En su grupo de amigos, ¿Con qué frecuencia fuma? p58 ¿Cuándo fue la primera vez que Ud. fumó cigarrillos? p59 ¿Qué edad tenía cuando fumó cigarrillos por primera vez? p62 Y, ¿Cuándo fue la última vez que Ud. fumó cigarrillos? p64 ¿Con qué frecuencia fuma Ud. cigarrillos? p65 Más o menos, ¿Cuántos cigarrillos al día fuma Ud.? p66 Más o menos, ¿Cuántos cigarrillos fumó en los últimos 30d? p87 ¿Cuándo fue la primera vez que Ud. bebió? p88 La primera vez que Ud. bebió, ¿Qué bebida tomó? p89 ¿A que edad Ud. bebió por primera vez? p90 ¿Con quién estaba Ud. la primera vez que tomó? p92 Y, ¿Cuándo fue la última vez que Ud. bebió? p94 ¿Con qué frecuencia toma Ud. alguna bebida alcohólica? arsoc2 Estrato social
14
Bioestadística Aplicada En sus trabajos, que tipo de dato es su variable respuesta, resultado o desenlace principal?
15
Bioestadística Aplicada Categorización/discretización: n Las variables continuas pueden ser convertida en variables discretas y hasta en categóricas n En este proceso se pierde información (precisión) n La información debe obtenerse al mayor nivel de precisión posible y luego agruparse si fuera necesario (discretización)
16
Bioestadística Aplicada Definiciones especiales: n Categóricas dicotómicas o de más de dos valores n Cuantitativas con distribución normal o no n Discretas tipo conteo: números de casos reportados, CD4, carga viral o parasitaria n Cuantitativas truncadas: ingresos, edad, peso/talla n Tiempo para evento: edad de inicio del consumo (considerando a no consumidores)
17
Bioestadística Aplicada DESCRIBIENDO DATOS CATEGORICOS
18
Bioestadística Aplicada Como podemos describir datos? Para describir la distribución de una variable en un grupo, describamos tanto su tendencia central (agrupación en torno a un valor particular), así como también una medida del grado en que los valores se alejan del centro, brindando una medida de dispersión
19
Bioestadística Aplicada Medidas de tendencia central: n Promedio o media aritmética. Mas sensible a valores extremos n Mediana o percentil 50: Valor que divide una distribución ordenada por la mitad n Moda: Valor mas frecuente. Es mas usada para variables categóricas
20
Bioestadística Aplicada Medidas de dispersión: n Rango n Intervalo intercuartil (diferencia entre los percentiles 25 y 75) n Desviación estándar: en que monto promedio se desvían los valores observados de la media n Varianza: media de las desviaciones (DE) elevada al cuadrado (?)
21
Bioestadística Aplicada
22
Tendencia central en datos categóricos: n Mediana o percentil 50: Valor que divide una distribución ordenada por la mitad (variables ordinales solamente) n Moda: Valor mas frecuente
23
Bioestadística Aplicada n Rango n Intervalo intercuartil (diferencia entre los percentiles 25 y 75, para variables ordinales solamente) Dispersión en datos categóricos:
24
Bioestadística Aplicada DESCRIBIENDO VARIABLES DICOTOMICAS
25
Bioestadística Aplicada Variables dicotómicas:
26
Bioestadística Aplicada Fenómenos tipo Bernoulli: n Se aplican a variables dicotómicas n Representan la ocurrencia o no ocurrencia de UN evento, por ejemplo: el sexo de CADA UNA de las personas encuestadas n Toman solamente dos posibles valores o estados: hombre (1) o mujer (2) n Solo se aplican a nivel unitario: un dato, persona u observación
27
Bioestadística Aplicada Distribución Binomial: n Es un conjunto de variables Bernoulli del mismo tipo, por ejemplo, el sexo de las 4,850 personas encuestadas n La variable en estudio (sexo) tiene también dos valores (hombre/mujer), los cuales ocurren con frecuencias relativas (p) y (1-p) simétricas n El valor p es la frecuencia relativa o proporción de hombres entre las personas encuestadas
28
Bioestadística Aplicada Pero, nos interesa realmente la muestra o la población? n Esta exploración es parte de un proceso de inferencia estadística n Queremos extrapolar conclusiones a la población n Nuestro primer objetivo es hacer una estimación a nivel de la población: –Cálculo numérico de un cierto parámetro en la población –En forma puntual y con intervalo de variabilidad
29
Bioestadística Aplicada Rápidamente:
30
Bioestadística Aplicada Transformando sexo a 0/1:
31
Bioestadística Aplicada Estimación: Puntual: determina que posible valor del parámetro de la población es mas consistente con los datos observados en la muestra. Ejemplo: ell cálculo de una tasa de incidencia, un RR o un promedio Por intervalo: cuantifica la incertidumbre o variabilidad que tiene una estimación. Ejemplo: el cálculo de un intervalo de confianza
32
Bioestadística Aplicada Intervalo de confianza: n Intervalo construido bajo condiciones tales que con una cierta probabilidad (usualmente 95%) contenga al parámetro deseado n Intervalo calculado de acuerdo a principios tales que 95 de cada 100 intervalos similarmente construidos contendrán el valor del parámetro n Uno puede tener 95% de confianza en afirmar que ese intervalo contiene el valor real del parámetro
33
Bioestadística Aplicada Verdadero valor del parámetro Intervalos de confianza de varias muestras (solo teórico) Rango de valores valores del parámetro Intervalo calculado con LA UNICA muestra obtenida Conceptualmente:
34
Bioestadística Aplicada El Teorema del Límite Central da validez a los intervalos de confianza n La media de una muestra “grande” de datos de cualquier tipo sigue una distribución normal n Esto aún se cumple para datos binomiales (sexo, prevalencia, sensibilidad, etc) n Qué es una muestra grande? Eso varía según cada tipo de dato (entre otras cosas) n A medida que el tamaño de muestra crece, la distribución de la media muestral se hace más normal
35
Bioestadística Aplicada n=2 n=5 n=30 n=3 n=15 n=60
36
Bioestadística Aplicada En resumen: n Un intervalo de confianza tiene una cierta probabilidad (usualmente 95%) de contener al parámetro deseado n El TLC da validez a esta afirmación en muestras grandes para todo tipo de datos n En datos binomiales, el IC tiene una probabilidad de 95% de incluir a la prevalencia o proporción de interés
37
Bioestadística Aplicada Hagamos otros ejemplos: n Proporción de personas que no ha completado educacion primaria n Proporción de personas que ha fumado alguna vez n Proporción de personas que ha comenzado a tomar en los últimos 30 dias
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.