Bioestadística Maricarmen Caamaño
Estadística 1. Recolección de datos sobre un fenómeno a estudiar 2. Interpretación de la información 3. Concluir sobre el fenómeno que ocurre
Un poco de historia de la estadística A.C. Registro de conteos de babilonios, egipcios, chinos. 1532 Registro semanal de muertes en Londres Sir W. Petty Orígenes de las teorías de probabilidad y estadística como correspondencia relativa a los juegos de azar (Pascal). (Época de la revolución científica) Se establecieron bases más amplias de la teoría de la probabilidad, mas allá de los juegos al azar. En meteorología y medicina fue Jakob Bernouilli. ~1900 (Galton & Pearson) Paso de estadística deductiva a inductiva Ronald A. Fisher (1890 − 1962), padre de la estadística moderna
Un poco de historia de la estadística Los editores de Lancet, encargaron a Hill escribir una serie de artículos destinados a explicar el uso correcto de la estadística en medicina; y se publicó un betseller: Principles of Medical Statistics ed Hasta el siglo XX se desarrolló la estadística como disciplina Ciencia Estadística Tiempo
Estadística Algunos ejemplos: Encuestas de opinión Mercadotecnia Política Salud Medicina Epidemiología/Salud Pública Estudios clínicos para evaluar medicamentos Social Economía Agricultura Nuevas semillas Pesticidas Evaluar equipo de agricultura
Porcentaje de desempleo INPC Encuestas de elección presidencial Conteo rápido Empate técnico Periodismo “Riesgo de ataque al corazón es 50% mayor con hipercolesterolemia” Comerciales: “Clínicamente probado” “Disminuye el riesgo de cáncer” Estadística
Los principios y metodología de estadística responden a lo siguiente ¿Qué datos recolecto? ¿Cuántos datos recolecto? ¿Cómo organizo los datos? ¿Cómo analizo los datos? ¿Cómo interpreto los resultados? ¿Cómo determino mis conclusiones para saber si son contundentes o algo inciertas?
Estadística La ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones
Bioestadística La bioestadística es una ciencia de la estadística que se ocupa de los problemas planteados dentro de las ciencias de la vida. Salud pública, Epidemiología, Nutrición Salud ambiental Investigación de servicios sanitarios. Genómica y poblaciones genéticas Medicina Ecología Bioensayos
Método científico Científicos: Son los que recolectan información empírica y la interpretan Los científicos formulan hipótesis Una hipótesis es una declaración que ubica una posible relación o asociación entre fenómenos estudiados Para probar una hipótesis se utiliza el método científico El método científico es: Serie de pasos lógicos que si se siguen ayudan a minimizar la distorsión de los hechos derivados de valores y creencias del propio investigador.
Método científico Problema – Idea - Observación Objetivos, justificación Definición de variables Hipótesis Revisión de métodos Diseño (Observación o experimentación) Conducción Análisis y síntesis Interpretación y discusión Conclusiones y recomendaciones Reporte. Conjunto de procedimientos lógicos que sigue la investigación para descubrir las relaciones internas y externas de los procesos de la realidad natural y socia
Diseño Elementos por estudiarse (sujetos, unidades) Criterios de inclusión y de eliminación. Forma de obtener los elementos (muestreo) Estructura de la investigación : Experimental u observacional Prospectivo o retrospectivo Longitudinal o transversal Descriptivo o comparativo ¿Qué, cómo, cuándo, con qué medir? Formas de captación Tamaño de muestra Validez externa (extrapolación ) Validez interna (control factores confusores) ¿Estudio piloto? Logística
CaracterísticasNombre Observacional Retrospectivo o Prospectivo Transversal Descriptivo Encuesta descriptiva Comparativo Encuesta comparativa Retrospectivo Longitudinal DescriptivoRevisión de casos Comparativo de efecto a causa Casos y controles Comparativo de causa a efecto Perspectiva histórica Prospectivo Descriptivo Estudio de una cohorte Comparativo Estudio de varias cohortes ExperimentalExperimento Matriz de clasificación de diferentes tipos de estudios
Tipos de diseños Diseños transversales Descripciones o asociaciones en un tiempo específico. Ejemplos: Comparar el IMC de niños que llevan lunch a la escuela y de niños que llevan dinero para comprar su lunch Determinar si existe una relación entre Glucosa en ayuno y los niveles de leptina Desarrollar un modelo que para predecir la densidad mineral ósea en mujeres pre-menopausicas a partir de factores de riesgo Determinar si existe una asociación de la deficiencia de micronutrimentos con la presencia de obesidad
Ejemplo de modelo transversal Plomo Arsénico NSECognición Talla para edad Edad Sexo Hb Zn Escuela
Tipos de diseños Diseños longitudinales Modelos causa-efecto. Evaluar cambios a través del tiempo Ejemplos Evaluar el efecto de un medicamento en los niveles de colesterol en adultos con hipercolesterolemia Determinar la influencia de la inseguridad alimentaria en la niñez con el estado nutricio u obesidad actual X1 Y1 Z1 X2 Y2 Z2 X3 Y3 Z3 Variables: Tiempo
Ensayos clínicos o experimentos Experimentos planeados con pacientes, diseñados para descubrir el tratamiento más apropiado para futuros pacientes con la misma condición médica. Se realizan con un pequeño número de pacientes. Infiere sobre el efecto del o los tratamientos en toda la población que requerirá dicho tratamiento en un futuro.
Tipos de ensayos clínicos Confirmar una hipótesis Estimar con precisión los efectos atribuibles al tratamiento y relacionar estos efectos con su significancia o relevancia clínica. Explorar asociaciones o diferencias Se definen objetivos Las pruebas estadísticas son flexibles porque están sujetas a lo que encontramos en los datos
Tipos de diseños en ensayos clínicos Paralelo Cruzado Diseños factoriales Estudios multicéntricos Consideraciones estadísticas Trat A Trat B Lavado Trat ATrat B Tiempo Trat A Trat B Tiempo Trat A+B Control Trat A Vs Control Trat B Vs Control Interacción A+B
Ejemplo de modelo longitudinal Edad Sexo Escuela Plomo inicial Plomo final Cognición inicial Cognición final Tratamiento Tiempo1 Tiempo2
Problemas metodológicos más comunes en artículos publicados
Guías internacionales para publicar estudios de investigación CONSORT Statement Consolidated Standards of Reporting Trials Ayuda para que autores reporten resultados ensayos clínicos aleatorizados con validez mediante: “Check list” Diagrama de flujo STROBE Statement The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: guidelines for reporting observational studies. “Check list”
Plan de análisis estadístico OBJETIVO HIPOTESIS DEFINICIÓN DE VARIABLES ANÁLISIS ESTADÍSTIC O PLAN DE ANÁLISIS ESTADÍSTICO DISEÑO
Consideraciones estadísticas en el diseño de un estudio Medición Buscamos un dato válido y confiable Definición de variables ¿Qué, cómo, cuándo, con qué medir? Validez interna (control factores confusores) Logística Aleatoriedad No hay certeza en el resultad o, solo cierta probabilidad Inferencia estadística Se generaliza un resultado a una población a partir de una muestra Elementos por estudiarse (sujetos, unidades) Criterios de inclusión y de eliminación. Forma de obtener los elementos (muestreo) Tamaño de muestra Validez externa (extrapolación )
Medición Medir es tipificar o caracterizar una propiedad en un elemento de estudio. Previamente se debe conceptualizar la propiedad por medirse y obtener un indicador mediante una operacionalización. X X1 X2... Xn CONCEPTO/FENÓMENO INDICADORES Validez o Exactitud.- Es el hecho de que el indicador represente el concepto o fenómeno sin error. ¿Báscula calibrada? ¿Personal entrenado y estandarizado? ¿Errores de dedo al capturar dato? Etc… Confiabilidad o Precisión.- Que en diferentes circunstancias las mediciones de un mismo elemento no cambien. Todos se pesan sin zapatos Usar misma báscula, mismo trabajador de campo Pesar a la misma hora Etc. OBESIDAD IMC %Grasa Cintura >30Kg/m 2 >30% > ?Cms
Validez y confiabilidad Buscando un dato real y confiable Confiabilidad Validez
Variables Debido a que al medir (obtener el indicador) con los métodos establecidos en diferentes elementos o en uno solo en diferentes épocas, se tienen generalmente resultados distintos; Se le llama variable al conjunto de posibles resultados. Ejemplos: Peso de una persona en kilogramos Temperatura de un paciente en centígrados Numero de episodios asmáticos por semana Sexo de una persona Grado de dolor en la rodilla
Tipos de variables Escala numérica. Se pueden calcular promedios, desviaciones estándar, modas, etc. Pruebas paramétricas Escalas ordinales Grados de intensidad sin precisar el incremento entre un grado y otro. Solo se pueden ordenar Escalas nominales Clasificación en una categoría. Se estudia la frecuencia de ocurrencia de los casos en cada una de las categorías.
Tipos de variables De acuerdo a la escala Nominales. Pueden ser binarias si tienen 2 categorías Ej. Sexo: Masculino, Femenino Ordinales. Ej. NSE: Bajo, medio, alto Intervalo. Ej. Rangos de edad Razón. Ej. Talla, peso Absoluta Ej. # de hijos, # episodios de diarrea Cualitativas y cuantitativas Cuantitativas – Numeros que cuantifican características. Cualitativas – Categóricas o de clasificación, los valores representan un grupo o categoría. Contínuas y discretas Contínuas - Puede tomar cualquier número dentro de un rango específico Discretas – Puede tomar solo ciertos valores (# hijos, sexo etc.) De estas variables se derivan las diferentes distribuciones.
Tipos de variables Identificar: Variable(s) Dependientes Variables Independientes Covariables Prima rias Secund arias Variables para controlar un posible sesgo. Se identifican para mejorar la predicción y/o para no confundir el efecto de la variable independiente con otra variable “confusora” que también tiene un efecto en la variable dependiente
Plan de análisis estadístico Tipos de variables dependientes y análisis estadísticos Discretas Binarias – Ocurrencia de un evento durante un período Análisis con regresión logística (razón de momios) o diferencia entre dos o más tazas o índices Conteo- Frecuencia de un evento durante un período Análisis con regresión logística (razón de momios) o diferencia entre dos o más tazas o índices Contínuas Variable continua – Ej. Mediciones bioquímicas Diferencia de medias en análisis de varianza Relación entre dos variables continuas mediante análisis de regresión lineal. Tiempo de un evento – El tiempo que tarda en ser observada la variable de interés Para análisis de supervivencia
Uso de variables categóricas Clasificación IMC Frecue nci a% Bajo peso384.2 Normal Sobrepeso Obesidad Total Clasif IMC * Sexo Sexo Total HombreMujer Normales y bajo peso Conteo %IMC % sexo Sobrepeso y obesos Conteo %IMC % sexo Total Conteo %IMC % sexo100
Uso de variables continuas Medidas de tendencia central Media Mediana Moda Percentiles Medidas de variabilidad de los datos Rango Desviación estándar Error estándar Coeficiente de variación Valores estándar (Z)
Uso de variables continuas IMC Sexo Total HombreMujer N Media18.5 Desv. Estándar Error estándar de la media Mediana Var categórica Var continua
Aleatoriedad y generación de conocimiento Determinismo Leyes causales La toxinas que se producen al quemar el tabaco al entrar en el tracto respiratorio se alojan y propician un ambiente para producción de células malignas. Se especifica ¿Qué toxinas?, ¿Qué cantidad de toxinas?, ¿Dónde se alojan?,¿Cómo se llegan a reproducir las células malignas?, etc. Indeterminismo Leyes probabilísticas Al estudiar un grupo grande de personas que viven con fumadores, el porcentaje de personas que contraen cáncer pulmonar oscila alrededor de un 5% Se especifica: ¿Cuántas personas estudio?, ¿Cuántos fumadores debe haber en el hogar?, ¿Cuántos cigarros se “exhalan” enfrente de la persona estudiada? ¿Qué edad tienen las personas estudiadas?, ¿Cuánto ejercicio hacen? Etc… Hoy la mayoría de físicos no acepta el determinismo fuerte
Aleatoriedad Existe variabilidad en los resultados de un experimento, parte de la variabilidad se debe al azar. No se puede predecir con certeza el resultado de un evento No hay modelos matemáticos que consideren TODOS los elementos del fenómeno Por la complejidad de los fenómenos, no se conoce todos los aspectos y leyes involucradas. Los pequeños cambios de condiciones iniciales tienen efectos muy grandes (Teoría del Caos)
Probabilidad Se utiliza para estudiar los fenómenos aleatorios
Estadística Inferencial Estadística descriptiva Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos Estadística inferencial Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Inferencia estadística ¿Qué tan seguros estamos de que lo que encontramos aplica para la población que representamos? Es el proceso de tratar de conocer algo relativo a la regularidad estadística de alguna medición en una cierta población. Población Muestra
Conceptos básicos Individuos o elementos: personas u objetos que contienen cierta información que se desea estudiar. Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes. Muestra: subconjunto representativo de una población. Parámetro: función definida sobre los valores numéricos de características medibles de una población. Estadístico: función definida sobre los valores numéricos de una muestra.
Conceptos básicos En relación al tamaño de la población, ésta puede ser: Finita, como es el caso del número de personas que llegan al servicio de urgencia de un hospital en un día; Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de caras y cruces obtenida en el lanzamiento repetido de una moneda al aire.
Conceptos básicos Ejemplo Consideremos la población formada por todos los estudiantes de la Universidad Autónoma de Querétaro (finita). La altura media de todos los estudiantes es el parámetro µ. El conjunto formado por los alumnos de la Facultad de Ciencias Naturales es una muestra de dicha población y la altura media de esta muestra, x, es un estadístico.
Estadística y matemáticas Áreas de las matemáticas: Aritmética (Números, operaciones, fracciones…) Álgebra (Relaciones numéricas en las que una o más cantidades son desconocidas: 4x+5) Álgebra lineal (Ecuaciones: x + y + z + t = 0 ) Geometría (propiedades de las figuras geométricas en el plano o el espacio con puntos, rectas, planos, etc.) Geometría analítica (estudia las figuras geométricas mediante álgebra en un sistema de coordenadas: Ecuación de la recta) Trigonometría (Estudio de las funciones seno, coseno, tangente, cotangente; secante y cosecante) Cálculo (Define asociaciones entre conjuntos de datos mediante funciones: f(x)=x 2 +4 y ecuaciones: y=a+bx) Estadística y probabilidad (Recoplia, ordena y clasifica datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones
EJEMPLO Estimar los niveles de glucosa en ayuno a partir del índice de masa corporal. Relación entre índice de masa corporal y glucosa en ayuno en mujeres: Ecuación de la recta: Y=a+bx a=58->Constante b=1.2-> Coeficiente x=IMC ->Variable Glucosa=58+1.2*IMC
Algebra Trabajar en álgebra consiste en manejar relaciones numéricas en las que una o más cantidades son desconocidas. Estas cantidades se llaman variables, incógnitas o indeterminadas y se representan por letras Una expresión algebraica es una combinación de letras y números ligadas por los signos de las operaciones: adición, sustracción, multiplicación, división y potenciación
Expresiones algebraicas Las expresiones algebraicas nos permiten, por ejemplo, hallar áreas y volúmenes 2x x 2 3x x 3 4x x y x +1 x/2 x/3
Expresiones algebraicas Un monomio es una expresión algebraica en la que las únicas operaciones que aparecen entre las variables son el producto y la potencia de exponente natural. Ej: 2x 2 y 3 z Coeficiente Parte literal Grado=2+3+1
Expresiones algebraicas Operaciones con monomios Para sumar dos o más monomios deben tener la misma parte literal: ax n + bx n = (a + b)x n 2x 2 y3 z + 3x 2 y3 z = 5x 2 y3 z Si las partes literales no son iguales entonces tenemos un polinomio
Expresiones algebraicas Un polinomio es una expresión algebraica de la forma: P(x) = a n x n + a n - 1 x n a n - 2 x n a 1 x 1 + a 0 Siendo a n, a n a 1, a 0 números, llamados coeficientes. n un número natural. x la variable o indeterminada. a n es el coeficiente principal. a 0 es el término independiente. El grado de un polinomio P(x) es el mayor exponente al que se encuentra elevado la variable x
Expresiones algebraicas Suma de polinomios P(x) = 2x 3 + 5x − 3 Q(x) = 4x − 3x 2 + 2x 3 P(x) + Q(x) = (2x 3 + 5x − 3) + (2x 3 − 3x 2 + 4x) P(x) + Q(x) = 2x 3 + 2x 3 − 3 x 2 + 5x + 4x − 3 P(x) + Q(x) = 4x 3 − 3x 2 + 9x − 3 Resta de polinomios P(x) − Q(x) = (2x 3 + 5x − 3) − (2x 3 − 3x 2 + 4x) P(x) − Q(x) = 2x 3 + 5x − 3 − 2x 3 + 3x 2 − 4x P(x) − Q(x) = 2x 3 − 2x 3 + 3x 2 + 5x − 4x − 3 P(x) − Q(x) = 3x2 + x − 3
Expresiones algebraicas Multiplicación de polinomios Un número por un polinomio 3 * (2x 3 − 3 x 2 + 4x − 2) = 6x 3 − 9x x − 6 Un monomio por un polinomio 3x 2 * (2x 3 − 3x 2 + 4x − 2) = 6x 5 − 9x x 3 − 6x 2 Un polinomio por un polinomio (2x 2 − 3) * (2x 3 − 3x 2 + 4x) = 4x 5 − 6x 4 + 8x 3 − 6x 3 + 9x 2 − 12x =4x 5 − 6x 4 + 2x 3 + 9x 2 − 12x
Ecuaciones Una ecuación establece una igualdad 2x+3 = 5x-2 Ecuaciones de primer grado o lineales 5x + 3 = 2x +1 Ecuaciones de primer grado o lineales: a+bx=0 Ecuaciones de 2º grado o cuadráticas 5x + 3 = 2x 2 + x Ecuaciones de 2º grado o cuadráticas: ax 2 +bx+c=0 Ecuaciones de 3er grado 5x = 2x +x 2
Ecuaciones Ecuaciones exponenciales: La incógnita aparece en el exponente: 2 2x-1 =4 Ecuaciones logarítmicas: La incógnita aparece afectada por un logaritmo log2=2*log(5-x)
Funciones Una función es una relación entre dos magnitudes, de tal manera que a cada valor de la primera le corresponde un único valor de la segunda. El nivel de glucosa en ayuno de una mujer viene dado por: y= 58*1.2x Siendo x el índice de masa corporal Esta función relaciones dos variables: Glucosa e IMC y es la variable dependiente (la glucosa depende del IMC) y x es la variable independiente
Funciones La función se representa en un plano cartesiano: x y Función lineal: y= x
Funciones La pendiente (m) o coeficiente o β es la inclinación de la recta con respecto al eje de abscisas. Si la pendiente es positiva el ángulo es agudo, si es negativa, el ángulo es obtuso:
Funciones Función constante Y=x La pendiente es 0 Y=3
Otras funciones Función exponencial: Y(x)=b a x Función logarítmica Y(x)=ln(x)