La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Curso de Bioestadística Parte 17 Métodos no paramétricos

Presentaciones similares


Presentación del tema: "Curso de Bioestadística Parte 17 Métodos no paramétricos"— Transcripción de la presentación:

1 Curso de Bioestadística Parte 17 Métodos no paramétricos
Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México

2 Presentación Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic International University. Profesor Asociado C, Departamento de Enfermería y Obstetricia, División Ciencias de la Salud e Ingenierías, Campus Celaya Salvatierra, Universidad de Guanajuato.

3 Competencias Aplicará pruebas no paramétricas para análisis de datos
Obtendrá intervalo de confianza para análisis no paramétrico Aplicará prueba de rangos señalados de Wilcoxon Aplicará prueba de suma de rangos de Wilcoxon Alicará r de Spearman.

4 Introducción Métodos paramétricos
Se basan en medias, desviaciones estándar o probabilidades. La distribución Normal no es siempre apropiada Para estudiar variables con pocas observaciones, Distribuciones asimétricas, o Variables que pueden tomar más de dos valores Hasta ahora, hemos utilizado métodos que suponen que la variable tiene una distribución con algunas características: a) la distribución es Normal, para datos cuantitativos, y b) para datos binarios, la distribución es binomial, con una probabilidad, p. Las medias, desviaciones estándare4s y probabilidades, son llamados parámetros y los métodos que hacen suposiciones acerca de esos parámetros, se llaman métodos paramétricos. Existen otras distribuciones, en las que no se asume que sean Normales o binomiales, como cuando el tamaño de muestra es pequeño, los datos cuantitativos no tienen una distribución Normal o cuando los datos categóricos tienen más de dos valores.

5 Introducción (contd…)
Cuando sucede lo anterior, usamos otros métodos de análisis Métodos no paramétricos No se basan en las mismas suposiciones que los medios paramétricos, pero también tienen algunas suposiciones.

6 Categorías (ranking), medias, mediana
Algunos métodos no paramétricos usan los rankings en lugar de los valores reales. Las categorías se usan para comparar los datos, más por el ranking que por su tamaño. Paciente Glucosa en sangre (mg/dl) 1 135 2 225 3 70 4 100 5 110 6 150 7 90 8 9 170 10 60 11 80 De estos datos, vemos que el paciente 1 tiene un valor menor de glicemia que el paciente 2. Cuando lo que queremos estudiar es el orden, se pueden resumir los datos y aplicar pruebas estadísticas, sin esperar que los datos sigan una distribución en particular. La mediana es el centro de la clasificación ordinal (ranking).

7 Categorías (ranking), medias, mediana
Rankeamos en orden ascendente Paciente Glucosa en sangre (mg/dl) Ranking 10 60 1 3 70 2 11 80 7 90 4 100 5 8 6 110 135 150 9 170 225 La mediana es el centro de la distribución de las categorías.

8 ¿Son la media y la mediana, iguales?
Para usar la media y que el intervalo de confianza sea adecuado, la distribución de los valores debe ser simétrica. En cambio, para que la mediana y su intervalo de confianza sean adecuados, no se requiere suposiciones. Para calcular el intervalo de confianza de una mediana, es necesario sólo calcular la probabilidad de que los datos de la muestra, estén agrupados simétricamente alrededor de la verdadera mediana. Existen tablas publicadas para el intervalo de confianza de una mediana. Ya habiendo localizado la mediana, las tablas listan los valores correspondientes al límite inferior y superior del intervalo de confianza.

9 ¿Son la media y la mediana, iguales?
Usando el orden (ranking) en lugar de los valores originales, disminuye la necesidad de suposiciones acerca de la distribución, se hacen los cálculos más simples y rápidos. La desventaja es que los valores originales se pierden. Por esto, los métodos no paramétricos se usan sólo para probar hipótesis, no para estimación de efectos.

10 Métodos no paramétricos
Situación Método no paramétrico Método paramérico Muestra única Prueba de rangos señalados de Wilcoxon Prueba de Z (prueba de t) Dos muestras independientes Suma de rangos señalados de Wilcoxon Prueba de Z para dos muestras independientes (Prueba t) Dos muestras pareadas Prueba de rangos señalados de Wilxocon Prueba de Z pareada (Prueba t pareada) Muestra única, dos variables Coeficiente de correlación de Spearman Coeficiente de correlación de Pearson

11 Datos de una muestra Se muestran los datos de los 11 pacientes con niveles de glucosa. Queremos saber si el promedio es de 100 mg/dl. Paciente Glucosa en sangre (mg/dl) Ranking 10 60 1 3 70 2 11 80 7 90 4 100 5 8 6 110 135 150 9 170 225 Si usamos un método paramétrico para conocer la respuesta de esta pregunta, debemos asumir que la distribución de los niveles de glucosa en sangre en esta población son aproximadamente Normales y luego, probamos: hipótesis nula Ho: μ = 100 hipótesis alternativa H1: μ ≠ 100 Luego efectuamos una prueba de t ( no prueba de z) debido al tamaño de muestra. _ Media X = s = 49.01 SE = 15.52 t = 1.11 P > 0.05

12 Datos de una muestra La prueba no paramétrica alternativa es la prueba de rangos señalados de Wilcoxon. Puede ser usada para evaluar si los valores de la muestra están centrados en 100 mg/dl. Esta prueba no requiere Normalidad de la distribución de los datos, pero requiere que la distribución sea simétrica, aunque no es necesario que tome la forma de “campana” como la Normal.

13 Datos de una muestra La prueba de rangos señalados de Wilcoxon es calculada por los siguientes seis pasos: 1. Calcule la diferencia entre cada observación y el valor de interés, 100 mg/dl. 2. Excluya cualquier diferencia = 0. 3. Clasifique y ordene (ranking) las diferencias por magnitud, ignorando el signo. 4. Sume las categorías con diferencias positivas. 5. Sume las categorías de las diferencias negativas. 6. Seleccione el más pequeño de las dos sumas y llámelo T. Este valor de T se compara con las tablas de valores críticos de la prueba de rangos señalados de Wilcoxon. Leemos la tabla en el renglón correspondiente a las diferencias no cero. Cada renglón tiene diferentes rangos de valores correspondientes a diferentes valores de p. Si el valor de T está fuera del rango, o exactamente igual a uno de los valores, el valor de p de la prueba, es menor que el indicado en la columna. Si el valor de T está dentro del rango, el valor de p de la prueba es mayor que el indicado por la columna.

14 Datos de una muestra Paciente Glucosa en sangre (mg/dl)
Diferencias con 100 mg/dl Rnking 10 60 -40 6 3 70 -30 4 11 80 -20 7 90 -10 2 100 8 5 110 1 135 35 150 50 9 170 225 125 Diferencias positivas = 30 Diferencias negativas = 15 Dos diferencias 0 T=15 De la tabla de Wilcoxon para una muestra, con 11-2 diferencias 0= 9 de tamaño de muestra, buscamos a la izquierda, que el valor 15 esté dentro del rango (p=0.2). Para obtener el intervalo de confianza, n=11, en la tabla buscamos 11 como tamaño de muestra y el intervalo de confianza al 95% está entre el ranking 2 y 10.

15 Dos grupos independientes
30 adolescentes con apendicitis aguda, fueron distribuidos 15 para ser sometidos a apendicetomía tradicional y 15 para apendicetomía por laparoscopía. En ambos casos se valoró el dolor postoperatorio. Dolor postoperatorio Tradicional Laparoscopía Ninguno 1 3 Leve 5 7 Moderado 4 Severo Total 15 La mediana en el grupo de apendicetomía tradicional es dolor moderado y en el grupo de laparoscopía es leve.

16 Dos grupos independientes
Para comparar el dolor postoperatorio en los dos grupos, podemos usar la prueba de suma de rangos de Wilcoxon. Definimos la hipótesis nula Ho: las dos distribuciones se sobreponen. Definimos la hipótesis alternativa Hi: las dos distribuciones no se sobreponen.

17 Dos grupos independientes
La prueba de suma de rangos de Wilcoxon consta de tres pasos: Ordenar los valores de ambos grupos en orden ascendente. Calcular T como la suma de los rankings de la muestra más pequeña o de uno de los grupos, si son iguales. Compara el valor de T en la tabla de valores críticos de la suma de rangos de Wilcoxon.

18 Dos grupos independientes
Dolor postoperatorio Tradicional Laparoscopía Rankings Ninguno 1 1+ 3 4 Leve 5 9+ 7 16 Moderado 21+ 25 Severo 29+ 30 Total 15 T = =60 En la tabla de valores críticos en la columna n1,n2 (15,15), se busca el valor 60, p<0.05

19 Dos grupos pareados La tabla muestra las horas de mejoría que proporcionan dos analgésicos en 12 pacientes con artritis reumatoide. Para probar que la mejoría es la misma con los dos analgésicos podemos usar la t pareada o la prueba de rangos señalados de Wilcoxon. En ambos se calcula la diferencia en horas de mejoría para cada paciente. Paciente Analgésico A Analgésico B 1 3.5 2 3.6 5.7 3 2.6 2.9 4 2.4 5 7.3 9.9 6 3.4 3.3 7 14.9 16.7 8 6.6 6.0 9 2.3 3.8 10 2.0 4.0 11 6.8 9.1 12 8.5 26.9

20 Dos grupos pareados Con la prueba de rangos señalados de Wilcoxon, no se requiere Normalidad, sino que estén los datos simétricos a ambos lados de la mediana. Ho: diferencia de medianas = 0 Hi= diferencia de medianas ≠ 0 Paciente Analgésico A Analgésico B Diferencia Rankings 1 3.5 2 3.6 5.7 -2.1 8 3 2.6 2.9 -0.3 4 2.4 0.2 5 7.3 9.9 -2.6 10 6 3.4 3.3 0.1 7 14.9 16.7 -1.8 6.6 6.0 0.6 9 2.3 3.8 -1.5 2.0 4.0 -2.0 11 6.8 9.1 -2.3 12 8.5 26.9 -18.4 Si usamos la prueba t asumimos que la distribución de las diferencias es Normal y señalamos Ho: δ = 0 Hi:δ ≠ 0 δ es la media de las diferencias. δ = SE = 1.48 t= p>0.10

21 Dos grupos pareados Calculamos la prueba de rangos señalados de Wilcoxon para las diferencias haciendo lo siguiente: 1.- Cuente cuantas diferencias no 0 hay. 2.- Ordene las diferencias por su magnitud, ignorando el signo. 3.- Sume los rankings de todas las diferencias positivas. 4.- Sume los rankings de todas las diferencias negativas. 5.- Seleccione la más pequeña de las dos sumas y llámela T. (Suma de diferencias – 59, suma de diferencias + 8, T = 8) 6.- Compare el valor de T con las tablas de valores críticos para la prueba de rangos señalados de Wilcoxon. T = 8, 0.01<p<0.02. Por lo tanto rechazamos la hipótesis nula de que la diferencia de medianas es 0.

22 Correlación de rangos de Spearman
La tabla y gráfica muestran la incidencia de cáncer de colon y el promedio de consumo de carne per cápita en 13 países. País Incidencia Ca Colon Promedio de consumo de carne 1 10 2 8 9 3 11 5 4 12 22 33 6 67 37 7 73 32 48 41 31 21 29 17 13 Ya sabemos que podemos medir la correlación entre dos variables numéricas, usando la correlación r de Pearson. Para la relación entre consumo de carne e incidencia de cáncer de colon es r=0.65. Pero las variables deben tener una distribución Normal. Cuando no son Normales, podemos aplicar dos estrategias: 1.- Transformar las variables (logarítmica o elevarlas al cuadrado), para volverlas más Normales, o 2.-Usar el equivalente no paramétrico

23 Correlación de rangos de Spearman
Es apropiada para relaciones monotónicas, no lineales. Se usa la misma forma de cálculo que la r de Pearson, sólo usando los rankings. Se calcula en tres pasos: Los valores de la primera variable son ordenados, Los valores de la segunda variable son ordenados, Se aplica la fórmula de r de Pearson, usando los rankings en lugar de los valores originales.

24 Correlación de rangos de Spearman
País Incidencia Ca Colon Promedio de consumo de carne Ranking de Cáncer Ranking de consumo de carne 1 10 3 2 8 9 7 11 5 4 12 22 33 6 67 37 73 32 13 48 41 31 21 29 17 r= Σ(x – mediana de x)(y-mediana de y) / √Σ(x – mediana de X)2 Σ(y-mediana de y)2 = 0.74

25 Comparación de métodos
Ejemplo Método paramétrico Método no paramétrico Glucosa en sangre Prueba de t para una muestra p>0.1 Prueba de rangos señalados de Wilcoxon, p>0.05 Intensidad del dolor postquirúrgico t para una muestra pareada p<0.05 Prueba de suma de rangos de Wilxocon, p>0.05 Mejoría del dolor Prueba t pareada p>0.05 Prueba de rangos señalados de Wilcoxon, p<0.05 Correlación entre cáncer de colon y consumo de carne R de Pearson, r= 0.65 R de Spearman, r=0.74

26 Bibliografía 1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173. 2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4. 3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.


Descargar ppt "Curso de Bioestadística Parte 17 Métodos no paramétricos"

Presentaciones similares


Anuncios Google