Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porjhosep cornejo Modificado hace 6 años
1
METODOS ESTADISTICOS: PARAMÉTRICOS VERSUS NO PARAMETRICOS Cuando se analizan datos medidos por una variable cuantitativa continua, las pruebas estadísticas de estimación y contraste frecuentemente empleadas se basan en suponer que se ha obtenido una muestra aleatoria de una distribución de probabilidad de tipo normal. Pero en muchas ocasiones esta suposición no resulta válida, y en otras la sospecha que no sea adecuada no resulta fácil de comprobar, por tratarse de muestras pequeñas. En estos casos disponemos de dos posibles mecanismos: los datos se pueden transformar de tal manera que sigan una distribución normal, o bien se puede acudir a pruebas estadísticas que no se basan en ninguna suposición en cuanto a la distribución de probabilidad a partir de la que fueron obtenidos los datos, y por ello se denominan pruebas no paramétricas (distribution free), mientras que las pruebas que suponen una distribución de probabilidad determinada para los datos se denominan pruebas paramétricas.
2
Dentro de las pruebas paramétricas, las más utilizadas se basan en la distribución de probabilidad normal, y al estimar los parámetros del modelo se supone que los datos constituyen una muestra aleatoria de esa distribución, por lo que la elección del estimador y el cálculo de la precisión de la estimación, elementos básicos para construir intervalos de confianza y contrastar hipótesis, dependen del modelo probabilístico supuesto. Cuando un procedimiento estadístico es poco sensible a alteraciones en el modelo probabilístico supuesto, es decir que los resultados obtenidos son aproximadamente válidos cuando éste varía, se dice que es un procedimiento robusto.
3
Test de rango con signo: Test de Wilcoxon
4
Suposiciones: La muestra disponible para el análisis es una m.a. de tamaño n desde una población con mediana M desconocida. La variable de interés es continua. La población muestreada es simétrica. La escala de medición es al menos de intervalo. Las observaciones son independientes.
5
Hipótesis: I. H 0 : M = M 0 Vs. H 0 : M M 0 II. H 0 : M M 0 Vs. H 0 : M < M 0 III. H 0 : M M 0 Vs. H 0 : M > M 0 Con un nivel de significación seleccionado
6
Procedimiento para la obtención de la estadística de prueba 1. Sustraer de cada observación la mediana hipotética M 0 es decir: D i = X i - M 0, i= 1,2,......, n. Si alguna observación, X i,es igual a la mediana hipotética M 0, esta es eliminada del análisis y el tamaño de la muestra es reducido.
7
2. Ordenar las diferencias D i sin considerar el signo. En otras palabras ordenar el valor absoluto de la diferencias. Si dos o más |D i | son iguales, se le asigna a cada valor empatado la media de los rangos que ocupan las diferencias empatadas. 3. Se asigna a cada rango el signo de la diferencia de la cual es el rango.
8
4. Obtener la suma de los rangos con signo positivo, llamado T +. Obtener la suma de los rangos con signo negativo, llamado T -. En realidad solo es necesario obtener una de estas sumas. Dado que una de ellas puede ser obtenida a través de la siguiente relación. Suma total de los rangos T = n(n+1)/2 entonces:
9
Estadística de Prueba y regla de decisión Los valores críticos de la estadística de prueba para la dócima de rango con signo de Wilcoxon, para muestras de tamaño 3 a 25 y distintos niveles de significación aparecen en la columna d de la Tabla A.3 (Wayne W. Daniel) I. Se eligirá al más pequeño entre T + y T - denominado T y H 0 será rechazada al nivel de significancia si T es menor o igual a d para n y (bilateral).
10
II. La estadística de prueba es T + y H 0 será rechazada si T + es menor o igual a d para n y tabulado (unilateral). III. La estadística de prueba es T - y H 0 será rechazada si T - es menor o igual que el valor de d para n y tabulado (unidireccional).
11
APLICACION. En un estudio sobre el abuso de las drogas en un área sub urbana, los investigadores encontraron que la mediana de los coeficientes intelectuales de personas mayores de 16 años que fueron arrestadas por el abuso de las drogas fue de 107. Supóngase que se desea conocer si se puede concluir que la mediana del CI de aquellas personas mayores de 16 años arrestadas por el abuso de drogas en otra área sub urbana es diferente de 107. Una m.a. de 15 personas es seleccionada desde la población de interés. ¿Cuál es la conclusión de los investigadores en base a los siguientes datos? = 0.05.
12
Datos 99 100 90 94 135 108 107 111 127 109 117 105 125 119 104 Hipótesis H 0 : M = 107 vs. H 1 : M 107 α = 0.05
14
De esta manera se obtiene: T + = 64.5 T - = 40.5 Debido a que la hipótesis alternativa es bidireccional, se elige T = mín {T +, T - } = T - = 40.5 Luego la estadística de prueba es T = 40.5
15
Decisión La muestra se reduce a n = 14 debido a una diferencia cero. Se ingresa a la tabla A.3 y se encuentra el punto crítico d = 22 para n = 14 y = 0.05 Se rechaza H 0 si T d, 40.5 > 22, por lo tanto la hipótesis nula H 0, no puede ser rechazada.
16
Aproximación para muestras grandes. Para muestras grandes, la estadística :
17
Test de Mann Whitney Suposiciones Los datos consisten de una m.a. X 1, …., X n1 seleccionada desde la población 1 y de otra m.a. Y 1, …., Y n2 seleccionada desde la población 2.Los datos consisten de una m.a. X 1, …., X n1 seleccionada desde la población 1 y de otra m.a. Y 1, …., Y n2 seleccionada desde la población 2. Las dos variables son independientes. Las dos variables son independientes. Las variables de interés son v.a. continuas. Las variables de interés son v.a. continuas. La escala de medición observada es al menos ordinal. La escala de medición observada es al menos ordinal. Las dos distribuciones poblacionales difieren solo respecto a su posición. Las dos distribuciones poblacionales difieren solo respecto a su posición.
18
Hipotesis I. Bilateral H 0 : Las poblaciones tienen distribuciones idénticas H 0 : Las poblaciones tienen distribuciones idénticas H 1 : Las poblaciones difieren con respecto a su posición H 1 : Las poblaciones difieren con respecto a su posición II. Unilateral H 0 : Las poblaciones tienen distribuciones idénticas H 0 : Las poblaciones tienen distribuciones idénticas H 1 : Las x`s tienden a ser menores que las y`s. H 1 : Las x`s tienden a ser menores que las y`s. III. Unilateral III. Unilateral H 0 : Las poblaciones tienen distribuciones idénticas H 0 : Las poblaciones tienen distribuciones idénticas H 1 : Las x`s tienden a ser mayores que las y`s. H 1 : Las x`s tienden a ser mayores que las y`s.
19
Estadístico de Prueba Para calcular el valor observado de la estadística de prueba deben combinarse las dos muestras y asignar rangos desde la observación más pequeña a la más grande. A las observaciones empatadas se le asigna el promedio de los rangos que hubieran ocupado de no existir empates. La suma de los rangos asignados a la muestra obtenida de la población 1 (R x ) es usada como estadística de prueba.
20
Estadístico de Prueba
21
Donde n 1 es el número de observaciones de la muestra X y S es la suma de los rangos asignados a la muestra X (al combinarse las muestras). La elección de la muestra como X o Y es arbitraria.
22
Regla de Decisión La regla de decisión depende de las hipótesis de interés I, II o III. Los cuantiles w p de T están dados en la tabla A.8 (Daniel) para p = 0.001, 0.005, 0.01, 0.025, 0.05 y 0.10. I. Rechazamos H 0 para valores de T suficientemente pequeños o suficientemente grandes. La región de rechazo está conformada por T w 1- /2 T w 1- /2
23
donde w /2 es el valor crítico de T dado en la tabla A.8 (Daniel) y w 1- /2 está dado por w 1- /2 = n 1 n 2 - w /2 w 1- /2 = n 1 n 2 - w /2 II. Rechazamos H 0 para valores de T suficientemente pequeños. La región de rechazo está conformada por T < w . Para obtener el valor crítico w , se ingresa a la tabla A.8 con n 1 y n 2 y . T < w . Para obtener el valor crítico w , se ingresa a la tabla A.8 con n 1 y n 2 y . III. Rechazamos H 0 para valores de T suficientemente grandes. La región de crítica está conformada por III. Rechazamos H 0 para valores de T suficientemente grandes. La región de crítica está conformada por T > w 1- . Donde w 1- = n 1 n 2 - w . T > w 1- . Donde w 1- = n 1 n 2 - w .
24
APLICACIÓN En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido de cadmio, se consideró para el experimento a 15 animales de laboratorio, mientras que 10 animales con las mismas características sirvieron de control. La variable de interés fue el nivel de hemoglobina después del experimento. En base a los resultados presentados en la siguiente tabla, se desea saber si puede concluirse que la inhalación prolongada de óxido de cadmio disminuye el nivel de hemoglobina.
26
Hipótesis H 0 : Las dos poblaciones son idénticas H 1 : Las dos poblaciones difieren solo en su posición H 1 : Las dos poblaciones difieren solo en su posición = 0.05 = 0.05 Para obtener la estadística de prueba, se combinan las dos muestras y se asignan rangos a las observaciones desde la más pequeña a la más grande teniendo en cuenta a cual muestra pertenece la observación.
28
S = 145 Se ingresa a la tabla A.8 con n 1 = 15, n 2 = 10 y = 0.05 El valor crítico es w = 45. Se rechaza H 0 si T < w .
29
Aproximación para muestras grandes Cuando n 1 o n 2 exceden a 20, la tabla A.8 no puede ser usada y la siguiente aproximación proporcionada por TCL es
30
Cuando H 0 es verdadera, Z tiene una distribución aproximadamente normal estándar.
31
Test de Kruskal Wallis Suposiciones.- - Los datos disponibles para el análisis consisten de k muestras independientes de tamaño n 1, ….., n k. - Las observaciones son independientes dentro de cada muestra y entre muestras. - La variable de interés es continua. - La escala de medición es al menos ordinal. - Las poblaciones desde las cuales se han seleccionado las muestras son idénticas excepto para una diferencia en posición en al menos una de ellas.
32
Test de Kruskal Wallis Hipótesis.- H 0 : Las k distribuciones son idénticas. H 0 : Las k distribuciones no tienen la misma mediana Estadístico de Prueba.-. Se combina las n = n 1 + …. + n k observaciones del conjunto de las k muestras, ordenándolas de menor a mayor, asignamos el correspondiente rango a cada observación ordenada. Se representa por R i a la suma de los rangos de las n i observaciones que constituyen la i-ésima muestra.
33
Test de Kruskal Wallis Si existen observaciones repetidas el estadístico H se corrige sustituyendo los rangos de la racha de observaciones repetidas por su rango medio y considerando además el factor de corrección.
34
Test de Kruskal Wallis
35
APLICACION.- En tres regiones europeas se investiga el grado de propensión al ahorro de sus habitantes. Para verificar si la disposición al ahorro es similar en dichas regiones se obtiene una muestra de cada una de estas regiones obteniéndose la siguiente información. Usar nivel de significación = 0.05
36
Test de Kruskal Wallis Datos Propensión al ahorro Muestra de Muestra de Muestra de R egión 1 Región 2 Región 3 0.251 0.140 0.112 0.326 0.204 0.306 0.146 0.318 0.241 0.093 0.109 0.172 Las observaciones son ordenadas en forma ascendente, asignando a cada observación su correspondiente rango.
38
Test de Kruskal Wallis Para cada una de las tres muestras se determina los R i R 1 = 26 R 2 = 29 R 3 = 23 asi Si rechaza H 0, si H K en este caso H=1.4446 <5.6308 = K Por lo tanto no se rechaza H 0,, implicando que la propensión al ahorro en las tres regiones, es la misma.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.