METODOS ESTADISTICOS: PARAMÉTRICOS VERSUS NO PARAMETRICOS Cuando se analizan datos medidos por una variable cuantitativa continua, las pruebas estadísticas.

Slides:



Advertisements
Presentaciones similares
PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
Advertisements

El estadístico Chi- cuadrado ING. RAÚL ALVAREZ GUALE, MPC.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
PRUEBAS NO PARAMÉTRICAS. PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS En estadística se hace distinción de las pruebas si son o no paramétricas. PRUEBAS PARAMÉTRICAS:
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
PRUEBA DE RANGO CON SIGNO DE WILCOXON Una empresa desea remplazar el sabor tradicional de su producto, por uno nuevo, para lo cual necesita determinar.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
PRUEBAS DE HIPÓTESIS MSc. Cora Maúrtua Timote. αHipótesis. αHipótesis estadística: Hipótesis nula y alternativa. αErrores de prueba. αNivel de significancia.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
Tema: Estadísticos no paramétricos CHI-Cuadrada Curso: Seminario de Estadística ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
Recordatorio Estadística Paramétrica Se basa en el conocimiento que los datos presentan una distribución estadística conocida y cada distribución tiene.
DISTRIBUCIONES DE Probabilidad
DISEÑO EN CUADRADO LATINO Y GRECOLATINO
XVII CONIC 2009 Congreso Nacional de Ingeniería Civil Capítulo de Ingeniería Civil Consejo Departamental De Lambayeque Colegio de Ingenieros del Perú.
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
ESTADÍSTICAS INFERENCIALES
Muestreo PRUEBAS Y VALIDACION DE HIPOTESIS Carlos Willian Rincón Pérez
Instituto Nacional de Estadística y Geografía
Curso de Elaboración de Pruebas Prof. Gerardo A. Valderrama M
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
Intervalos de Confianza
puede o no ser verdadero, relativo a una o más poblaciones.
7.1 Procedimientos paramétricos para datos cuantitativos
“Bootstrap” Jaime Mojica Cuevas
Análisis de varianza Paramétricos vs. No Paramétricos
Clase 9: Contraste de Hipótesis
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
INFERENCIA ESTADÍSTICA PARA DOS POBLACIONES
ANALISIS UNILATERAL DE LA VARIANZA POR JERARQUIAS DE KRUSKAL- WALLIS
Clase 8: Contraste de Hipótesis
Tamaño de la muestra.
CHI CUADRADO  2 OBJETIVOS –Describir situaciones donde es adecuado la utilización de la prueba de Chi Cuadrado (  2 ) –Formular Hipótesis para diferentes.
ANALISIS DE LA VARIANZA PROF. GERARDO A. VALDERRAMA M.
Comparación de medias-no paramétrico
Procedimientos paramétricos
REGRESÍON LINEAL SIMPLE
DISEÑOS EXPERIMETALES
puede o no ser verdadero, relativo a una o más poblaciones.
Tema: Distribución t-Student para una muestra Curso: Seminario de Estadística Aplicada a la Investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN.
ESTADÍSTICA INFERENCIAL. La estadística Inferencial, es el proceso por el cual se deducen (infieren) propiedades o características de una población a.
“Formulación de Hipótesis Estadística”
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
Capítulo 10 Test de Hipótesis Capítulo 10 Test de Hipótesis.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
ANALISIS DE VARIANZA
DISEÑO Y ANALISIS DE EXPERIMENTOS
INTRODUCCION A LA ESTADÍSTICA INFERENCIAL
Dr. Carlomagno Araya Alpízar
INTRODUCCION A LOS CONTRASTES BASADOS EN RANGOS
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
DISEÑO Y ANALISIS DE EXPERIMENTOS
INTRODUCCION A LOS CONTRASTES BASADOS EN RANGOS
PRUEBA DE H DE KRUSKAL WALLIS Presenta: LIC. EN BIOLOGÍA JESSICA ALEJANDRA ZAPATA GARCÍA ESTUDIANTE DOCTORADO EN CIENCIAS BIOMÉDICAS 1 BIOESTADÍSTICA DOCTOR.
Contraste de hipótesis Comparación de más de 3 grupos Kruskal-Wallis
Alumna : Karen Cabana Gil
ANÁLISIS DE VARIANZA(ANOVA) AULA:33 INTEGRANTES: JUAN CHAUCA ALEXIS JARAMILLO JEFFERSON LLANGARI KATHY ULLOA UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE.
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Tamaño de muestra.
HERNANDEZ RUIZ ROCIO KRUSKAL WALLIS. PRUEBAS K PARA MUESTRAS INDEPENDIENTES Este contraste permite decidir si puede aceptarse la hipótesis de que k muestras.
PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones.
TRATAMIENTO Y EVALUACION DE RESULTADOS ANALITICOS 1.Conceptos generales sobre la medida. Tipos de errores, concepto, componentes, corrección. Distribución.
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
Prueba de Hipótesis Concepto Asignar Probabilidades de ocurrencia a un evento basado en la suposición (hipótesis) de un evento o distribución.
Transcripción de la presentación:

METODOS ESTADISTICOS: PARAMÉTRICOS VERSUS NO PARAMETRICOS Cuando se analizan datos medidos por una variable cuantitativa continua, las pruebas estadísticas de estimación y contraste frecuentemente empleadas se basan en suponer que se ha obtenido una muestra aleatoria de una distribución de probabilidad de tipo normal. Pero en muchas ocasiones esta suposición no resulta válida, y en otras la sospecha que no sea adecuada no resulta fácil de comprobar, por tratarse de muestras pequeñas. En estos casos disponemos de dos posibles mecanismos: los datos se pueden transformar de tal manera que sigan una distribución normal, o bien se puede acudir a pruebas estadísticas que no se basan en ninguna suposición en cuanto a la distribución de probabilidad a partir de la que fueron obtenidos los datos, y por ello se denominan pruebas no paramétricas (distribution free), mientras que las pruebas que suponen una distribución de probabilidad determinada para los datos se denominan pruebas paramétricas.

Dentro de las pruebas paramétricas, las más utilizadas se basan en la distribución de probabilidad normal, y al estimar los parámetros del modelo se supone que los datos constituyen una muestra aleatoria de esa distribución, por lo que la elección del estimador y el cálculo de la precisión de la estimación, elementos básicos para construir intervalos de confianza y contrastar hipótesis, dependen del modelo probabilístico supuesto. Cuando un procedimiento estadístico es poco sensible a alteraciones en el modelo probabilístico supuesto, es decir que los resultados obtenidos son aproximadamente válidos cuando éste varía, se dice que es un procedimiento robusto.

Test de rango con signo: Test de Wilcoxon

Suposiciones: La muestra disponible para el análisis es una m.a. de tamaño n desde una población con mediana M desconocida. La variable de interés es continua. La población muestreada es simétrica. La escala de medición es al menos de intervalo. Las observaciones son independientes.

Hipótesis: I. H 0 : M = M 0 Vs. H 0 : M  M 0 II. H 0 : M  M 0 Vs. H 0 : M < M 0 III. H 0 : M  M 0 Vs. H 0 : M > M 0 Con un nivel de significación seleccionado 

Procedimiento para la obtención de la estadística de prueba 1. Sustraer de cada observación la mediana hipotética M 0 es decir: D i = X i - M 0, i= 1,2,......, n. Si alguna observación, X i,es igual a la mediana hipotética M 0, esta es eliminada del análisis y el tamaño de la muestra es reducido.

2. Ordenar las diferencias D i sin considerar el signo. En otras palabras ordenar el valor absoluto de la diferencias. Si dos o más |D i | son iguales, se le asigna a cada valor empatado la media de los rangos que ocupan las diferencias empatadas. 3. Se asigna a cada rango el signo de la diferencia de la cual es el rango.

4. Obtener la suma de los rangos con signo positivo, llamado T +. Obtener la suma de los rangos con signo negativo, llamado T -. En realidad solo es necesario obtener una de estas sumas. Dado que una de ellas puede ser obtenida a través de la siguiente relación. Suma total de los rangos T = n(n+1)/2 entonces:

Estadística de Prueba y regla de decisión Los valores críticos de la estadística de prueba para la dócima de rango con signo de Wilcoxon, para muestras de tamaño 3 a 25 y distintos niveles de significación aparecen en la columna d de la Tabla A.3 (Wayne W. Daniel) I. Se eligirá al más pequeño entre T + y T - denominado T y H 0 será rechazada al nivel de significancia  si T es menor o igual a d para n y  (bilateral).

II. La estadística de prueba es T + y H 0 será rechazada si T + es menor o igual a d para n y  tabulado (unilateral). III. La estadística de prueba es T - y H 0 será rechazada si T - es menor o igual que el valor de d para n y  tabulado (unidireccional).

APLICACION. En un estudio sobre el abuso de las drogas en un área sub urbana, los investigadores encontraron que la mediana de los coeficientes intelectuales de personas mayores de 16 años que fueron arrestadas por el abuso de las drogas fue de 107. Supóngase que se desea conocer si se puede concluir que la mediana del CI de aquellas personas mayores de 16 años arrestadas por el abuso de drogas en otra área sub urbana es diferente de 107. Una m.a. de 15 personas es seleccionada desde la población de interés. ¿Cuál es la conclusión de los investigadores en base a los siguientes datos?  = 0.05.

Datos Hipótesis H 0 : M = 107 vs. H 1 : M  107 α = 0.05

De esta manera se obtiene: T + = 64.5 T - = 40.5 Debido a que la hipótesis alternativa es bidireccional, se elige T = mín {T +, T - } = T - = 40.5 Luego la estadística de prueba es T = 40.5

Decisión La muestra se reduce a n = 14 debido a una diferencia cero. Se ingresa a la tabla A.3 y se encuentra el punto crítico d = 22 para n = 14 y  = 0.05 Se rechaza H 0 si T d, 40.5 > 22, por lo tanto la hipótesis nula H 0, no puede ser rechazada.

Aproximación para muestras grandes. Para muestras grandes, la estadística :

Test de Mann Whitney Suposiciones Los datos consisten de una m.a. X 1, …., X n1 seleccionada desde la población 1 y de otra m.a. Y 1, …., Y n2 seleccionada desde la población 2.Los datos consisten de una m.a. X 1, …., X n1 seleccionada desde la población 1 y de otra m.a. Y 1, …., Y n2 seleccionada desde la población 2. Las dos variables son independientes. Las dos variables son independientes. Las variables de interés son v.a. continuas. Las variables de interés son v.a. continuas. La escala de medición observada es al menos ordinal. La escala de medición observada es al menos ordinal. Las dos distribuciones poblacionales difieren solo respecto a su posición. Las dos distribuciones poblacionales difieren solo respecto a su posición.

Hipotesis I. Bilateral H 0 : Las poblaciones tienen distribuciones idénticas H 0 : Las poblaciones tienen distribuciones idénticas H 1 : Las poblaciones difieren con respecto a su posición H 1 : Las poblaciones difieren con respecto a su posición II. Unilateral H 0 : Las poblaciones tienen distribuciones idénticas H 0 : Las poblaciones tienen distribuciones idénticas H 1 : Las x`s tienden a ser menores que las y`s. H 1 : Las x`s tienden a ser menores que las y`s. III. Unilateral III. Unilateral H 0 : Las poblaciones tienen distribuciones idénticas H 0 : Las poblaciones tienen distribuciones idénticas H 1 : Las x`s tienden a ser mayores que las y`s. H 1 : Las x`s tienden a ser mayores que las y`s.

Estadístico de Prueba Para calcular el valor observado de la estadística de prueba deben combinarse las dos muestras y asignar rangos desde la observación más pequeña a la más grande. A las observaciones empatadas se le asigna el promedio de los rangos que hubieran ocupado de no existir empates. La suma de los rangos asignados a la muestra obtenida de la población 1 (R x ) es usada como estadística de prueba.

Estadístico de Prueba

Donde n 1 es el número de observaciones de la muestra X y S es la suma de los rangos asignados a la muestra X (al combinarse las muestras). La elección de la muestra como X o Y es arbitraria.

Regla de Decisión La regla de decisión depende de las hipótesis de interés I, II o III. Los cuantiles w p de T están dados en la tabla A.8 (Daniel) para p = 0.001, 0.005, 0.01, 0.025, 0.05 y I. Rechazamos H 0 para valores de T suficientemente pequeños o suficientemente grandes. La región de rechazo está conformada por T w 1-  /2 T w 1-  /2

donde w  /2 es el valor crítico de T dado en la tabla A.8 (Daniel) y w 1-  /2 está dado por w 1-  /2 = n 1 n 2 - w  /2 w 1-  /2 = n 1 n 2 - w  /2 II. Rechazamos H 0 para valores de T suficientemente pequeños. La región de rechazo está conformada por T < w . Para obtener el valor crítico w , se ingresa a la tabla A.8 con n 1 y n 2 y . T < w . Para obtener el valor crítico w , se ingresa a la tabla A.8 con n 1 y n 2 y . III. Rechazamos H 0 para valores de T suficientemente grandes. La región de crítica está conformada por III. Rechazamos H 0 para valores de T suficientemente grandes. La región de crítica está conformada por T > w 1- . Donde w 1-  = n 1 n 2 - w . T > w 1- . Donde w 1-  = n 1 n 2 - w .

APLICACIÓN En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido de cadmio, se consideró para el experimento a 15 animales de laboratorio, mientras que 10 animales con las mismas características sirvieron de control. La variable de interés fue el nivel de hemoglobina después del experimento. En base a los resultados presentados en la siguiente tabla, se desea saber si puede concluirse que la inhalación prolongada de óxido de cadmio disminuye el nivel de hemoglobina.

Hipótesis H 0 : Las dos poblaciones son idénticas H 1 : Las dos poblaciones difieren solo en su posición H 1 : Las dos poblaciones difieren solo en su posición  = 0.05  = 0.05 Para obtener la estadística de prueba, se combinan las dos muestras y se asignan rangos a las observaciones desde la más pequeña a la más grande teniendo en cuenta a cual muestra pertenece la observación.

S = 145 Se ingresa a la tabla A.8 con n 1 = 15, n 2 = 10 y  = 0.05 El valor crítico es w  = 45. Se rechaza H 0 si T < w .

Aproximación para muestras grandes Cuando n 1 o n 2 exceden a 20, la tabla A.8 no puede ser usada y la siguiente aproximación proporcionada por TCL es

Cuando H 0 es verdadera, Z tiene una distribución aproximadamente normal estándar.

Test de Kruskal Wallis Suposiciones.- - Los datos disponibles para el análisis consisten de k muestras independientes de tamaño n 1, ….., n k. - Las observaciones son independientes dentro de cada muestra y entre muestras. - La variable de interés es continua. - La escala de medición es al menos ordinal. - Las poblaciones desde las cuales se han seleccionado las muestras son idénticas excepto para una diferencia en posición en al menos una de ellas.

Test de Kruskal Wallis Hipótesis.- H 0 : Las k distribuciones son idénticas. H 0 : Las k distribuciones no tienen la misma mediana Estadístico de Prueba.-. Se combina las n = n 1 + …. + n k observaciones del conjunto de las k muestras, ordenándolas de menor a mayor, asignamos el correspondiente rango a cada observación ordenada. Se representa por R i a la suma de los rangos de las n i observaciones que constituyen la i-ésima muestra.

Test de Kruskal Wallis Si existen observaciones repetidas el estadístico H se corrige sustituyendo los rangos de la racha de observaciones repetidas por su rango medio y considerando además el factor de corrección.

Test de Kruskal Wallis

APLICACION.- En tres regiones europeas se investiga el grado de propensión al ahorro de sus habitantes. Para verificar si la disposición al ahorro es similar en dichas regiones se obtiene una muestra de cada una de estas regiones obteniéndose la siguiente información. Usar nivel de significación  = 0.05

Test de Kruskal Wallis Datos Propensión al ahorro Muestra de Muestra de Muestra de R egión 1 Región 2 Región Las observaciones son ordenadas en forma ascendente, asignando a cada observación su correspondiente rango.

Test de Kruskal Wallis Para cada una de las tres muestras se determina los R i R 1 = 26 R 2 = 29 R 3 = 23 asi Si rechaza H 0, si H  K en este caso H= < = K Por lo tanto no se rechaza H 0,, implicando que la propensión al ahorro en las tres regiones, es la misma.