Bayesian Procedure For Testing Independence of Two Factors in rxs Contingency Tables Beatriz González-Pérez, Juan Padilla 1, and Luis Sanz Departamento.

Slides:



Advertisements
Presentaciones similares
Distribución t Student
Advertisements

Intervalos de Confianza para la Varianza de la Población
Clase No. 1.
ANALISIS PARAMÉTRICOS
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
TEMA 6: CONTRASTES NO PARAMÉTRICOS
Tema 7: Introducción a la inferencia estadística
Estadística I. Finanzas Y Contabilidad
FRANCISCO MARÍN HERRADA
ESTADISTICA INFERENCIAL
Pruebas de hipótesis.
Contraste de Hipótesis
Capítulo 10 Test de Hipótesis.
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
PRUEBA DE HIPOTESIS LUIS FERNANDO TRUJILLO LEYDER JULIAN GOMEZ
Estadística Teórica II
Inferencia estadística
Bioestadística Diplomado en Sanidad
Estadística Administrativa I
Chi cuadrada y otras Pruebas no paramétricas
La prueba U DE MANN-WHITNEY
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
INFERENCIA ESTADISTICA
8.3.- APROXIMACIOIN DE LA DISTRIBUCION BINOMIAL A LA NORMAL
TABLAS DE CONTINGENCIA
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
2. ESTIMACIÓN Depto. Matemáticas – IES Elaios
Introducción Media y varianza poblacional Sea
Estadística Computacional Prof. Miguel González Velasco
Distribución muestral de la Media
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
Clases 4 Pruebas de Hipótesis
ANALISIS DE DATOS CATEGORICOS
Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Inferencias con datos categóricos
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Inferencia Estadística
Prof. Rosario Martínez Verdú
Estadística Administrativa II
Inferencia Estadística
Herramientas básicas.
Capítulo 1. Conceptos básicos de la Estadística
Tema 7: Introducción a la inferencia estadística
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Tema 7: Introducción a la inferencia estadística
INFERENCIA ESTADÍSTICA
¿Dónde está enterrado El Greco? La doctora Inferencia Estadística: ¿Dónde está enterrado El Greco? Contraste de hipótesis para una proporción Imagen de.
Pruebas de hipótesis.
Investigación de mercados “Muestreo”
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
CONTRASTES NO PARAMÉTRICOS
Inferencia estadística: Muestreo aleatorio simple
Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff.
Aspectos generales de la investigación educativa en el SNIT
Pruebas paramétricas y no paramétricas
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Yulieth ariza Villarreal Estadística II. Historia La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
PRUEBA DE SIGNIFICANCIA
Transcripción de la presentación:

Bayesian Procedure For Testing Independence of Two Factors in rxs Contingency Tables Beatriz González-Pérez, Juan Padilla 1, and Luis Sanz Departamento de Estadística e Investigación Operativa, Facultad de Ciencias Matemáticas, Universidad Complutense de Madrid, Spain 1 Departamento de Administración y Dirección de Empresas, Facultad de CC. Jurídicas y Económicas, Universidad Camilo Jose Cela, Spain Beatriz González Pérez, Juan Padilla, Luis Sanz1 WORKSHOP MÉTODOS BAYESIANOS, 2014 Madrid, 6 y 7 de Noviembre

1.- INTRODUCCIÓN Las tablas de contingencias son usadas en múltiples problemas de inferencia estadística y en diferentes contextos. Sobre todo cuando queremos contrastar la independencia 1.2- Tablas de Contingencia Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz2

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz3

1.2- El Problema El espacio paramétrico quedaría de la siguiente forma: Y las distribuciones marginales de probabilidad: Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz4

La Hipótesis general a contrastar quedaría: Es decir, la probabilidad conjunta será igual al producto de las marginales. [1] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz5

2.- APROXIMACIONES FRECUENTISTA Y BAYESIANA 2.1- El p-valor [2] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz6

2.2- Probabilidad Final [3] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz7

[5] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz8 [4] Que se corresponde con la probabilidad a posteriori de la hipótesis nula puntual con una distribución a priori de tipo mixto.

2.3- Conflicto Frecuentista-Bayesiano Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz9

3.- PROCEDIMIENTO BAYESIANO PARA CONTRASTAR LA INDEPENDENCIA EN TABLAS r x s Para todo el desarrollo del epígrafe siguiente utilizaremos distribuciones a priori sobre la alternativa de Dirichlet con rxs hiperparámetros, que puede ser escrita como sigue: [6] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz10

3.1.- Caso 1. Probabilidades marginales conocidas. Método I.1 Elegimos una Dirichlet como en [6] para H 1, entonces la distribución mixta viene dada por: [7] La probabilidad final de la hipótesis nula obtenida a partir de [5]: Donde [8] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz11

3.2.- Caso II. Marginales desconocidas. Método II.1 [9] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz12

Entonces la distribución mixta quedará: [10] La probabilidad final de la hipótesis nula obtenida a partir de [5]: Donde: [11] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz13

Método II.2 Obteniendo el supremo de la probabilidad final de la hipótesis nula obtenida a partir de [5]: [12] Donde: Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz14

4.- APLICACIONES Un Caso Real, Cabras Sierra de Guadarrama. De una población de 531 cabras de la sierra de Guadarrama, se ha obtenido una muestra aleatoria de 149 cabras para estudiar si la edad de las cabras está relacionado con el género. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz15

πoπo B0B0 B1B1 B2B2 0,10,00000,00020,2508 0,30,00000,00080,5635 0,50,00000,00190,7508 0,70,00000,00450,8754 0,90,00000,01720,9644 El p-valor obtenido a partir de [2], es 0,0000 tanto en con marginales conocidas como con desconocidas, es decir que se rechaza la independencia. Computando la probabilidad final con los métodos desarrollados en este estudio para diferentes π o y con densidades uniformes, es decir asignado el valor 1 a todos los hiperparámetros de las Dirichlet utilizadas, nos quedaría: Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz16 De la tabla 4 obtenemos que la distribución marginal de las filas es y la de las columnas.

4.2.- Independencia, Dependencia Estadística y Dependencia Funcional Las tablas 6, 7, 8 muestran casos de Independencia, Dependencia Estadística y Dependencia Funcional para un ejemplo entre fumadores y enfermos de cáncer. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz17

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz18

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz19

4.3.- Análisis Exacto Se han computado todas las tablas 2x2 de tamaño 40, seleccionando aquellas en cuyas celdas las frecuencias esperadas son superiores a 5, de tal manera que se pueda calcular sin problemas el estadístico Chi-2. En el primer método dónde las marginales son conocidas (suponiendo ambas (0,5; 0,5)) se ha calculado la probabilidad final de la hipótesis nula y el p-valor. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz20

Se ha realizado el mismo estudio con el método II, ahora suponiendo marginales desconocidas: Se ha comprobado el que le coeficiente de correlación lineal es alto y positivo en todos los casos (0,79, 0,68, 0,88) respectivamente. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz21

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz22

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz23

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz24

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz25

5.- COMPARACIÓN CON EL MÉTODO FRECUENTISTA 5.1- Caracterización del Teorema Aplicando el teorema desarrollado en (Gómez-Villegas y González-Pérez, 2013), podemos encontrar para que valores de π 0 existe acuerdo entre el p-valor y la probabilidad final. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz26

5.1- Aplicación a las Tablas 2x2 de Tamaño 40 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz27

Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz28

6.- CONCLUSIONES 1.- La primera conclusión que hemos obtenido es que el tamaño de la muestra n importa al calcular la probabilidad final. Además se suele decir que el p-valor es más conservador que la probabilidad final, ya que rechaza cuando encuentra suficiente evidencia en contra de la hipótesis nula. En el caso de la dependencia estadística que se ha estudiado se ha podido comprobar que en algunos casos la probabilidad final rechaza y el p-valor acepta. 2.- Se ha comprobado que los métodos II.1 y II.2 discrepan más con el p-valor que el método I, sobre todo el método II.2, como se ha podido ver en las tablas 9 y 10. Siendo este el más conservador, teniendo sentido ya que está utilizando el supremo de la probabilidad final. 3.- Se ha visto que es posible, aplicando el teorema descrito en el apartado 5.1, alcanzar acuerdo para el p-valor y la probabilidad final. En este sentido nosotros lo hemos encontrado en el método II.1 con un α=0,01 y un π 0 =0,93. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz29

REFERENCIAS Beatriz González Pérez, Juan Padilla, Luis Sanz30

Beatriz González Pérez, Juan Padilla, Luis Sanz31

Beatriz González Pérez, Juan Padilla, Luis Sanz32