La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Bayesian Procedure For Testing Independence of Two Factors in rxs Contingency Tables Beatriz González-Pérez, Juan Padilla 1, and Luis Sanz Departamento.

Presentaciones similares


Presentación del tema: "Bayesian Procedure For Testing Independence of Two Factors in rxs Contingency Tables Beatriz González-Pérez, Juan Padilla 1, and Luis Sanz Departamento."— Transcripción de la presentación:

1 Bayesian Procedure For Testing Independence of Two Factors in rxs Contingency Tables Beatriz González-Pérez, Juan Padilla 1, and Luis Sanz Departamento de Estadística e Investigación Operativa, Facultad de Ciencias Matemáticas, Universidad Complutense de Madrid, Spain 1 Departamento de Administración y Dirección de Empresas, Facultad de CC. Jurídicas y Económicas, Universidad Camilo Jose Cela, Spain Beatriz González Pérez, Juan Padilla, Luis Sanz1 WORKSHOP MÉTODOS BAYESIANOS, 2014 Madrid, 6 y 7 de Noviembre

2 1.- INTRODUCCIÓN Las tablas de contingencias son usadas en múltiples problemas de inferencia estadística y en diferentes contextos. Sobre todo cuando queremos contrastar la independencia 1.2- Tablas de Contingencia Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz2

3 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz3

4 1.2- El Problema El espacio paramétrico quedaría de la siguiente forma: Y las distribuciones marginales de probabilidad: Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz4

5 La Hipótesis general a contrastar quedaría: Es decir, la probabilidad conjunta será igual al producto de las marginales. [1] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz5

6 2.- APROXIMACIONES FRECUENTISTA Y BAYESIANA 2.1- El p-valor [2] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz6

7 2.2- Probabilidad Final [3] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz7

8 [5] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz8 [4] Que se corresponde con la probabilidad a posteriori de la hipótesis nula puntual con una distribución a priori de tipo mixto.

9 2.3- Conflicto Frecuentista-Bayesiano Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz9

10 3.- PROCEDIMIENTO BAYESIANO PARA CONTRASTAR LA INDEPENDENCIA EN TABLAS r x s Para todo el desarrollo del epígrafe siguiente utilizaremos distribuciones a priori sobre la alternativa de Dirichlet con rxs hiperparámetros, que puede ser escrita como sigue: [6] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz10

11 3.1.- Caso 1. Probabilidades marginales conocidas. Método I.1 Elegimos una Dirichlet como en [6] para H 1, entonces la distribución mixta viene dada por: [7] La probabilidad final de la hipótesis nula obtenida a partir de [5]: Donde [8] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz11

12 3.2.- Caso II. Marginales desconocidas. Método II.1 [9] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz12

13 Entonces la distribución mixta quedará: [10] La probabilidad final de la hipótesis nula obtenida a partir de [5]: Donde: [11] Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz13

14 Método II.2 Obteniendo el supremo de la probabilidad final de la hipótesis nula obtenida a partir de [5]: [12] Donde: Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz14

15 4.- APLICACIONES 4.1.- Un Caso Real, Cabras Sierra de Guadarrama. De una población de 531 cabras de la sierra de Guadarrama, se ha obtenido una muestra aleatoria de 149 cabras para estudiar si la edad de las cabras está relacionado con el género. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz15

16 πoπo B0B0 B1B1 B2B2 0,10,00000,00020,2508 0,30,00000,00080,5635 0,50,00000,00190,7508 0,70,00000,00450,8754 0,90,00000,01720,9644 El p-valor obtenido a partir de [2], es 0,0000 tanto en con marginales conocidas como con desconocidas, es decir que se rechaza la independencia. Computando la probabilidad final con los métodos desarrollados en este estudio para diferentes π o y con densidades uniformes, es decir asignado el valor 1 a todos los hiperparámetros de las Dirichlet utilizadas, nos quedaría: Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz16 De la tabla 4 obtenemos que la distribución marginal de las filas es y la de las columnas.

17 4.2.- Independencia, Dependencia Estadística y Dependencia Funcional Las tablas 6, 7, 8 muestran casos de Independencia, Dependencia Estadística y Dependencia Funcional para un ejemplo entre fumadores y enfermos de cáncer. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz17

18 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz18

19 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz19

20 4.3.- Análisis Exacto Se han computado todas las tablas 2x2 de tamaño 40, seleccionando aquellas en cuyas celdas las frecuencias esperadas son superiores a 5, de tal manera que se pueda calcular sin problemas el estadístico Chi-2. En el primer método dónde las marginales son conocidas (suponiendo ambas (0,5; 0,5)) se ha calculado la probabilidad final de la hipótesis nula y el p-valor. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz20

21 Se ha realizado el mismo estudio con el método II, ahora suponiendo marginales desconocidas: Se ha comprobado el que le coeficiente de correlación lineal es alto y positivo en todos los casos (0,79, 0,68, 0,88) respectivamente. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz21

22 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz22

23 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz23

24 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz24

25 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz25

26 5.- COMPARACIÓN CON EL MÉTODO FRECUENTISTA 5.1- Caracterización del Teorema Aplicando el teorema desarrollado en (Gómez-Villegas y González-Pérez, 2013), podemos encontrar para que valores de π 0 existe acuerdo entre el p-valor y la probabilidad final. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz26

27 5.1- Aplicación a las Tablas 2x2 de Tamaño 40 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz27

28 Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz28

29 6.- CONCLUSIONES 1.- La primera conclusión que hemos obtenido es que el tamaño de la muestra n importa al calcular la probabilidad final. Además se suele decir que el p-valor es más conservador que la probabilidad final, ya que rechaza cuando encuentra suficiente evidencia en contra de la hipótesis nula. En el caso de la dependencia estadística que se ha estudiado se ha podido comprobar que en algunos casos la probabilidad final rechaza y el p-valor acepta. 2.- Se ha comprobado que los métodos II.1 y II.2 discrepan más con el p-valor que el método I, sobre todo el método II.2, como se ha podido ver en las tablas 9 y 10. Siendo este el más conservador, teniendo sentido ya que está utilizando el supremo de la probabilidad final. 3.- Se ha visto que es posible, aplicando el teorema descrito en el apartado 5.1, alcanzar acuerdo para el p-valor y la probabilidad final. En este sentido nosotros lo hemos encontrado en el método II.1 con un α=0,01 y un π 0 =0,93. Bayesian procedure for testing independence of two factors in rxs contingency tables Beatriz González Pérez, Juan Padilla, Luis Sanz29

30 REFERENCIAS Beatriz González Pérez, Juan Padilla, Luis Sanz30

31 Beatriz González Pérez, Juan Padilla, Luis Sanz31

32 Beatriz González Pérez, Juan Padilla, Luis Sanz32


Descargar ppt "Bayesian Procedure For Testing Independence of Two Factors in rxs Contingency Tables Beatriz González-Pérez, Juan Padilla 1, and Luis Sanz Departamento."

Presentaciones similares


Anuncios Google