Tests de permutaciones y tests de aleatorización

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

MÉTODOS Y DISEÑOS DE INVESTIGACIÓN METODOLOGÍAS DE INVESTIGACIÓN
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Pruebas de hipótesis.
Departament destadísticoa Grup destadísticoa Computacional Introducción a la metodología bootstrap Jordi Ocaña Departament destadísticoa Secció Departamental.
Contraste de Hipótesis
De la muestra a la población
Estadística Teórica II
La prueba U DE MANN-WHITNEY
KRIGING.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
INFERENCIA ESTADISTICA
PRUEBAS DE HIPOTESIS HIPOTESIS
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
TEMA III.
Uso de pruebas estadísticas paramétricas y no paramétricas
CURSO DE ESTADÍSTICA BÁSICA
CAPITULO Vlll SELECCIÓN DE LA MUESTRA
Proceso de la Investigación
Estadística Computacional Prof. Miguel González Velasco
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Control estadístico de Proceso
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
Unidad V: Estimación de
Estadística Administrativa II
ANALISIS DE DATOS CATEGORICOS
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Tema 7: Introducción a los contrastes de hipótesis
Fundamentos del contraste de hipótesis
Inferencias con datos categóricos
Estadística aplicada a la educación
Tema : Introducción a los contrastes de hipótesis
Unidad V: Estimación de
Teoría frecuentista del contraste de hipótesis
Inferencia Estadística
Análisis Cuantitativo de Datos (Básico)
Clase 4a Significancia Estadística y Prueba Z
Análisis y diseño de experimentos
Análisis de la Varianza
Unidad V: Estimación de
Tema 5: Numéricas en varios grupos
Tema: Pruebas de hipótesis
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Bioestadística. U. Málaga. Tema 4: Variables numéricas en 2 grupos 1 Bioestadística Tema 4: Numéricas en dos grupos.
Investigación de mercados “Muestreo”
@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 TEMA 15 * CONTRASTES DE HIPÓTESIS MATEMÁTICAS A. CS II.
Estimación y contraste de hipótesis
Taller 2 Reflexiones sobre Metodología Cuantitativa: Potencial de la comparación de muestras Germán Fromm R.
Tomando decisiones sobre las unidades de análisis
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
Pruebas paramétricas y no paramétricas
1 Tema 8. Diseños evaluativos de alta intervención TALLER: DISEÑO Y EVALUACIÓN DE PROGRAMAS XIV CONGRESO DE METODOLOGÍA DE LAS CIENCIAS SOCIALES Y DE LA.
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
POBLACIÓN Y MUESTRA CÁLCULO DEL TAMAÑO MUESTRAL. Descripción e inferencia Población Muestra Muestreo Inferencia Resultado.
Estadística Inferencial
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

Tests de permutaciones y tests de aleatorización Programa de doctorado Estadística, Análisis de datos y Bioestadística Métodos de Montecarlo y Estadística Computacional Departament d’Estadística Facultat de Biologia

Contenido: Tests de permutaciones como test condicional. Tests de aleatorización. Tests de permutaciones y tests de aleatorización aproximados o de Montecarlo. Estimación del p-valor. Determinación del número de permutaciones aleatorias. Algunos tests concretos. Datos apareados. Dependencia. Test de Mantel de asociación entre matrices de distancias.

Tests de permutaciones (Fisher,1935. The Design of Experiments) Recordemos que estadístico ordinal es suficiente (y completo) para F (y g(F)). En concreto, si indicamos {X}=(X(1),...,X(n)), ¿Cómo se puede aprovechar este hecho en el contraste de hipótesis?: condicionar a los datos de la muestra, conduce a “tests condicionales a la muestra”.

Tests de permutaciones planteamiento muestra observada. Estadístico t mide alejamiento de H0. Rechazamos H0 si o, equivalentemente, rechazaremos H0 si Si H0 implica distribución única F para toda la muestra, forma “libre de la distribución” de determinar ca ó es condicionar al estadístico ordinal.

Test de permutaciones como test condicionado a Enumeración de permutaciones de los datos para las que valor de t supera el observado. p-valor condicionado a los valores de la muestra, no para todas las muestras posibles. Bajo muestreo aleatorio simple, extensión real del test compatible con valor a nominal. Verdadero problema: evaluar t para todas las permutaciones.

Ejemplo: test de permutaciones de comparación de dos grupos indep. Muestra procedente de dos tratamientos, con n1 y n2 observaciones respectivamente. H0: provienen de la misma distribución. (Si interpretación de diferencias o de igualdad en términos de parámetro de localización será necesario suponer idéntica dispersión). H0: F común a las dos muestras: todas las permutaciones de los datos son equiprobables.

Tests de aleatorización Pitman, también en los años 1930. Mecánica similar, ideas radicalmente distintas: Muestreo aleatorio es infrecuente en la investigación experimental. Asignación aleatoria de tratamientos (sobre muestra, normalmente, no aleatoria) permite testar la validez de hipótesis, validez restringida a la muestra. Inferencia sobre la población basada en argumentos no estadísticos.

Tests de aleatorización: caso de comparación de dos tratamientos Muestra (seguramente no aleatoria) sometida a asignación aleatoria del tratamiento 1 a n1 individuos y del tratamiento 2 al resto (n2): Si H0 “el tratamiento no tiene efecto” cierta, es indiferente el tratamiento asignado a cada individuo, tratamientos son simples “etiquetas” asignadas al azar. Entonces la muestra actual es una más de las n! permutaciones posibles de los datos.

Tests de permutaciones y tests de aleatorización aproximados Principal dificultad de estos tests: imposible (a nivel práctico) enumerar todas las permutaciones posibles. Enfoque basado en remuestreo de Montecarlo: Generar una muestra aleatoria muy grande (pero mucho menor que el tamaño de la verdadera población) de las permutaciones posibles. A partir de ella, estimar (con mucha precisión) el verdadero p-valor. Decidir a partir de este p-valor estimado.

Esquema del procedimiento de Montecarlo. Notación En general: Muestra original y valor del estadístico sobre ella Permutación aleatoria de los índices de la muestra original: ip Muestra permutada según orden ip y estadístico sobre ella Ejemplo: comparación de dos muestras indep.:

Esquema del procedimiento de Montecarlo Generación de N permutaciones aleatorias El valor del estadístico sobre la muestra permutada, ¿supera el valor calculado sobre la muestra original? Cálculo del estadístico sobre cada muestra permutada Estimación del p-valor Criterio de decisión:

Estimación del p-valor El estimador es insesgado: Pero preferible el siguiente estimador sesgado, (Dwass, 1957): Este estimador asegura un test aproximado de extensión a, para todo N

Determinación del número N de permutaciones aleatorias (I) Estimador siempre asegura extensión a, por pequeño que sea N, no que p-valor estimado cercano al real, ni potencia alta. Rechazamos H0 si forma parte del grupo de los m=(N + 1)a valores mayores : Curva de potencias en función de parámetro p: Depende de qué hipótesis es cierta

Determinación del número N de permutaciones aleatorias (II) La verdadera probabilidad de rechazar H0, es decir, la función de potencia del test de Montecarlo es (Marriott, 1979): Si p es pequeño, bN(p) debería ser grande, si p grande bN(p) pequeño. Concretamente: bN(p): tabular o aprox. N(m=Np, s2=Np(1-p))

Determinación del número N de permutaciones aleatorias (y III)

Algunos tests concretos. Ideas guía generales H0 entendida como restricción sobre mecanismo de generación de datos. Aleatorizar según dicha restricción pero preservando todas las demás características del mecanismo generador de datos asumido. Por lo tanto, en general no se permutarán libremente todos los datos, dependerá de cada diseño experimental y de cada hipótesis nula.

Algunos tests concretos. I. Datos apareados Si comparamos dos muestras apareadas: permutaremos dentro de cada par (xi, yi) y calcularemos el estadístico de test t para cada permutación (2n posibles). Si t basado en D=X1-X2, asignar al azar signo - ó + a cada |d|: dpi=(-1)y|di|, yb(1,0.5) Permutar libremente los 2n valores destruiría la estructura de los datos

Algunos tests concretos. II. Dependencia entre variables aleatorias Si no hay relación entre la variable independiente X y la dependiente Y, indiferente que x se asocie con cada y. La distribución de aleatorización se formará mediante todos los pares en los que x se mantiene fijo e y se permuta: (xi, ypi). Sobre la muestra original y cada muestra permutada: estadístico que mida el tipo de asociación conjeturado, p.e. r de Pearson.

Algunos tests concretos. III. Asociación entre matrices de distancias Test de Mantel de asociación entre matrices de distancia (o de similitud, de correlación,...). Aplicabilidad muy general (mucha más de la que parece). Dos matrices de distancias calculadas sobre las mismas unidades de estudio W={1,2,...,n} p.e. una de distancias genéticas y otra de geográficas, sobre las mismas poblaciones ¿Existe asociación significativa entre ambas formas de medir la distancia?

Algunos tests concretos. IV. Test de Mantel Sobre los valores no triviales (p.e. triangular inferior) evaluamos algún estadístico de asociación

Algunos tests concretos. IV. Test de Mantel Si no hay asociación entre ambas formas de medir la distancia, el valor observado será uno más entre los obtenidos aleatorizando el conjunto de las unidades sobre las que se evalúan las distancias (¡no aleatorizando las distancias!) en una de las matrices, fija la otra. Repetidamente aleatorizaremos (permutaremos) los elementos de W y calcularemos t sobre los valores de distancia que les corresponderían. Se estimará la significación de la forma habitual.

Algunos tests concretos. V. Test de Mantel Una permuta-ción concreta: se han intercam-biado las unida-des 1 y 3. Las distancias d se mantienen pero ahora corresponden a pares distintos.