METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

PRUEBAS DE HIPOTESIS. I.S.C. Rosa E. Valdez V.. Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria.
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Estimación. Estimación Puntual Estimación por intervalos
Departament destadísticoa Grup destadísticoa Computacional Introducción a la metodología bootstrap Jordi Ocaña Departament destadísticoa Secció Departamental.
Estimación de parámetros poblacionales
Inferencia estadística
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
INFERENCIA ESTADÍSTICA
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
Estimación por intervalos de confianza.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estimación por Intervalos de confianza
2. ESTIMACIÓN Depto. Matemáticas – IES Elaios
Introducción Media y varianza poblacional Sea
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
Inferencia Estadística
Población y Muestra.
Pronósticos, Series de Tiempo y Regresión
INTERVALO DE CONFIANZA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Distribuciones derivadas del muestreo
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
IPC 2008 Estimaciones por Bootstrap
1 M. en C. Gal Vargas Neri. 2 Planeación del curso TEMACAP.TITULODÍASSEMFEC FIN TEMA 00MOTIVACION Y PLANEACION1111/01 TEMA I1-2ESTADISTICA Y MEDICION2115/01.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Tema 8: Estimación 1. Introducción.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Inferencia Estadística
Capítulo 7 Estimación de Parámetros Estadística Computacional
ESTIMACION POR INTERVALOS
Titular: Agustín Salvia
Inferencia Estadística
Estadística para administradores
INFERENCIA ESTADISTICA
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Tema 7: Introducción a la inferencia estadística
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
Sesión 13: Distribuciones Muestrales y Tamaño de Muestra
Pruebas de hipótesis.
Aproximaciones y Errores
MÉTODOS DE ANÁLISIS EN LA TOMA DE DECISIONES EXISTEN PROCEDIMIENTOS DE ORDEN MATEMÁTICO, FINANCIERO, ECONÓMICO, ESTADÍSTICO ENTRE OTROS, PARA LA TOMA DE.
Elementos Básicos de Probabilidad y Estadística
Estimación y contraste de hipótesis
INTERVALOS DE CONFIANZA
ESTIMACIÓN DE PARÁMETROS
CONSTRUIMOS FUTURO Facultad de Ingenierías Físico-Mecánicas Escuela de Ingenierías Eléctrica, Electrónica y de Telecomunicaciones Centro de Innovación.
INTERVALO DE CONFIANZA
1 2  La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya que las ingerencias que hagamos sobre la población o poblaciones.
Inferencia estadística: Muestreo aleatorio simple
Aspectos generales de la investigación educativa en el SNIT
Clase N°11 Métodos de reducción de varianza
INFERENCIA ESTADÍSTICA
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
Pruebas paramétricas y no paramétricas
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Estimación estadística
Yulieth ariza Villarreal Estadística II. Historia La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica.
ESTIMACION DEL TAMAÑO DE LA MUESTRA. La primera pregunta que un estadístico debe contestar al planear una investigación de muestreo es, casi siempre, el.
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP TEMA 5 TEMA 5 METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP

INTRODUCCIÓN Los métodos de Remuestreo permiten obtener conclusiones acerca de una población usando muestras extraídas de una muestra aleatoria, que fue extraída previamente de esa población. Se caracterizan por que no requieren suposiciones sobre la población modelo, y que el número de remuestreos es muy elevado, por lo que se hace imprescindible el uso del ordenador.

INTRODUCCIÓN El propósito de estos métodos es de verificación de los datos obtenidos en un muestreo. Los métodos mas populares son los de JACKNIFE y de BOOTSTRAP.

MÉTODO DE JACKKNIFE (QUENOUILLE 1949 – TUKEY 1958) El método Jackknife fue desarrollado por Quenouille como procedimiento la estimación del sesgo de un estimador, y fue bautizado con este nombre por Tukey que lo generalizó como método general de estimación. El método obtiene muestras artificiales por medio de una dada, mediante sustitución de uno o de un grupo de valores de la muestra original.

MÉTODO DE JACKKNIFE (QUENOUILLE 1949 – TUKEY 1958) Su denominación alude a la navajas multiuso, que pueden ser tan eficaces y de gran utilidad como una herramienta unitaria específica, es decir, describe su versatilidad al ser aplicable en una pluralidad de situaciones y problemas diferentes. Su idea básica es disminuir el sesgo en la estimación en problemas de series cronológicas.

MÉTODO DE JACKKNIFE (QUENOUILLE 1949 – TUKEY 1958) En un principio Quenouille dividió la muestra en dos mitades para la estimación de un coeficiente de correlación serial. Posteriormente se amplia la idea a la división de la muestra en n grupos de tamaño K, y la aplica a diferentes problemas de estimación.

MÉTODO DE JACKKNIFE (QUENOUILLE 1949 – TUKEY 1958) El método Jackknife no es un método de estimación en el sentido clásico del término, si no una técnica operativa de utilizar dichos métodos clásicos con ciertas ventajas. El estimador de Jackknife es , sabiendo que es un estimador sesgado de la varianza poblacional . El sesgo es identificado con la ecuación: y tendremos:

MÉTODO DE JACKKNIFE (QUENOUILLE 1949 – TUKEY 1958) será el estimado máximo verosímil de la varianza, obtenido a partir de la muestra sin el grupo iésimo de observaciones: Por lo tanto: Demostrando que es insesgado

MÉTODO DE BOOTSTRAP (EFRON 1979) El método Bootstrap fue descrito por Efron, y su denominación hace referencia al Barón de Munchausen, cuando en una de sus aventuras logra salir de un profundo lago tirando de los cordones de sus propias botas, de hecho se deriva de la expresión inglesa: “To pull oneself up by one’s bootstrap”, que significa conseguir algo que parece imposible. La idea es usar datos para generar más datos, es decir, ser autosuficiente.

MÉTODO DE BOOTSTRAP (EFRON 1979) El Bootstrap es un método que permite mediante remuestreo aleatorio, y algunos casos prescindiendo, o a menos, debilitando algunas hipótesis sobre el modelo planteado, calcular medidas de precisión de un estimador, intervalos de confianza y en general, medir el grado de incertidumbre en una cantidad de problemas. Es una herramienta simple pero potente, es insesgado y sobretodo, puede aplicarse sin tener en cuenta los parámetros y naturaleza del modelo.

MÉTODO DE BOOTSTRAP (EFRON 1979) El método Bootstrap consiste, si tenemos una muestra de tamaño N, en generar un gran número de muestras de tamaño N efectuando un muestreo con reemplazamiento de esos valores. Es como si metiésemos los valores en una urna, extraemos una papeleta, anotamos el resultado, y volvemos a colocarlo en la urna, y así hasta obtener N valores.

MÉTODO DE BOOTSTRAP (EFRON 1979) En esa muestra calculamos el valor del parámetro que estamos estimando. Y así repetimos el proceso un gran número B de veces (por ejemplo 10000 o más), con lo que obtenemos una distribución de valores para el parámetro en la que podemos calcular su dispersión (análogo del error estándar) y determinar unos límites de confianza utilizando esa distribución.

MÉTODO DE BOOTSTRAP (EFRON 1979) El Bootstrap se diferencia del enfoque tradicional paramétrico en que emplea un gran número de cálculos repetitivos para estimar la forma de la distribución muestral del estadístico, en lugar de fuertes asunciones distribucionales y fórmulas analíticas. Esto permite al investigador hacer inferencias en casos donde tales soluciones analíticas son inviables, y donde tales asunciones son insostenibles.

MÉTODO DE BOOTSTRAP (EFRON 1979) El Bootstrap no es, por tanto, un estadístico per se. Más bien, es una aproximación al uso de la estadística para hacer inferencias sobre los parámetros poblacionales. La idea básica del Bootstrap es tratar la muestra como si fuera la población.

MÉTODO DE BOOTSTRAP (EFRON 1979) Los pasos básicos en la estimación bootstrap son los siguientes: Construir una distribución de probabilidad empírica,   a partir de la muestra asignando una probabilidad de 1/n a cada punto, x1, x2, ..., xn. A partir de la , se extrae una muestra aleatoria simple de tamaño n con reposición. Esta es una "remuestra", x*b. Se calcula el estadístico de interés,  , a partir de esa remuestra, dando  .

MÉTODO DE BOOTSTRAP (EFRON 1979) Se repiten los pasos 2 y 3 B veces, donde B es un número grande. La magnitud de B en la práctica depende de las pruebas que se van a aplicar a los datos. En general, B debería ser de entre 50 a 200 para estimar el error típico de   , y al menos de 1000 para estimar intervalos de confianza alrededor de  . Construir una distribución de probabilidad a partir de los B asignando una probabilidad de 1/B a cada punto,   . Esta distribución es la estimación bootstrap de la distribución muestral de  ,  . Esta distribución puede usarse para hacer inferencias sobre  .

MÉTODO DE BOOTSTRAP (EFRON 1979) El estimador Bootstrap del parámetro  se define como:      es decir, como la media de los valores del estadístico calculados en las B remuestras bootstrap.

MÉTODO DE BOOTSTRAP (EFRON 1979) En algunas ocasiones se tiene algún conocimiento más que el estrictamente aportado por la muestra, por ejemplo se conoce la función de distribución de la variable objeto de estudio pero se desconocen los parámetros, que deben ser estimados. En estos casos se estimarían los parámetros a partir de la muestra y el remuestreo se realizaría a partir de la función teórica conocida, con los parámetros estimados, en lugar de a partir de la FDE construida a partir de la muestra. En este caso hablamos de Bootstrap Paramétrico.

MÉTODO DE BOOTSTRAP (EFRON 1979) Intervalo de Confianza Bootstrap Básico Para su construcción se obtienen B muestras Bootstrap y se calculan los correspondientes cuantiles de . Así se tiene: donde es el α-ésimo percentil de la réplicas B Bootstrap y es el (1-α)-ésimo percentil de las B réplicas Bootstrap.