“an information criterion” (AIC) Akaike’s information criterion … en pocas palabras. Luis M. Carrascal Luis M. Carrascal En vez de obtener la diferencia.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
Tema 6: Regresión lineal.
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Modelos de Variable Dependiente Binaria -Logit y Probit-
Pronósticos, Series de Tiempo y Regresión
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
INFERENCIA ESTADISTICA
Pruebas de Especificación en el Modelo de Regresión Múltiple
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
MODELO DE REGRESIÓN MÚLTIPLE
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Tests de permutaciones y tests de aleatorización
Capitulo 10: La metodología Box-Jenkins
Estimación por Intervalos de confianza
Regresión y correlación
Giancarlo Vivanco Juan Pablo Villarroel
“an information criterion” (AIC) Akaike’s information criterion … en pocas palabras. Luis M. Carrascal En vez de obtener la diferencia entre dos modelos,
ANOVA Modelo I: Comparación entre medias
Tema 1- Regresión lineal simple.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
9 Regresión Lineal Simple
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Estadística 2010 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri.
Análisis de la estructura de medias. 2 Hasta ahora, análisis de la estructura de covarianzas (como trabajar con puntuaciones diferenciales) En los análisis.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
CONTRASTE Y VALIDACIÓN DE UN MODELO
MODELOS GENERALIZADOS
Curso de Bioestadística. ANOVA
Pronósticos, Series de Tiempo y Regresión
Modelo de regresión simple: Y =  1 +  2 X + u 1 Hemos visto que los coeficientes de regresión b 1 y b 2 son variables aleatorias. Estos, respectivamente,
Modelo de regresión simple: Y =  1 +  2 X + u Ahora, demostraremos que el estimador ordinario de mínimos cuadrados (OLS) del coeficiente de la pendiente.
DERIVADO DE LOS COEFICIENTES DE REGRESIÓN LINEAL Y X Esta sequencia muestra cómo los coeficientes de regresión para un modelo de regresión lineal simple.
ESTIMACIÓN DE COEFICIENTES DE MÁXIMA VEROSIMILITUD
Unidad V: Estimación de
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
Métodos de calibración: regresión y correlación
Econometría III Esquema del trabajo de ordenador. Curso
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
REGRESION LINEAL MULTIPLE: Introducción
Introducción a la Inferencia Estadística
Capacidad de Proceso.
BOOSTING REGRESSION TREES CON STATISTICA TÉCNICAS AVANZADAS DE REGRESIÓN EN CIENCIAS NATURALES Y SU APLICACIÓN CON R Luis M. Carrascal & Javier Seoane.
Capítulo 1. Conceptos básicos de la Estadística
Estadística Aplicada a las Ciencias Políticas
CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.
Estadísticos Asunto de Estado: Estadísticos. Estadísticos Los parámetros estadísticos nos permiten tener una idea global de la población, compararla con.
Estimación y contraste de hipótesis
Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia.
PARA LA REGRESIÓN LINEAL SIMPLE
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
ESTIMACIÓN DE PARÁMETROS
Construcción de modelos con regresión y correlación
Regresión lineal simple Nazira Calleja
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
INFERENCIA ESTADÍSTICA
Departamento de Informática Universidad Técnica Federico Santa María EconometríaEconometría Capitulo II.
(niveles o categorías)
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Estadística Inferencial
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

“an information criterion” (AIC) Akaike’s information criterion … en pocas palabras. Luis M. Carrascal Luis M. Carrascal En vez de obtener la diferencia entre dos modelos, se obtiene una estima de la distancia relativa esperada entre el modelo estimado y los verdaderos mecanismos que realmente han generado los datos observados (posiblemente de una dimensionalidad muy alta). AICAIC sirve para seleccionar el mejor modelo dentro de un conjunto de estos obtenidos con los mismos datos. Debemos hacer un esfuerzo por asegurarnos de que el conjunto de modelos de trabajo es sólido y está bien apoyado. Hay otras aproximaciones a AIC. Takeuchi’s information criterion (TIC). No se recomienda su uso, a no ser que el tamaño muestral sea enorme. No implementado en la mayoría de los paquetes estadísticos.

En el caso de modelos Generalizados AIC = 2·K – 2·ln(L) donde L es la estima de “maximum likelihood”maximum likelihood y K el número de parámetros del modelo de regresión (predictores + intercepto). Lo importante no es el valor absoluto de AIC, sino las diferencias entre los valores AIC i AIC se recomienda cuando n/K es mayor de 40. siendo n el número de observaciones (tamaño muestral) Si este no es el caso, deberíamos utilizar: Akaike’s second order information criterion (AIC c ): AIC c = AIC + (2·K·(K+1))/(n-K-1) En el caso de modelos GLM, AIC se calcula del siguiente modo: AIC = n·[ln(2·π)+1] + n·ln(SS error /n) + 2·(k+2) donde n es el tamaño muestral, SS error /n es la varianza residual (SS error es la suma de cuadrados error del modelo) y k es el número de parámetros del modelo de regresión (predictores + intercepto). Otra expresión simplificada, a efectos comparativos, es AIC = n·ln(SS error /n) + 2k

Es recomendable trabajar, más que con valores AIC, con diferencias en una serie de valores AIC. Para ello seleccionaremos el menor valor AIC dentro de nuestro subconjunto de modelos (AIC min ), para a continuación calcular incrementos de AIC sobre ese valor mínimo. Δ i =AIC i – AIC min No son los valores absolutos de AIC i lo importante, sino las … diferencias relativas entre los AIC i (Δ i ) de diferentes modelos. Escala relativa de plausibilidad de modelos: Δ i Plausibilidad 0 – 2Alta 4 – 7Menor > 10Ninguna

Pesos Akaike (w i ) Se utilizan para una mejor interpretación de la plausibilidad de los modelos cuando estos se comparan. Sean R modelos seleccionados, entonces el peso relativo del modelo i (w i ) es: w i = exp(-0.5·Δ i ) / Σ(exp(-0.5·Δ i )) con la suma (Σ) de modelos de i=1 a i=R Con estos pesos relativos se estiman los coeficientes de evidencia, … para comparar la plausibilidad de modelos sometidos a comparación, peso relativo mayor / peso relativo menor Estos coeficientes de evidencia son invariantes respecto al número de modelos que hemos considerado en el análisis. Δi PlausibilidadCoef. evidencia 0 – 2Alta1 – 2,7 4 – 7Menor7,4 – 33,1 > 10Ninguna>148

Ambivalencia. Es la falta de habilidad para poder identificar el mejor modelo recurriendo a criterios AIC. No es indicativo de un defecto en las estimas de AIC, sino de que los datos son simplemente inadecuados para alcanzar una inferencia fuerte. En tales casos, varios modelos pueden ser utilizados con el objetivo de hacer inferencias. Usos de los pesos: Estos pesos los podemos utilizar para efectuar medias ponderadas de valores predichos por una serie de modelos. También podemos utilizarlos para estimar la importancia relativa de cada variable predictora por medio de la suma de los valores de los modelos donde dichas variables entran o son seleccionadas.

AIC y AICc son sensibles a la presencia de sobredispesión en los datos (ĉ). Dicho aspecto se puede: valorar con dicho parámetro de sobredispersión, o, contemplar con la estima de los coeficientes QAIC y QAICc. Detalles importantes … aunque discutibles:discutibles 1) Los valores AIC no pueden ser comparados utilizando diferentes juegos de datos (los datos deben ser fijos) 2) Todos los modelos deben ser calculados utilizando la misma variable dependiente, o la misma transformación de ésta. 3) Todos los modelos deben asumir idénticas distribuciones canónicas, funciones de vínculo, estructura de errores y varianzas de ellos. 4) “Information-Theoretic Criteria” no es un test. Establece criterios para seleccionar modelos. Es una herramienta exploratoria, no de contraste de hipótesis. 5) No se deben utilizar los valores Δi, wi, o cocientes wi/wj para hablar de diferencias significativas entre modelos.

Bibliografía relevante: Akaike information criterionAkaike information criterion [pdf] [pdf]pdf Information theory and hypothesis testing Information criterion Kullback-Leibler information as a basis for strong inference in ecological studies Model Based Inference in the Life Sciences - A Primer on Evidence - Introduction Model selection in ecology and evolution AIC myths and misunderstandings Avoiding Pitfalls When Using Information-Theoretic Methods Multimodel inference Model selection and multimodel inference Multimodel Inference: Understanding AIC and BIC in Model Selection Model weights and the foundations of multimodel inference: Comment Model del Inference and Averaging Model Based Inference in the Life Sciences - A Primer on Evidence - Quantifying the Evidence About Science Hypotheses Model Based Inference in the Life Sciences - A Primer on Evidence – AppendicesModel Based Inference in the Life Sciences - A Primer on Evidence – Appendices … interesantes los apéndices E y F Statistical Modeling by AIC Bootstrap Information Criterion Information theory and hypothesis testing - a call for pluralism Concerns regarding a call for pluralism of information theory and hypothesis testing Information theory in willdlife science - critique and viewpoint Uninformative parameters and model selection using Akaike’s Information Criterion Testing ecological theory using the information-theoretic approach - Examples and cautionary results Performance of several variable-selection methods applied to real ecological data