Módulo 5 Análisis de Regresión y Series de Tiempo.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
MSP César Eduardo Luna Gurrola
Regresión lineal simple
Regresión mínimo cuadrada (I)
REGRESION LINEAL SIMPLE
Error Estándar de la Media
ESTADISTICA INFERENCIAL
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MÉTODOS DE MEDICIÓN DE COSTOS.
Ingeniería Industrial II CicloEducativo 2011
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Estadística 2010 Clase 5 Maestría en Finanzas Universidad del CEMA
Estimación por Intervalos de confianza
Regresión y correlación
Estadística Administrativa II
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
Curso de Estadística Básica
9 Regresión Lineal Simple
Regresión y Correlación
MEDIDAS DE DISPERSIÓN:
MÉTODOS DE PROYECCIÓN Existen varias alternativas para determinar el comportamiento futuro de un producto, lo cual exige de los proyectistas, un análisis.
Distribuciones bidimensionales. Tablas de contingencia
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Modelo de regresión con dos variables: Estimación
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Normalidad, Variabilidad y estimación del Modelo de Regresión
Introducción a la Inferencia Estadística
CORRELACION Y REGRESION LINEAL: Introducción
Inferencia Estadística
Variables estadísticas bidimensionales
Capítulo 1. Conceptos básicos de la Estadística
Regresión lineal múltiple
REGRESION LINEAL II Mario Briones L. MV, MSc
Si comparamos este intervalo con (10.5), vemos que el intervalo de confianza para la Y 0 individual es más amplio que el intervalo para el valor medio.
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
ANÁLISIS DE REGRESIÓN SIMPLE
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
REGRESIÓN LINEAL SIMPLE
TEMA : ANALISIS DE REGRESION
INFERENCIA ESTADÍSTICA
EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA:
Estadística Administrativa II
Departamento de Informática Universidad Técnica Federico Santa María EconometríaEconometría Capitulo II.
REGRESIÓN LINEAL SIMPLE
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
14 Introducción al Análisis de Correlación y de Regresión Lineal
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
Transcripción de la presentación:

Módulo 5 Análisis de Regresión y Series de Tiempo

ANÁLISIS DE REGRESIÓN Y SERIES DE TIEMPO MODELO LINEAL GENERALIZADO MÓDULO ANÁLISIS DE REGRESIÓN Y SERIES DE TIEMPO MODELO LINEAL GENERALIZADO SERIES DE TIEMPO

INTRODUCCIÓN Variable de Interés Variable Explicativa Ventas Tiempo de promoción en T.V. Accidentes Medidas preventivas implementadas. Accidentes en carretera Velocidad, longitud y condiciones de la carretera. Personas que desarrollan una enfermedad Edad, sexo, ocupación y hábitos. Tiempo de vida de una persona

EJEMPLO En cierta compañía, la prima de un seguro temporal con un plazo de 5 años y una suma asegurada de $300,000 en mujeres con edades comprendidas entre 50 y 70 años cumplidos, es la siguiente:

¿Qué efecto tiene la edad en el monto de la prima que se debe pagar? EJEMPLO ¿Qué efecto tiene la edad en el monto de la prima que se debe pagar? * Prima anual total Fuente: AMIS

EJEMPLO Fuente : AMIS

EJEMPLO Prima = 496.35 + 277.08* Años transcurridos a partir de 50 Por cada año de edad que una mujer supere los 50, el costo de la prima aumentará en $277.

EJEMPLO

MODELO LINEAL GENERAL

MODELO LINEAL GENERAL Parte aleatoria Parte determinística Variable dependiente Parte aleatoria Parte determinística La parte funcional es conocida pero contiene parámetros desconocidos Es una función lineal de parámetros desconocidos Es una variable aleatoria no observable

MODELO ESTADÍSTICO LINEAL SIMPLE Y = β0 + β1X + ε Observación Parte fija Parte aleatoria (determinista) (error)

MODELO ESTADÍSTICO LINEAL SIMPLE y Yi = β0 – ß1 xi + ei Diferencia entre observado y estimado x

MODELO ESTADÍSTICO LINEAL SIMPLE ¿Cuántas líneas se pueden trazar? y x

MODELO ESTADÍSTICO LINEAL SIMPLE Características del Modelo Lineal: Sean Y una variable respuesta o dependiente, x una variable explicativa o independiente, ambas variables observables. β0 y β1 dos parámetros desconocidos donde β0 es el punto donde la recta intercepta al eje de las y β1es la pendiente de la recta. ε el error es una variable aleatoria.

MÍNIMOS CUADRADOS (n ∑xiyi - ∑xi ∑yi ) n ∑xi2 – (∑xi)2 β1 = Para determinar los valores estimados de β0 y β1 utilizamos el método de mínimos cuadrados o suma de los cuadrados de los errores. (n ∑xiyi - ∑xi ∑yi ) n ∑xi2 – (∑xi)2 Λ β1 = Λ Λ β0 = y - β1 x

Ejemplos Un hotel en la periferia obtiene su ingreso bruto de la renta de sus instalaciones y de su restaurante. Los propietarios tienen interés en la relación entre el número de habitaciones ocupadas por noche y el ingreso por día en el restaurante. En la siguiente tabla se presenta una muestra de 25 días (de lunes a jueves) del año pasado que indica el ingreso del restaurante y el número de habitaciones ocupadas.

Ejemplos

Ejemplos ¿Considera que el ingreso del restaurante se incrementa conforme aumenta el número de habitaciones ocupadas? Justifique su respuesta.

Ejemplos

Ejemplos

Ejemplos Ingreso = 1,381.99 + 1.48 * Habitaciones

Práctica En el archivo que se les proporcionó contiene registros de algunos indicadores a nivel nacional, realice lo siguiente. Determine que efecto tiene en la confianza del consumidor el precio del dólar, la inflación y el desempleo urbano. Determine que variables tienen impacto en la cartera vencida de la banca comercial. Exponer tus resultados al grupo.

R2 : Coeficiente de determinación Indicadores R2 : Coeficiente de determinación Esta medida nos indica la proporción de variación que explica el modelo lineal

Propiedades de R2 R2 toma valores entre 0 y 1 Conforme R2 se vaya aproximando a 1, significa que el modelo lineal explica mejor la situación. Conforme R2 se vaya aproximando a 0 significa que el modelo lineal no es adecuado para explicar la información.

Observación Un coeficiente de determinación diferente de cero no significa que haya relación lineal entre las variables. Por ejemplo, R2 = 0.5 sólo nos dice que el 50% de la varianza de las observaciones queda explicado por el modelo lineal.

Fórmula

Ejemplo Calcular el coeficiente de determinación R2 .

Ejemplo

Indicadores El modelo lineal explica el 56.2% de la información Aplicando la fórmula: El modelo lineal explica el 56.2% de la información

Correlación. r Dos variables X e Y tienen una relación positiva si a medida que se incrementa los valores de una de las variables se incrementa los valores de la otra. De manera análoga, se dice que X e Y tienen una relación negativa si a medida que decrecen los valores de una de las variables se incrementa los valores de la otra.

Indicadores El coeficiente de correlación se caracteriza por tomar valores entre -1 y 1, de manera que: • r = 1 o r = -1 cuando haya una asociación lineal exacta entre las variables (en el primer caso positiva y en el segundo, negativa).

Interpretación del coeficiente de correlación 32

Indicadores

Indicadores

Ejemplo

Ejemplo El resultado es r = 0.7495

R2 = r2 r*r 0.561704893 R^2 0.561704893 Relación entre r y R2 En nuestro ejemplo: r*r 0.561704893 R^2 0.561704893

Práctica Enriquezca el análisis de las series proporcionadas considerando el coeficiente de correlación y de determinación. En el caso del índice de confianza del consumidor, ¿Qué variables explicativas se encuentran menos correlacionadas? En el caso de la cartera vencida ¿ Qué variables explicativas tienen mayor correlación? Exponga sus resultados al grupo

Significancia Si en el modelo de regresión lineal la pendiente es cero, entonces la variable X no tiene ningún efecto sobre la variable Y. En este caso diremos que X no es una variable explicativa del modelo. En este apartado haremos un contraste de hipótesis sobre la pendiente de la recta de regresión para saber si podemos afirmar o no que éste es igual a cero.

Significancia Se establece las hipótesis nula y alternativa y se contrasta: • Hipótesis nula: H0: b1 = 0, es decir, la variable X no es explicativa. • Hipótesis alternativa: H1: b1 <> 0, es decir, la variable X es explicativa. No rechazar la hipótesis nula significa que no se puede considerar el parámetro b1 significativamente diferente de cero. Es decir, la variable X no tiene influencia sobre la variable Y y, por tanto, no existe una relación lineal entre las dos variables.

Significancia √SCx E(β1) = β1 σ2 β1 = σ2 SCx Z = β1 - β1 β1 - β1 = El estimador de la pendiente tiene las siguientes características Λ E(β1) = β1 σ2 β1 = σ2 Varianza del estimador Λ SCx Valor esperado Λ Λ Z = β1 - β1 β1 - β1 Estadístico de prueba = σ β1 σ/√SCx Λ Λ Λ β1 - β1 β1 - β1 √SCx t = = Muestral σ/√SCx s

Significancia Resultado de la prueba 2.5% Zona de rechazo Si el valor de la prueba cae en la zona de rechazo se rechaza Ho, es decir β1 es significativa por lo que x si es una variable explicativa. 2.5% Zona de rechazo

Ejercicios Analizar la información

Ejercicios

Ejercicios A continuación se proporciona información de la tasa de mortalidad por 100,000 habitantes y la temperatura media anual de 13 ciudades. Analice la información

Cálculo en Excel Variables consideradas: y =ICC ; x = INPC

Usos del modelo Una vez que se está conforme con el modelo, se puede emplear para predecir los valores de y. El modelo permite realizar predicciones de tipo Puntual y por Intervalos.

Predicción Puntual Ejemplo Se refiere a realizar una estimación de un valor específico de y dado un dato de x Ejemplo El precio de venta de un vehículo con respecto a su kilometraje es descrito por el siguiente modelo: Donde y es el precio de venta y x el kilometraje

Predicción Puntual El precio de venta de un vehículo con 40,000 Kms. es: Se estima que un vehículo con 40.000 kms se venderá en $14,575.

Estimación por Intervalos Se pueden usar dos intervalos para estimar en que rango caerá el valor real. Intervalo de Predicción: calcula un rango de valores donde es posible que se encuentre y para un valor dado de x yn Rango para y, Dominio dado un valor específico de x . y2 y1 x

Estimación por Intervalos Intervalo de Confianza: estima el valor esperado de y dado un valor de x (linea recta) Valor esperado de y, dado un valor específico de x yn y2 y1 x

Límites De las ecuaciones se observa que las bandas hiperbólicas de predicción siempre están por fuera de las de confianza. Confianza Predicción

Ejemplo Obtener una estimación por intervalos para el precio de ventas de un vehículo con 40,000 kms. Con una confiabilidad del 95%: Caso I, para un vehículo en específico Caso II para el precio promedio del vehículo

Caso I Solución Un Intervalo de Predicción da el precio estimado para un vehículo de 40,000 kms t0,025,98 Aproximadamente

Caso II Un Intervalo de Confianza da la estimación del precio promedio de un vehículo con 40.000 Kms.

Residuos

Análisis de Residuos Este análisis se lleva a cabo con la intención de corroborar lo siguiente: Que el error se distribuye normalmente. Que la varianza del error es constante para todos los valores de x. Los errores son independentes entre sí.

Residuos

Residuos No se aprecia independencia ya que se visualiza un patrón.

Residuos Patrones característicos que el modelo no cumple con los supuestos, es decir la varianza no es constante.

Residuos El supuesto de normalidad se puede verificar con un gráfico normal.

Valores Alejados (Outliers) Un “outlier” es una observación (rara o excepcional) que normalmente es pequeña o grande. Cuando se observa un “outlier” se necesita investigar distintas posibilidades: Hubo un error al registrar el valor. El punto no pertenece a la muestra. La observación es válida. Los “Outliers” se identifican en el diagrama de dispersión. Se puede sospechar que una observación es un outlier si su |residuo estandarizado| > 2

Una observación influyente Outlier Un outlier Una observación influyente + + + + + + + + + + + + + … pero, algunos outliers pueden ser muy influyentes + + + + + + + + + + + + + + El outlier causa un desplamien- to en la línea de regresión

Práctica Un banco a lo largo del tiempo ha dado a sus créditos un cierto porcentaje de descuento, conforme a la normativa se estimó que el que se debió haber dado es diferente, por lo que la autoridad desea homologarlos. Determine una regla utilizando análisis de regresión.