Tema 1- Regresión lineal simple.

Slides:



Advertisements
Presentaciones similares
Tema 1- Regresión lineal simple.
Advertisements

Pronósticos, Series de Tiempo y Regresión
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
REGRESIÓN LINEAL MÚLTIPLE TEMA INTRODUCCIÓN 2 x1x1 Y x2x2 x3x3 xKxK.
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas Relación estadísca: Correlación Diagramas de dispersión.
1. Relación estadística: correlación 2. Diagramas de dispersión o nube de puntos 3. Tablas de frecuencia simples o doble entrada 4. Distribuciones marginales.
TEMA 3: ESTADÍSTICA BIDIMENSIONAL. ÍNDICE: 1.- Relación estadística: correlación. 2.- Diagramas de dispersión o nube de puntos. 3.- Tablas de frecuencia.
TEMA 3: Estadística Bidimensional. ● Álvaro Fernández Romero y Luis Carlos Fernández herrezuelo.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
Free and Quick Translation of Anderson's slides1 Modelo de Regresión Lineal Simple y =  0 +  1 x + u.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
Ing. VITELIO ASENCIOS TARAZONA. Dentro de los modelos causales o asociativos encontramos el análisis de regresión o regresión lineal, que es un método.
Prof. Dr. Luis Alberto Rubio Jacobo CURSO: “Estadística Aplicada al Marketing” MAESTRIA EN GERENCIA DE MARKETING.
Procedimiento completo de regresión múltiple
MODELOS de PROBABILIDAD Modelo LOGIT
ESTADÍSTICA BIDIMENSIONAL
Curso de Elaboración de Pruebas Prof. Gerardo A. Valderrama M
Facultad de Ciencias Sociales
Procedimiento completo de regresión múltiple
Teoría Clásica de los Test Psicológicos Prof. Gerardo A. Valderrama M.
Pedro Letelier Patricio Contreras
Normatividad relativa a la calidad
MEP- II.
Análisis de varianza Paramétricos vs. No Paramétricos
CORRELACIÓN PARCIAL Y CORRELACIÓN SEMIPARCIAL
Introducción a los modelos econométricos
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
Clase 8: Contraste de Hipótesis
ESTADÍSTICA BIDIMENSIONAL
DISTRIBUCIONES BIDIMENSIONALES
Tema 4: Análisis de datos bivariantes numéricos (continuación)
Correlación Lineal de Pearson y Regresión Lineal Simple
Analisis de Regresion Para dos Variables (poblacion y muestra)
DISTRIBUCIÓN GAMMA. La distribución gamma se deriva de la función gamma. La distribución gamma tiene un caso especial que es la distribución exponencial.
Análisis descriptivo y presentación de datos bivariables
PREDICCIÓN Y ESTIMACIÓN
Variables estadísticas bidimensionales
REGRESÍON LINEAL SIMPLE
ECONOMETRIA I 3. MODELO LINEAL DE TRES VARIABLES
REGRESIÓN LINEAL SIMPLE
1. DISTRIBUCIONES BIDIMENSIONALES En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables que se representan.
ANÁLISIS DE REGRESIÓN SIMPLE
Capítulo 10 Test de Hipótesis Capítulo 10 Test de Hipótesis.
Análisis de Regresión Lineal Curso de Verano ENCUP: Introducción al análisis cuantitativo en ciencias sociales Javier Aparicio División de Estudios Políticos,
AJUSTE DE CURVAS TEMA #10. AJUSTE DE CURVAS Si se necesita la versión simplificada de una función complicada. Una manera de hacerlo es calcular valores.
ANALISIS DE VARIANZA
Correlación Relación no lineal Relación lineal positiva Relación
Ecuación Explícita de la Recta
ESTADÍSTICA BIDIMENSIONAL
ICPM050 – ECONOMETRÍA tema 03: ESTIMACIÓN MODELO LINEAL SIMPLE
Correlación Relación no lineal Relación lineal positiva Relación
Tema 6: Regresión lineal. 1. Introducción. 2. La ecuación de la recta. 3. El criterio de mínimos cuadrados. 4. Representación gráfica. 5. Coeficientes.
Regresión Lineal Simple
Modelo de Regresión Lineal Simple
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Analisis de Regresion Para dos Variables (poblacion y muestra)
Analisis de Regresion Multiple
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
Tamaño de muestra.
ESTADÍSTICA DESCRIPTIVA Mg. JHON FREDY SABI ROJAS.
ESTADÍSTICA ADMINISTRATIVA 2 PERIODO: AGOSTO – DICEIMBRE DE 2019 MTRA. ANGÉLICA GARCÍA DELGADO.
ANALISIS DE REGRESION SIMPLE
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN ¿Qué es una proyección? Es una estimación del comportamiento de una variable en el futuro. Específicamente, se.
REGRESION LINEAL SIMPLE
Transcripción de la presentación:

Tema 1- Regresión lineal simple. 1.1. Introducción 1.2. Especificación del modelo de regresión lineal simple en la población. 1.2.1. Estructura de los modelos de regresión 1.2.2. Hipótesis básicas 1.3. Estimación de los parámetros del modelo de regresión lineal simple 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades 1.3.2. La recta de regresión en puntuaciones diferenciales 1.3.3. La recta de regresión en puntuaciones típicas 1.3.4. Relación entre la pendiente de la recta y el coeficiente de correlación 1.3.5. Interpretación de los coeficientes de la recta de regresión 1.4. El contraste de la regresión 1.4.1.Componentes de variabilidad y bondad de ajuste 1.4.2. Validación del modelo 1.4.3. Significación de parámetros 1.5. Diagnosis del modelo: Análisis de residuos 1.6. Predicción

Tema 1- Regresión lineal simple. 1.1. Introducción 1.1.1. Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. 1.1.2. El concepto de relación entre variables: naturaleza y tipos de relación. 1.1.3. Herramientas para evaluar la relación entre dos variables 1.1.3.1. El diagrama de dispersión 1.1.3.2. La covarianza 1.1.3.3. El coeficiente de correlación de Pearson Como ya hemos comentado en la presentación la organización del temario de la asignatura está función del número de variables que vamos a manejar y del criterio de medida utilizado. La situación investigación más simple en la que podemos plantearnos construir un modelo de regresión se refiere casos en los que pretendamos relacionar dos variables siendo la variable dependiente cuantitativa. Ejemplos: En este tema estudiaremos cómo construir un modelo para representar la dependencia lineal de una variable de respuesta, Y, respecto a otra variables explicativa, X. Empezaremos por situar el problema en el ámbito de la investigación en psicología y pasaremos a describir la metodología a utilizar para construir un modelo de regresión que en cualquier caso debe comenzar con un gráfico de los datos, seguirá por la estimación de parámetros, posterioremente se efectúan constrastes de hipótesis respecto a los parámetros y, finalmente se comprueban las hipótesis de partida mediante el análisis de residuos.

1.1. Introducción 1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. Se pretende estudiar si la competencia escolar de niños, medida en una escala entre 1 y 4, depende del tiempo en meses que llevan viviendo con un progenitor Variable dependiente o criterio (endógena): competencia escolar Variable independiente o predictora (exógena): meses de monoparentalidad Se pretende estudiar si el ajuste emocional de niños, medido por un test de ajuste que proporciona puntuaciones en una escala entre 0 y 10, depende del ámbito rural o urbano en el que vive la familia Variable dependiente o criterio: ajuste emocional Variable independiente o predictora: ámbito geográfico

1.1. Introducción 1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. Se pretende estudiar la relación entre estrés laboral y la variable trabajo a turno Variable dependiente o criterio: estrés laboral Variable independiente o predictora: tipo de turno: fijo o variable Se pretende estudiar si las notas en Análisis de Datos II dependen de Análisis de Datos I Variable dependiente o criterio: Análisis de Datos II Variable independiente o predictora: Análisis de datos I Para estudiar empíricamente estas relaciones medimos, en una muestra de sujetos, los valores de las variables incluidas en la relación. Genéricamente, la información de un sujeto cualquiera de la muestra Si, vendrá dada por el par (Xi, Yi). El conjunto de pares constituye la matriz de datos de la investigación y para los ejemplos propuestos tendrá el siguiente formato.

1. 1. 2. El concepto de relación entre variables 1.1.2. El concepto de relación entre variables. Naturaleza y tipos de relación: el gráfico de dispersión Decimos que dos variables están relacionadas cuando podemos detectar algún patrón de variación conjunta. La primera herramienta que vamos a utilizar para identificar y describir una relación entre dos variables es el gráfico de dispersión. El gráfico de dispersión, o nube de puntos, es una representación gráfica de la relación entre dos variables que se construye representando los pares de valores de las variables medidas en el plano cartesiano. La diapositiva muestra diferentes nubes de puntos todas tienen en común que representan relaciones funcionales o deterministas entre las variables. Difieren en que los tres de arriba muestran tendencias lineales o ausencia de relación y los dos de abajo muestran tendencias no lineales.

1.1.2. El concepto de relación entre variables: naturaleza y tipos de relación. Lo que tienen en común estos gráficos es que representan relaciones estadísticas, estocásticas o probabilísticas. Son de este tipo de relaciones de las que nos ocuparemos en esta asignatura. Concretamente aprenderemos a estimar y comprobar la existencia de relaciones lineales en las poblaciones de las que proceden las muestras.

1.1.2. El concepto de relación entre variables: naturaleza y tipos de relación. Los gráficos de dispersión son una herramienta muy útil para hacer una primera exploración, más cualitativa, de la existencia de relación entre las variables, del tipo de relación y de anomalías en la muestra que tendremos que resolver. Pero la estimación de dónde hay más relación comparando varios gráficos no es tan sencilla pues la inferencia a partir de la inspección visual está sujeta a múltiples factores: escalas, marcadores, colores, etc. Es por ello que necesitamos índices analíticos que nos permitan establecer la magnitud de la relación lineal entre las variables.

La covarianza puede tomar valores entre (-∞,+∞) de manera que si: Sxy= 0 independencia lineal Sxy> 0 relación lineal directa o positiva Sxy< 0 relación lineal inversa o negativa Vamos a ver, utilizando el gráfico de dispersión, porque las relaciones De orden anteriores están relacionadas con el tipo de relación lineal. En prácticas desarrollaremos fórmulas que permitan calcular la covarianza de manera rápida. Pero

Sxy< 0 relación lineal inversa o negativa Sxy> 0 relación lineal directa o positiva Y Y X Sxy= 0 independencia lineal X Y X

1.1.3.2. La covarianza: dependencia de escalas

1.1.3.3. El coeficiente de correlación de Pearson rxy = 0 rxy = 0.88 rxy = 1 rxy = -1 rxy = -0.88 rxy = 0

Expresión matemática del modelo en la población 1.2. Especificación del modelo de regresión lineal simple en la población. 1.2.1. Estructura de los modelos de regresión Xi Yi predictora criterio independiente dependiente exógena endógena explicativa explicada Expresión matemática del modelo en la población En los apartados que siguen estudiaremos como construir un modelo para representar la dependencia lineal de una variable de respuesta, y, respecto a otra variable explicativa, x. Desde Galton, los modelos estadísticos que explican la dependencia de una variable y respecto de una o varias variables se denominan modelos de regresión. Poner un ejemplo de predicción. Por ejemplo si conocemos la distribución de las notas en análisis de datos II de los alumnos de psicología y queremos predecir cual será la nota de cualquiera de vosotros ¿Cuál sería la mejor estimación?. y si sabemos que las notas dependen de las horas de estudio ¿Cuál será la mejor estimación?. la media de las notas correspondiente a las horas de estudio. Recordemos el diagrama de dispersión de una relación directa y admitamos que todos los factores o causas que influyen en una variable de respuesta, dependiente, endógena o criterio (y) se pueden dividir en dos grupos: el primero contiene a una variable (x) llamada predictora, explicativa, exógena o independiente y que se supone no aleatoria y conocida al observar (y); el segundo incluye el resto de factores, cada uno de los cuales influye en la respuesta sólo en pequeña magnitud, que englobaremos dentro del nombre común de perturbación aleatoria o término de error. La expresión matemática que relaciona esos tres términos le denominamos modelo de regresión. Si la función que relaciona Y con X es la ecuación de una recta el modelo es de regresión lineal. Puntuación predicha por la recta de regresión verdadera Residuo o error de predicción En el modelo hay dos variables observadas: X e Y y dos parámetros la ordenada en el origen de la recta de regresión y la pendiente Interpretación de los parámetros:

Interpretación de los parámetros: Ejercicio físico Esperanza de vida Consumo de tabaco Esperanza de vida

1.2.2. Hipótesis básicas 1. El término de Error es una variable aleatoria con media cero: 2. Homocedasticidad: la varianza del término de error es constante: 3. Los errores se distribuyen normalmente: 4. Los errores son independientes entre sí. Las hipótesis anteriores pueden formularse de manera equivalente en términos de la variable criterio. Así, 1’. La media de Y depende linealmente de X: 2’. La varianza de Y es constante: 3’. La distribución de Y es normal para cada X: 4’. Las observaciones Yi son independientes entre sí.

Resumen gráfico de las hipótesis básicas formuladas en términos de la variable criterio Distribución Normal X1, X2, X3, X4

Resumen gráfico de las hipótesis básicas formuladas en términos de los residuos  X1, X2, X3, X4

El objetivo del análisis de regresión será estimar los parámetros del modelo presentado y contrastar las hipótesis de partida todo ello a partir de una muestra.

1.3. Estimación de los parámetros del modelo de regresión lineal simple 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades 1.3.2. La recta de regresión en puntuaciones diferenciales 1.3.3. La recta de regresión en puntuaciones típicas 1.3.4. Relación entre la pendiente de la recta y el coeficiente de correlación 1.3.5. Interpretación de los coeficientes de la recta de regresión

1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Partimos de una muestra de sujetos extraídos de una población en la que se han tomado valores de las variables X e Y. La situación más frecuente es que los puntos estén dispersos en el plano definido por X e Y. La primera pregunta a plantearnos es de las infinitas rectas que podemos ajustar a la nube de puntos ¿Cuál estimará mejor los parámetros?. Existen diferentes criterios.

1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Vamos a suponer que si los datos se han extraído de una población para la que es válido el modelo de regresión formulado en la muestra dicho modelo también se cumple y podemos escribir que:

Criterio de mínimos cuadrados: 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Criterio de mínimos cuadrados:

Recta de regresión mínimo cuadrática (puntuaciones directas): 1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Recta de regresión mínimo cuadrática (puntuaciones directas):

Ejemplo de cálculo de la recta de regresión de mínimos cuadrados 56,5 82,5 41 55 17,55 20,25 3,9 4,5 8 10 6,65 12,25 1,9 3,5 6 9 7,25 6,25 2,9 2,5 4 1,35 2,25 0,9 1,5 5 7 -0,55 0,25 -1,1 0,5 3 1,05 -2,1 -0,5 2 0,15 -0,1 -1,5 2,75 -2,5 10,85 -3,1 -3,5 1 9,45 -4,5 y x

Recta de regresión mínimo cuadrática: 1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Recta de regresión mínimo cuadrática: dependencia de escalas.xls

Propiedades de la Recta de regresión mínimo cuadrática: 1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Propiedades de la Recta de regresión mínimo cuadrática: 1) La media de las puntuaciones predichas es igual a la media de Y 2) Los errores tienen media cero 3) La recta de mínimos cuadrados pasa por el punto: 4) Los errores no correlacionan ni con la variable predictora ni con las puntuaciones predichas

Desviación Desviación Desviación total explicada residual 1.4.1.Componentes de variabilidad y bondad de ajuste Yi Desviación Desviación Desviación total explicada residual Xi

1.4.1. Componentes de variabilidad y bondad de ajuste Variación Total Variación Residual Variación Explicada Xi

1.4.1. Componentes de variabilidad y bondad de ajuste Bondad de ajuste o Coeficiente de determinación

1.4.1. Componentes de variabilidad y bondad de ajuste Representación en diagramas de Venn r2xy= 0 Y X r2xy= 1 Y X r2xy Y X

Esquema del Contraste de Hipótesis 1.4.2. Validación del modelo Esquema del Contraste de Hipótesis Contrastar una Hipótesis Estadísticamente es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella.

Elementos de una Prueba de Hipótesis 1.- Hipótesis Nula (H0), Hipótesis Alternativa. 2.- Estadístico de Contraste (Discrepancia). 3.- Región de Rechazo (Región Crítica): nivel de significación. 4.- Regla de Decisión.