REGRESION LINEAL SIMPLE

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
Regresión Lineal Verificación de Supuestos
Tema 6: Regresión lineal.
Regresión lineal simple
Regresión mínimo cuadrada (I)
Error Estándar de la Media
MÉTODOS DE MEDICIÓN DE COSTOS.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Regresión y correlación
Resortes y análisis mediante regresión lineal de datos
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
Curso de Estadística Básica
9 Regresión Lineal Simple
Regresión y Correlación
MEDIDAS DE DISPERSIÓN:
Análisis de Correlación y de Regresión lineal simple
Distribuciones bidimensionales. Tablas de contingencia
Prueba para la Bondad de ajuste Validación de Modelo
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Módulo 5 Análisis de Regresión y Series de Tiempo.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
REGRESION LINEAL III Mario Briones L. MV, MSc 2005.
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Regresión Lineal Simple Lic. César Octavio Contreras.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Unidad V: Estimación de
Valor que toma la variable aleatoria
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Estadística bidimensional
CORRELACION Y REGRESION LINEAL: Introducción
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística I. Finanzas y Contabilidad
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
1 Y MODELO DE REGRESIÓN SIMPLE Suponemos que una variable Y es una función lineal de otra variable X, con parámetros desconocidos  1 y  2 que queremos.
Estadística II Regresión Lineal.
Regresión Lineal Simple
Método de mínimos cuadrados
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
Unidad 4 Análisis de los Datos.
REGRESIÓN LINEAL SIMPLE
TEMA : ANALISIS DE REGRESION
REGRESIÓN LINEAL SIMPLE
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Estadística descriptiva
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
14 Introducción al Análisis de Correlación y de Regresión Lineal
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
REGRESIÓN LINEAL SIMPLE
Transcripción de la presentación:

REGRESION LINEAL SIMPLE

Una de las aplicaciones mas importantes de la estadística implica la estimación del valor medio de una variable de respuesta y o la predicción de algún valor futuro de y con base el conocimiento de un conjunto de variables independientes relacionadas, x1, x2, . . . xk.

Los modelos que se emplean para relacionar una variable dependiente y con las variables independientes x1, x2, . . . xk se denominan modelos de regresión o modelos estadísticos lineales porque expresan el valor medio de y para valores dados de x1, x2, . . . xk como una función lineal de un conjunto de parámetros desconocidos.

Los conceptos de análisis de regresión se presentan empleando un modelo de regresión muy sencillo, uno que relaciona y con una sola variable x. Aprenderemos a ajustar este modelo a un conjunto de datos mediante el método de los mínimos cuadrados.

Examinaremos los diferentes tipos de inferencias que pueden hacerse a partir de un análisis de regresión.

Un modelo de regresión simple: supuestos Supongamos que se quiere determinar la magnitud de la compresión que se producirá en un tipo de material de 2 pulgadas de espesor cuando se someta a diferentes cantidades de presión.

Un modelo de regresión simple: supuestos Se prueban cinco trozos experimentales del material bajo diferentes presiones. Los valores de x (en unidades de 10 libras por pulgada cuadrada) y las magnitudes de compresión y resultantes (en unidades de 0.1 de pulgada) se presentan en la tabla 1.

ESPÉCIMEN PRESIÓN COMPRESIÓN   X Y 1 2 3 4 5 TABLA # 1

En la figura 1 se muestra una gráfica de los datos, llamada diagrama de dispersión. X y 1 2 3 4 Figura 1.

X y 1 2 3 4

X y 1 2 3 4

X y 1 2 3 4 Supongamos que creemos que el valor de y tiende a aumentar de forma lineal conforme x aumenta 5 Entonces, podríamos escoger un modelo que relacione a y con x trazando una línea recta a través de los puntos de la figura.

X y 1 2 3 4 5 Semejante modelo determinístico (uno que no contempla errores de predicción) podría ser adecuado si todos los puntos de la figura quedaran sobre la línea ajustada.

La solución es construir un modelo probabilístico que relacione y con x; uno que contemple la variación aleatoria de los puntos de datos a los lados de una línea recta.

Un tipo de modelo probabilístico, el modelo de regresión lineal simple, supone que el valor medio de y para un valor dado de x se grafica como una línea recta y que los puntos se desvían de esta línea de medias en una cantidad aleatoria (positiva o negativa) igual a , es decir:

Valor medio de y para una x dada Error aleatorio Donde 0 y 1 son parámetros desconocidos de la porción determinística del modelo.

Valor medio de y para una x dada Error aleatorio Si suponemos que los puntos se desvían por encima y por debajo de la líneas de medias, siendo algunas desviaciones positivas, otras negativas, y con E() = 0, entonces el valor medio de y es:

Por lo tanto, el valor medio de y para un valor dado de x, representado por el símbolo E(y), se grafica como una línea recta con ordenada al origen igual a 0 y pendiente igual a 1

X y 1 2 3 4

Modelo de regresión lineal simple (probabilístico) Donde: y = variable dependiente x = variable independiente E(y)=0+1x es el componente determinístico (la ecuación de una línea recta)  = componente de error aleatorio 0 = punto en que la línea corta el eje y 1 = pendiente de la línea

Si queremos ajustar un modelo de regresión lineal simple a un conjunto de datos, debemos encontrar estimadores para los parámetros desconocidos, 0 y 1.

Los supuestos, que se resumirán a continuación, son básicos para todo análisis de regresión estadístico.

SUPUESTO 1: La media de la distribución de probabilidad de  es cero. Es decir, la media de los errores a lo largo de una serie infinitamente larga de experimentos es cero para cada valor de la variable independiente x. Este supuesto implica que el valor medio de y, E(y), para un valor dado de x es E(y)=0+1x

SUPUESTO 2: La varianza de la distribución de probabilidad de  es constante para todos los valores de la variable independiente x SUPUESTO 3: La distribución de probabilidad de  es normal

SUPUESTO 4: Los errores asociados a cualquier dos observaciones distintas son independientes. Es decir, el error asociado a un valor de y en particular no tiene efecto alguno sobre los errores asociados a otros valores de y

EL METODO DE LOS MÍNIMOS CUADRADOS ESTIMACIÓN DE 0 y 1: EL METODO DE LOS MÍNIMOS CUADRADOS La suma de los cuadrados de las desviaciones se denomina suma de los cuadrados del error y se denota con el símbolo SSE. La línea recibe el nombre de línea de mínimos cuadrados, línea de regresión o ecuación de mínimos cuadrados.

y 1 2 3 4 X 1 2 3 4

X y 1 2 3 4

La línea de medias es: E(y)= 0+1x 1 2 3 4 El modelo de línea recta para la respuesta y en términos de x es: y= 0+1x +  La línea de medias es: E(y)= 0+1x y la línea ajustada, que esperamos encontrar, se representa como:

Formulas para las estimaciones de mínimos cuadrados Pendiente: Ordenada al origen: Donde:

Ejercicio: A continuación tenemos las estaturas en centímetros (muestra x) y el peso en kilogramos (y) de niños de 6 años. Niño 1 2 3 4 5 6 7 8 9 10 Estatura (cm) x 121 123 108 118 111 109 114 103 110 115 Peso (kg) y 25 22 19 24 18 20 15 21

Ejercicio: Calcular: las medidas centrales, el primero y segundo cuartil, los percentiles 30 y 70, el diagrama de dispersión

Con esta información encontrar la ecuación de la línea recta E(y)=? Ejercicio: Con esta información encontrar la ecuación de la línea recta E(y)=? Niño 1 2 3 4 5 6 7 8 9 10 Estatura (cm) x 121 123 108 118 111 109 114 103 110 115 Peso (kg) y 25 22 19 24 18 20 15 21