REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.

Slides:



Advertisements
Presentaciones similares
MSP César Eduardo Luna Gurrola
Advertisements

Regresión mínimo cuadrada (I)
REGRESION LINEAL SIMPLE
Bivariadas y Multivariadas
Ingeniería Industrial II CicloEducativo 2011
Regresión y correlación
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
9 Regresión Lineal Simple
Distribuciones bidimensionales. Tablas de contingencia
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
Pronósticos, Series de Tiempo y Regresión
ESTADISTICA TEMA y 223.
Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Variables estadísticas bidimensionales
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Construcción de modelos con regresión y correlación
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA : ANALISIS DE REGRESION
Bioestadística. U. Málaga.Tema 3: Estadística bivariante 1 Bioestadística Tema 3: Estadística descriptiva bivariante y regresión lineal.
INFERENCIA ESTADÍSTICA
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
REGRESIÓN LINEAL SIMPLE
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO FACULTAD DE INGENIERÍA COORDINACIÓN DE MATERIAS PROPEDÉUTICAS INGENIERÍA ELECTRÓNICA ASIGNATURA: MÉTODOS NUMÉRICOS.
VARIABLE ALEATORIA Y DISTRIBUCIÓN NORMAL
Danny Rafael Amaya Cotes Marcos Elías López Guerra.
INTERPOLACIÓN LINEAL.
Se llama dominio de definición de una función al conjunto de valores de la variable independiente x para los que existe la función, es decir, para los.
PRESENTADO POR: JOHANNA ANDREA RODRIGUEZ MORENO.  Descubierta por William S. en 1908, la distribución de T normalmente se llama distribución de t de.
Estadística bivariada Pedro Godoy Gómez. Si Y es otra variable definida sobre la misma población que X, ¿será posible determinar si existe alguna relación.
Experimentos con un solo factor: anÁlIsis de varianza
Grafica lineal Presentado por: Johanis lozano Presentado a : Beatriz Rodríguez Grado: 8º06.
PRONOSTICOS CON REGRESION LINEAL MULTIPLE En la regresión lineal simple se investiga la relación entre una variable independiente y otra dependiente. A.
REGRESIÓN Y CORRELACIÓN LINEAL, SERIES DE TIEMPO Msc. Esmelda Aguirre Téllez Master en Administración de Negocios.
Catalina Canals Cifuentes 02/10/2015 Modelos Logit y Probit Facultad de Ciencias Sociales Departamento de Sociología Estadística III.
LA METODOLOGIA BOX-JENKINS
ANÁLISIS DE VARIANZA DE UN FACTOR ANOVA I Dr. en Ed. Carlos Saúl Juárez Lugo Centro Universitario UAEM Ecatepec 2015.
Representación en espacio de estado
DISTRIBUCIONES DE PROBABILIDAD Por Jorge Sánchez.
C ÁLCULO I NTEGRAL Profesor: Manuel Guillermo López Félix Multiversidad Latinoamericana Hermosillo Norte Repaso primero parcial Sexto semestre Competencias.
INFERENCIA EN LOS MODELOS ARIMA ECONOMETRÍA II CAPÍTULO VI D to de Economía Aplicada Cuantitativa I Basilio Sanz Carnero.
Taller introducción a los conceptos básicos de Estadística PRIMERA PARTE 2016 Propósito: Introducir algunos conceptos básicos de Estadística por medio.
Paola arias Estadística II.  Fue descrita en 1908 por William sealy gosset  Es una distribución de probabilidad que se emplea comúnmente cuando tenemos.
UNIVERSIDAD TECNOLOGICA DE AGUASCALIENTES
Estadística y Biometría Modelación Estadística Regresión lineal.
Facultad de Ciencias Sociales
REGRESIÓN LINEAL SIMPLE
Estadística Administrativa II
REGRESIÓN LINEAL SIMPLE
Dr. Carlomagno Araya Alpízar
PROBABILIDAD Y ESTADISTICA
ANALISIS DE REGRESION SIMPLE
REGRESION LINEAL SIMPLE
UNIDAD EDUCATIVA “MARIANO PICON SALAS REGRESION LINEAL SIMPLE
Transcripción de la presentación:

REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION

REGRECION LINEAL SIMPLE

I NTRODUCCIÓN : La regresión y los análisis de correlación nos muestran como determinar tanto la naturaleza como la fuerza de una relación entre dos variables En el análisis de regresión desarrollaremos una ecuación de estimación, esto es, una formula matemática que relaciona las variables conocidas con la variable desconocida. Entonces podemos aplicar el análisis de correlación para determinar el grado de en el que están relacionadas las variables. El análisis de correlación, entonces, nos dice qué tan bien están relacionadas las variables. El análisis de correlación, entonces, nos dice que tan bien la ecuación de estimación realmente describe la relación.

A NÁLISIS E STADÍSTICO : En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación: Y = a + b X + ε Donde: a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y. b es el coeficiente de regresión poblacional (pendiente de la línea recta) ε es el error

S UPOSICIONES DE LA R EGRESIÓN L INEAL Los valores de la variable independiente X son fijos, medidos sin error. La variable Y es aleatoria Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y) Las variancias de las subpoblaciones Y son todas iguales. Todas las medias de las subpoblaciones de Y están sobre la recta. Los valores de Y están normalmente distribuidos y son estadísticamente independientes.

E STIMACIÓN DE LA E CUACIÓN Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El método de estimación es el de Mínimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuación de regresión muestral estimada es: Que se interpreta como: a es el estimador de α Es el valor estimado de la variable Y cuando la variable X = 0 b es el estimador de β, es el coeficiente de regresión Está expresado en las mismas unidades de Y por cada unidad de X. Indica el número de unidades en que varía Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresión).Un valor negativo de b sería interpretado como la magnitud del decremento en Y por cada unidad de aumento en X.

P ROBLEMA E JEMPLO : Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando: Con estos datos vamos a plantear una ecuación de regresión simple que nos permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y contrastaremos nuestra hipótesis con la prueba F. X Y

D ESARROLLO DEL P ROBLEMA : Representación matemática y gráfica de los datos:

H IPÓTESIS : H O : No hay relación entre la variable peso y la variable estatura. H A : Hay relación entre la variable peso y la variable estatura. Se obtiene un valor F = > 4.96, con lo cual se rechaza la hipótesis nula y aceptamos que la variable estatura está relacionada con la variable peso con un 95% de confianza. De acuerdo al desarrollo matemático hemos obtenido los siguientes cálculos: Lo que nos permite obtener los coeficientes a y b. b = 1223 / = a = – (0.8676) ( ) = Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrados Medios Estadístico F Debido a la Regresión Error Total

I NTERPRETACIÓN : La ecuación de regresión estimada es: Ŷ = X Coeficiente de correlación: R= Coeficiente de determinación: R²= El valor de b = indica el incremento del peso en kilogramos, en promedio, por cada centímetro de aumento en la estatura de los hombres adultos. El valor de a, no tiene interpretación práctica en el ejemplo, se interpretaría como el valor obtenido, en promedio, para el peso Y, cuando la estatura es 0. Utilizando la ecuación de regresión para estimar o predecir valores de la variable Y: Para una talla de 180 se obtiene un peso de 80.7 kg. ¿Cuánto se espera que pese (en promedio) una persona que mide 1.60 m? Sustituyendo el valor de interés en la ecuación: Ŷ = X Se obtiene: Ŷ = (160) = kg

C ONCLUSIÓN : La ecuación de Regresión Lineal estimada para las variables estatura y peso muestran, de acuerdo a la prueba F, relación. Esta relación se ha estimado en un R = 93.7, que indica una fuerte relación positiva. Además si consideramos el coeficiente de determinación R² = 87.9 podemos indicar que el 87.9% de las variaciones que ocurren en el peso se explicarían por las variaciones en la variable estatura.

REGRECION LINEAL MULTIPLE

Este tipo se presenta cuando dos o más variables independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z). Por ejemplo: Podría ser una regresión de tipo múltiple: Una Empresa de desarrollo de software establece relacionar sus Ventas en función del numero de pedidos de los tipos de software que desarrolla (Sistemas, Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el presente año. En la Tabla representa Y (Ventas miles de S/.) e X (Nº pedidos de sistemas), W (Nº de pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de Automatizaciones empresariales).

Objetivo : Se presentara primero el análisis de regresión múltiple al desarrollar y explicar el uso de la ecuación de regresión múltiple, así como el error estándar múltiple de estimación. Después se medirá la fuerza de la relación entre las variables independientes, utilizando los coeficientes múltiples de determinación. Y X W Z

A NÁLISIS DE REGRESIÓN MÚLTIPLE : Dispone de una ecuación con dos variables independientes adicionales: Se puede ampliar para cualquier número "m" de variables independientes: Para poder resolver y obtener y en una ecuación de regresión múltiple el cálculo se presenta muy tediosa porque se tiene atender 3 ecuaciones que se generan por el método de mínimo de cuadrados:

E RROR ESTÁNDAR DE LA R EGRESIÓN MÚLTIPLE : Es una medida de dispersión la estimación se hace más precisa conforme el grado de dispersión alrededor del plano de regresión se hace mas pequeño. Para medirla se utiliza la formula: Y : Valores observados en la muestra Ŷ : Valores estimados a partir a partir de la ecuación de regresión n : Número de datos m : Número de variables independientes

A PLICACIÓN : Mediante el siguiente problema podremos ilustrar la aplicación de Regresión Multiple: En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.

AlumnoPHPAlgoritmosBase de Datos Programación

Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Base de Datos y Programación. Se presentara la siguiente ecuación a resolver:

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los coeficientes de regresión o utilizando Regresión de Análisis de datos, en la Hoja de Calculo de Excel podemos calcular también los coeficientes de regresión: Por lo tanto podemos construir la ecuación de regresión que buscamos:

C ONCLUSIONES : El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.

CORRELACION

A NÁLISIS DE CORRELACIÓN SIMPLE : Sirve para medir la bondad del ajuste de una recta de regresión a un conjunto de observaciones, en el caso de tener una variable dependiente y una independiente. Dicha medida nos la da el coeficiente de determinación R2, que verifica 0 ≤ R2 ≤ 1. Cuanto más cercano a uno sea su valor mejor será el ajuste, y tanto peor cuanto más cercano a cero. Se calcula como el cuadrado del coeficiente de correlación lineal de Pearson

El coeficiente de correlación lineal de Pearson (se denota r ó ρ) es una medida de asociación lineal entre dos variables aleatorias X e Y: r = ρ= Cov ( X, Y ) SxSy Se verifica que –1 ≤ r ≤ 1 y podemos decir que: " Si r = -1, existe una relación lineal negativa perfecta entre X e Y. " Si r = 1, existe una relación lineal positiva perfecta entre X e Y. " Si r = 0, no existe ninguna relación lineal entre X e Y (X e Y son independientes).

A NALISIS DE CORRELACIÓN MÚLTIPLE : Sirve para medir la adecuación del modelo hallado (bondad del ajuste de la recta de regresión al conjunto de observaciones), en el caso de tener una variable dependiente y varias independientes. Dicha medida nos la da el coeficiente de determinación R2, que verifica 0 ≤ R2 ≤ 1. Cuanto más cercano a uno sea su valor, mayor es el grado de asociación lineal que existe entre la variable dependiente y las independientes o predictoras. Nos mide la proporción de la variación total de las observaciones que se explican mediante la ecuación (recta) de regresión

R EFERENCIAS : DF Ezequiel Uriel, “Análisis de datos: Series temporales y análisis multivariante”. Editorial AC. Juan Etxeberría, “Regresión Múltiple”. Cuadernos de Estadística. Editorial La Muralla. -multiple/regresion-multiple.shtml

G RACIAS !!!