UNIVERSIDAD AUTONOMA DEL PERÚ

Slides:



Advertisements
Presentaciones similares
Si la estadística no miente...: ¡Cuánto influyes sobre mi!
Advertisements

Tema 6: Regresión lineal.
REGRESION Y CORRELACION
GRÁFICAS Y FUNCIONES MATEMÁTICAS Bernardo Nieto Castellanos.
Error Estándar de la Media
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística: -Correlación y regresión
15. Regresión lineal Este tema, prácticamente íntegro, está calcado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón.
Introducción a la Estadística. Modelos de regresión
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
Correlación 1.
REGRESIÓN Y CORRELACIÓN
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
Curso de Estadística Básica
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Estadística bidimensional
MEDIDAS DE DISPERSIÓN:
Distribuciones bidimensionales
Análisis de Correlación y de Regresión lineal simple
Distribuciones bidimensionales. Tablas de contingencia
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
BIOMETRIA II TEMA 2 El Modelo de Regresión.
CORRELACION Y REGRESION LINEAL: Introducción
Pronósticos, Series de Tiempo y Regresión
Regresión Lineal Simple Lic. César Octavio Contreras.
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Modelo de regresión con dos variables: Estimación
Introducción a la Inferencia Estadística
ESTADÍSTICA BIDIMENSIONAL
REGRESION LINEAL SIMPLE
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
Variables estadísticas bidimensionales
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Estadística aplicada a la educación
Relaciones entre variables y regresión
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Variables estadísticas bidimensionales
Unidad 4 Análisis de los Datos.
TEMA 3: Estadística Bidimensional.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA : ANALISIS DE REGRESION
Capítulo 10 Análisis de los datos.
UNIDAD IV Regresión y correlación lineal
EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA:
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Tema 2: Estadística bidimensional
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MAESTRÍA EN ECONOMÍA APLICADA ASIGNATURA: MATEMÁTICA Y ESTADÍSTICA APLICADA DOCENTE: LYGIA ANDREA MEJÍA MALDONADO.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 ANÁLISIS DE CORRELACIÓN, REGRESIÓN Y CONTRASTE.
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
GRÁFICAS Y FUNCIONES MATEMÁTICAS Bernardo Nieto Castellanos.
ESTADÍSTICA BIDIMENSIONAL
Transcripción de la presentación:

UNIVERSIDAD AUTONOMA DEL PERÚ DIOS LES BENDIGA UNIVERSIDAD AUTONOMA DEL PERÚ Análisis de Regresión Semana 7. Clase 7 MS.C JUAN CARLOS ORUNA LARA MAGISTER EN ESTADÌSTICA E INFORMATICA DIPLOMADO EN ESTADÌSTICA EN INFORMATICA DOCTORANDO EN DIDÁCTICA DE LAS CIENCIAS

Análisis de Regresión Lineal y de Correlación El análisis de regresión lineal y de correlación comprende el estudio de los datos muestrales para saber si dos o más variables están relacionadas entre sí en una población. El análisis de regresión lineal da como resultado una ecuación matemática que describe cierta relación determinada. La ecuación puede usarse para estimar o predecir los valores de una variable cuando se conocen o se suponen conocidos los valores de otra variable. Proceso de calculo del os dastos que se van ha expresar en la funcion matematica El análisis entre dos variables da como resultado un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa relación.

Ejemplo ¿Cuál será el gasto que incurrirá una familia cuyo ingreso mensual es 4 000 soles? ¿Cuál será el costo de una vivienda según el número de habitaciones? Usualmente tales predicciones requieren que se encuentre una fórmula que relaciones tales variables.

El Diagrama de dispersión El primer paso en el análisis de regresión, es construir una gráfica de los datos muestrales en un plano bidimensional: Donde: X: es la variable independiente. Variable que se utiliza para predecir. Y: es la variable dependiente. Variable que se va a predecir o estimar.

Esta gráfica denominada de dispersión, nos permite visualizar el tipo de tendencia entre las dos variables. Esta tendencia puede ser líneal o no lineal. Tambien se puede observar si es una relación directamente proporcional o inversamente proporcional. En estos casos se tiene una tendencia o relación.

Coef. de correlación lineal de Pearson La coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,...)

La covarianza entre dos variables, Sxy, nos indica si la posible relación entre dos variables es directa o inversa. Directa: Sxy >0 Inversa: Sxy <0 Incorreladas: Sxy =0 El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relación entre las variables.

Propiedades de r Es adimensional Sólo toma valores en [-1,1] Las variables son incorrelacionadas  r=0 Relación lineal perfecta entre dos variables  r=+1 o r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente. Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Siempre que no existan observaciones anómalas. Relación inversa perfecta Relación directa casi perfecta Variables incorreladas -1 +1

correlaciones positivas

Bondad de un ajuste Fijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y. Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original. Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.

En el modelo de regresión lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa, predictora) buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante Ŷ = b0 + b1X b0 (ordenada en el origen, constante) b1 (pendiente de la recta) Y e Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad e=Y-Ŷ se le denomina residuo o error residual

El método de los mínimos cuadrados Para encontrar la ecuación de la recta de mejor ajuste a un conjunto de datos o puntos, el método más utilizado es conocido como el método de mínimos cuadrados, cuya ecuación resultante tiene dos características importantes.

Ecuaciones de regresión Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El método de estimación es el de Mínimos Cuadrados, mediante el cual se obtiene: Ecuaciones de regresión

La línea recta estimada La línea recta tiene dos importantes componentes, llamados coeficientes de regresión: b0 y b1

Interpretación La pendiente b1: indica el cambio promedio en la variable respuesta (y), cuando la variable predictora (x) aumenta en una unidad adicional. El intercepto b0 indica el valor promedio de la variable respuesta (y), cuando la variable predictora (x) es igual a cero. Sin embargo carece de interpretación práctica si dicho valor está fuera del rango del conjunto de valores X. Y= b0 + b1X

Ejemplo 1 Se desea realizar un estudio sobre los ingresos por ventas (en millones de dólares) y el gasto en publicidad (en millones de dólares. A continuación se muestra los datos de los últimos 8 meses Gasto en publicidad (x) 2 1 3 4 3 2 4 5 Ingresos por ventas (y) 7 5 7 9 8 6 11 13

Realice el diagrama de dispersión Se observa una tendencia lineal y directa, es decir a mayor gasto en publicidad, mayores son los ingresos por ventas. La ecuación de la recta que se va a estimar mediante la hoja de cálculo Excel o mediante el paquete estadístico SPSS, se basa en el método de mínimos cuadrados.

Siguiendo con el ejemplo: Estime la ecuación de la recta del ejemplo anterior, valide e interprete, en la salida del SPSS.

Un ejemplo. La recta de regresión representada corresponde a la estimación obtenida a partir de 20 pares de observaciones: x representa la temperatura fijada en un recinto cerrado e Y el ritmo cardíaco de un vertebrado