Regresión y correlación

Slides:



Advertisements
Presentaciones similares
Tema 6: Regresión lineal.
Advertisements

Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
MODELO DE REGRESIÓN LINEAL SIMPLE
Regresión mínimo cuadrada (I)
REGRESION LINEAL SIMPLE
Error Estándar de la Media
ESTADISTICA INFERENCIAL
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Pronósticos, Series de Tiempo y Regresión
Estadística: -Correlación y regresión
Introducción a la Estadística. Modelos de regresión
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Modelo básico de regresión Lineal
Funciones y gráficas 3º de ESO.
Distribuciones de frecuencias bidimensionales
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Regresión Simple..
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión Lineal Simple
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
Estadística bidimensional
MEDIDAS DE DISPERSIÓN:
Análisis de Correlación y de Regresión lineal simple
Distribuciones bidimensionales. Tablas de contingencia
Tema 3: Estadística descriptiva bivariante y regresión lineal.
PROYECCIONES DE LA DEMANDA
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Regresión Lineal Simple Lic. César Octavio Contreras.
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
ESTADÍSTICA BIDIMENSIONAL
Estadística bidimensional
CORRELACION Y REGRESION LINEAL: Introducción
LA RECTA DE REGRESIÓN CONTENIDOS:
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
D. BIDIMENSIONALES DÍA 53 * 1º BAD CT
Diagramas de dispersión (Nube de puntos)
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística Aplicada a las Ciencias Políticas
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
1 Y MODELO DE REGRESIÓN SIMPLE Suponemos que una variable Y es una función lineal de otra variable X, con parámetros desconocidos  1 y  2 que queremos.
Estadística II Regresión Lineal.
Regresión Lineal Simple
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
TEMA 3: Estadística Bidimensional.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA : ANALISIS DE REGRESION
UNIDAD IV Regresión y correlación lineal
Tema 2: Estadística bidimensional
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
GRÁFICAS Y FUNCIONES MATEMÁTICAS Bernardo Nieto Castellanos.
ESTADÍSTICA BIDIMENSIONAL
Transcripción de la presentación:

Regresión y correlación Capítulo 7 Regresión y correlación Contenidos: Dependencia funcional o exacta y dependencia estadística Concepto de regresión Método de mínimos cuadrados Análisis de la bondad de ajuste. Error cuadrático medio, varianza residual y coeficiente de determinación lineal Estadística Económica 2007-2008. Sara Mateo.

Independencia - Dependencia Cuando se estudian dos características simultáneamente sobre una muestra, se puede considerar que una de ellas influye sobre la otra de alguna manera. Por ejemplo la altura y el peso o las horas de estudio y la calificación en un examen. El objetivo principal de la regresión es descubrir el modo en que se relacionan. Dos variables pueden considerarse: Variables independientes  No tienen relación (una de ellas no sirve para explicar los movimientos de la otra) Dependencia funcional  Y=f(x) Dependencia estadística Dependencia estadística Dependencia funcional Independencia estadística - + Grado de asociación entre dos variables

GRÁFICOS DE DISPERSIÓN: Permite ver si hay asociación Dadas dos variables X y Y tomadas sobre el mismo elemento de la población, el diagrama de dispersión es simplemente un gráfico de dos dimensiones, donde en un eje (la abscisa) se sitúa una variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación (tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una figura sin forma, una nube de puntos dispersos en el gráfico. Asociación positiva. Si aumenta X aumenta Y Estadística Económica 2007-2008. Sara Mateo.

GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN La relación entre dos variables métricas puede ser representada mediante la línea de mejor ajuste a los datos. Esta recta se le denomina recta de regresión, que puede ser negativa o positiva, la primera con tendencia decreciente y la segunda creciente.

GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN Para el cálculo de la recta de regresión se aplica el método de mínimos cuadrados entre dos variables. Esta línea es la que hace mínima la suma de los cuadrados de los residuos, es decir, es aquella recta en la que las diferencias elevadas al cuadrado entre los valores calculados por la ecuación de la recta y los valores reales de la serie, son las menores posibles. y = a + bx

Recta de regresión Pendiente yi Intercepto Error

Llamemos a “u” perturbación o error, siendo la diferencia que hay entre el valor observado de la variable exógena (y) y el valor estimado que obtendremos a través de la recta de regresión . La metodología para la obtención de la recta será hacer MÍNIMA la suma de los CUADRADOS de las perturbaciones. ¿Por qué se elevan al cuadrado? Estadística Económica 2007-2008. Sara Mateo.

En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las variables es una recta, es decir y=a+bx, donde a,b son los parámetros. A esta recta la llamaremos RECTA DE REGRESIÓN DE Y SOBRE X. Vamos a deducir su ecuación usando el método de los mínimos cuadrados. Dado un valor de X, tenemos los dos valores de Y, el observado, yi , y el teórico, yi* = a + bxi. Hemos de minimizar los errores cometidos: MINIMIZAR El valor que hemos aproximado para “y” con la recta de regresión  y* Errores cometidos al aproximar por una recta

Por tanto, se podría expresar como: y obtenemos que la recta de regresión de Y sobre X: y = a + bx con los valores a y b anteriormente calculados, o bien la siguiente expresión: Aplicando el mismo razonamiento llegaríamos a la expresión de la recta de regresión de X sobre Y: x = a’ + b’y con los valores a’ y b’ calculados como: Por tanto, se podría expresar como: Estadística Económica 2007-2008. Sara Mateo.

Varianza residual: Ayuda a medir la dependencia. Si es grande, los residuos, por término medio, serán grandes. Dependencia pequeña y viceversa. VR = Varianza marginal: Es la varianza total de X o de Y. Si dividimos la varianza residual entre esta se elimina el problema de unidades de medida. Ayuda a determinar la asociación pero en sentido inverso. La mejor medida es R. Coeficiente de correlación general: Haciendo unas transformaciones se demuestra que r(xy) visto en el capítulo 6 sólo es un caso particular de R Elevado al cuadrado obtenemos el coeficiente de determinación que sirve como medida del buen ajuste de la recta de regresión Cuando solo exista una variable explicativa o independiente y una sola dependiente se cumple:

Para el caso de distribuciones bidimensionales: Recta de regresión: Pendiente Positiva Negativa Nula Estadística Económica 2007-2008. Sara Mateo.

Tanto por uno de la Y que viene explicado por la X Varianza total Se descompone en: Varianza de los errores (perturbaciones) Varianza debida a la regresión (explicada) Tanto por uno de la Y que viene explicado por la X SIRVE PARA DETERMINAR SI EL AJUSTE HECHO ES BUENO. ES DECIR, SI LA VARIABLE X EXPLICA LAS VARIACIONES DE LA VARIABLE Y. DEBERÁ SER > 0.75

Predicción El objetivo último de la regresión es la predicción de una variable para un valor determinado de la otra. La predicción de Y para X = x0 será simplemente el valor obtenido en la recta de regresión de Y sobre X al sustituir el valor de x por x0. La fiabilidad de esta predicción será tanto mayor cuando mayor sea la correlación entre las variables (es decir mayor sea R2 ) Dado un valor de la variable “X” que no ha sido observado, estimar el correspondiente valor de “Y”