ANÁLISIS DE LA INFORMACIÓN La relación entre variables.

Slides:



Advertisements
Presentaciones similares
Si la estadística no miente...: ¡Cuánto influyes sobre mi!
Advertisements

Tema 6: Regresión lineal.
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
Bloque III. Caracterización de la relación entre variables Tema. 8
Tema 3: Estadística descriptiva bivariante y regresión lineal.
Tema 3: Estadística descriptiva bivariante y regresión lineal.
REGRESION Y CORRELACION
REGRESION LINEAL SIMPLE
Estadística Unidad II Regresión lineal
Error Estándar de la Media
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MÉTODOS DE MEDICIÓN DE COSTOS.
Estadística: -Correlación y regresión
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
15. Regresión lineal Este tema, prácticamente íntegro, está calcado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón.
Introducción a la Estadística. Modelos de regresión
Regresión y correlación
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Regresión Simple..
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
División de Estudios Políticos, CIDE
Estadística bidimensional
Análisis de Correlación y de Regresión lineal simple
Facultad: Turismo Y Hotelería
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
Tema 3: Estadística descriptiva bivariante y regresión lineal.
Pronósticos, Series de Tiempo y Regresión
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Tema 7: Regresión Simple
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística aplicada a la educación
coeficientes de correlación de
Relaciones entre variables y regresión
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
TEMA : ANALISIS DE REGRESION
Bioestadística. U. Málaga.Tema 3: Estadística bivariante 1 Bioestadística Tema 3: Estadística descriptiva bivariante y regresión lineal.
UNIDAD IV Regresión y correlación lineal
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Tema 2: Estadística bidimensional
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
ESTADÍSTICA BIDIMENSIONAL
Transcripción de la presentación:

ANÁLISIS DE LA INFORMACIÓN La relación entre variables. Interpretación de resultados

RELACIÓN ENTRE VARIABLES El estudio de las relaciones de complementariedad y/o dependencia entre 2 o más variables nos permite explicar (deducir) diversas interrogantes científicas asociadas a un problema. La técnica de deducción será importante para determinar la calidad de nuestras conclusiones.

RELACIÓN ENTRE VARIABLES rendimiento rendimiento rendimiento inteligencia inteligencia inteligencia Relación lineal negativa Sin relación Relación lineal positiva Nota: El coeficiente de correlación de Pearson mide relación LINEAL.

RELACIÓN ENTRE VARIABLES rendimiento rendimiento inteligencia inteligencia Relación no lineal Relación lineal Nota: El coeficiente de correlación de Pearson mide relación LINEAL.

Indice de correlación de Pearson El coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si las variables tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).

Indice de correlación de Pearson donde: es la covarianza del par (x,y) es la desviación típica de x es la desviación típica de y

Algunas Propiedades de r r sólo toma valores en [-1,1]. Las variables son incorreladas  r = 0. Relación lineal perfecta entre dos variables  r = +1 o r = -1. Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal.

Propiedades de r -1 +1 Relación inversa perfecta Relación directa casi perfecta Variables incorreladas -1 +1

Propiedades de r ¿Si r = 0 eso quiere decir que las variables son independientes? En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos los casos. Lo contrario si es cierto. Independencia implica incorrelación. Me ha salido r = 1,2 ¿La relación es “superlineal” ? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1.

Propiedades de r ¿A partir de qué valores se considera que hay “buena relación lineal”? Es difícil dar un valor concreto (mira los gráficos anteriores). Para este curso digamos que si |r| > 0,7 hay buena relación lineal y que si |r| > 0,4 hay cierta relación (por decir algo... la cosa es un poco más complicada: observaciones anómalas,...)

RELACIÓN ENTRE VARIABLES rendimiento rendimiento rendimiento inteligencia inteligencia inteligencia Relación lineal perfecta (casi perfecta) Relación lineal fuerte/moderada Relación lineal débil Ahora necesitamos un índice que nos informe tanto del grado en que x e y están relacionadas, y si la relación es positiva o negativa

Covarianza e índice de correlación Pearson Observe que cuando la relación lineal es positiva, si las puntuaciones diferenciales de x son positivas, las puntuaciones diferenciales de y suelen ser positivas. rendimiento Caso 1 inteligencia Observe que cuando la relación lineal es negativa, si las puntuaciones diferenciales de x son positivas, las puntuaciones diferenciales de y suelen ser negativas. rendimiento Caso 2 inteligencia

Introducción a la correlación múltiple Se estudian conjuntamente 3 o más variables.

Regresión Lineal El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”: Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable). Francis Galton

Regresión Lineal Pearson (un amigo suyo) realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo: Altura del hijo = 85cm + 0,5 • altura del padre (aprox.) Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos. Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.

Regresión lineal simple El análisis de regresión sirve para predecir una medida en función de otra medida (o varias: regresión múltiple). Y = Variable dependiente predicha, medida, es una variable aleatoria. Explicada X = Variable independiente predictora, controlada, no es una variable aleatoria. Explicativa

Regresión lineal simple El análisis de regresión sirve para predecir una medida en función de otra medida (o varias: regresión múltiple). ¿Es posible descubrir una relación? Y = f(X) + error f es una función de un tipo determinado el error es aleatorio, pequeño, y no depende de X

Modelo de regresión lineal simple En el modelo de regresión lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa) buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante Ŷ = b0 + b1X b0 (ordenada en el origen, constante) b1 (pendiente de la recta)

Modelo de regresión lineal simple Y e Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad e = Y-Ŷ se le denomina residuo o error residual.

Modelo de regresión lineal simple El modelo lineal de regresión se construye utilizando la técnica de estimación mínimo cuadrática: Buscar b0, b1 de tal manera que se minimice la cantidad Σi ei2 = Σi (Yi -Ŷ )2 Se comprueba que para lograr dicho resultado basta con elegir: La recta de regresión estimada será: Se obtiene además unas ventajas “de regalo”: El error residual medio es nulo. La varianza del error residual es mínima para dicha estimación.

¿Cómo medir la bondad de una regresión? Imaginemos un diagrama de dispersión, y vamos a tratar de comprender en primer lugar qué es el error residual, su relación con la varianza de Y, y de ahí, cómo medir la bondad de un ajuste.

Interpretación de la variabilidad en Y En primer lugar olvidemos que existe la variable X. Veamos cuál es la variabilidad en el eje Y. Y La franja sombreada indica la zona donde varían los valores de Y. Proyección sobre el eje Y = olvidar X.

Interpretación del residuo Fijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y. Y Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original. Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.

Bondad de un ajuste Y Resumiendo: La dispersión del error residual será una fracción de la dispersión original de Y. Cuanto menor sea la dispersión del error residual mejor será el ajuste de regresión. Eso hace que definamos como medida de bondad de un ajuste de regresión, o coeficiente de determinación a: