Correlación y regresión

Slides:



Advertisements
Presentaciones similares
Error Estándar de la Media
Advertisements

Regresión y correlación
Correlación 1.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
9 Regresión Lineal Simple
CORRELACION Y REGRESION LINEAL: Introducción
Pronósticos, Series de Tiempo y Regresión
REGRESION LINEAL III Mario Briones L. MV, MSc 2005.
RELACIÓN ENTRE VARIABLES
Análisis de los Datos Cuantitativos
Unidad 4 Análisis de los Datos.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
1 ANÁLISIS DE CORRELACIÓN, REGRESIÓN Y CONTRASTE.
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas Relación estadísca: Correlación Diagramas de dispersión.
1. Relación estadística: correlación 2. Diagramas de dispersión o nube de puntos 3. Tablas de frecuencia simples o doble entrada 4. Distribuciones marginales.
TEMA 3: Estadística Bidimensional. ● Álvaro Fernández Romero y Luis Carlos Fernández herrezuelo.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS.. MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS  ¿Qué son las medidas de dispersión?  Parámetros estadísticos que.
CORRELACIÓN.  La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia.
PRUEBAS NO PARAMETRICAS SEGÚN SHAPPIRO- WILK. ■ En estadística, de Shapiro–Wilk se usa para contrastar la normalidad de un conjunto de datos. Se plantea.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
¡Guía tonta de estadística! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM.
Licenciatura en Contaduría Tema: Regresión y correlación
Facultad de Ciencias Sociales
Análisis de varianza Paramétricos vs. No Paramétricos
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
ESTADISTICA BIDIMENSIONAL
Facultad de Ciencias Sociales
Introducción al Riesgo
Tema 4: Análisis de datos bivariantes numéricos (continuación)
Correlación Lineal de Pearson y Regresión Lineal Simple
Anova de una via Diseños completamente aleatorios
Comparación de medias-no paramétrico
LA COVARIANZA Y EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
Pruebas de normalidad y asunciones de los modelos lineares
Capitulo 10 Análisis de los datos cuantitativos. Programas Computacionales La Matriz de Datos Estadística Pasos SPSS Minitab SAS Stats Como Reportar resultados.
¡Guía básica de estadística! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM.
DISTRIBUCIÓN GAMMA. La distribución gamma se deriva de la función gamma. La distribución gamma tiene un caso especial que es la distribución exponencial.
Análisis descriptivo y presentación de datos bivariables
PREDICCIÓN Y ESTIMACIÓN
REGRESÍON LINEAL SIMPLE
Diseño experimental 2137 Juan C. Benavides
1. DISTRIBUCIONES BIDIMENSIONALES En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables que se representan.
UNIDAD CURRICULAR: ESTADÍSTICA II
Anova de una via Diseños completamente aleatorios
Análisis descriptivo A.F.C. Naturaleza de las variables VARIABLES ESCALARES (CUANTITATIVAS) CONTINUAS T°: 36.5°C Utiliza decimales DISCRETAS 1 SUJETO.
ANALISIS DE VARIANZA
Tema 1- Regresión lineal simple.
Correlación Relación no lineal Relación lineal positiva Relación
Correlación Relación no lineal Relación lineal positiva Relación
¡Guía tonta de estadística! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM.
Tema 6: Regresión lineal. 1. Introducción. 2. La ecuación de la recta. 3. El criterio de mínimos cuadrados. 4. Representación gráfica. 5. Coeficientes.
Regresión Lineal Simple
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
PROBABILIDAD Y ESTADISTICA
Correlación de Variables
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
Regresión lineal Electivo Estadística IV°Medio 2019.
ESTADÍSTICA DESCRIPTIVA Mg. JHON FREDY SABI ROJAS.
ESTADÍSTICA ADMINISTRATIVA 2 PERIODO: AGOSTO – DICEIMBRE DE 2019 MTRA. ANGÉLICA GARCÍA DELGADO.
ANALISIS DE REGRESION SIMPLE
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
REGRESION LINEAL SIMPLE
VARIANZA Y Y COVARIANZA DE VARIABLES ALEATORIAS Estadística II MI. MARTHA PAMELA RAMÍREZ VELA ITESM CAMPUS SALTILLO 1.
Transcripción de la presentación:

Correlación y regresión Diseño experimental 2137 Juan C. Benavides http://geographyfieldwork.com/Spearm5.gif

Correlación Contesta preguntas básica Si una variable aumenta la otra tambien? Si una variable dismiminuye la otra también? Podemos obtener el grado de relación númerica entre dos variables?

Correlación-graficar Diagrama de dispersión de puntos Evidencia gráfica de la asociación entre dos variables x <- mtcars[,1]#millas y <- mtcars[,6]# peso total plot(x, y, xlab=”mpg", ylab=”peso")

Relación directa x <- mtcars[,4]# fuerza hp y <- mtcars[,6]# peso total plot(x, y, xlab="hp", ylab="peso")

Relación directa-tendencia x <- mtcars[,4]# fuerza hp y <- mtcars[,6]# peso total plot(x, y, xlab="hp", ylab="peso") abline(lm(y ~ x))

Relación inversa x <- mtcars[,1]#millas y <- mtcars[,6]# peso total plot(x, y, xlab="mpg", ylab="peso")

Relación inversa x <- mtcars[,1]#millas y <- mtcars[,6]# peso total plot(x, y, xlab="mpg", ylab="peso") abline(lm(y ~ x),col="red",lwd=2)

Dispersión de la relación No todos los puntos estan sobre la recta Que representa cada punto?

Tipos de correlación Varía entre -1 y 1 Corelación positiva Aumento en x asociado a aumentos en y Correlación negativa Aumento en x asociado a reducción en y No correlación Variación en una variable no relacionada con aumento o disminución de otra Varía entre -1 y 1

Medidas de correlación Correlación de Spearman Producto momento de Spearman Varia entre -1 y 1 Se basa en los rangos de los valores y no en los valores netos Medida de asociación no parametrica

Distancia a la universidad (m) Difference between ranks (d) Tiend Distancia a la universidad (m) Rango distancia Price of 50cl bottle (€) Rank price Difference between ranks (d) d² 1 50 10 1.80 2 8 64 175 9 1.20 3.5 5.5 30.25 3 270 2.00 7 49 4 375 1.00 6 5 425 580 1.5 2.25 710 0.80 -5 25 790 0.60 -7 890 -4 16 980 0.85  d² = 285.5

Medidas de correlación

Correlación Spearman R dist<-c(50,175,270,375,425,580,710,790,890,980) precio<-c(1.8,1.2,2,1,1,1.2,0.8,0.6,1,0.85) plot(dist, precio,cex=2)#graficar valores plot(order(dist),order(precio),cex=2)#graficar rangos cor(dist,precio,method="spearman")

Medidas de correlación Correlación de Pearson Parametrica Relacionada a la varianza Covarianza

Correlación de Pearson r Correlación de Pearson es covarianza dividida por las desviaciones estandard de las dos variables Covarianza estandarizada No confundirla con R2 cov1<-cov(dist,precio) sd_dist<-sd(dist) sd_precio<-sd(precio) cor1<-cov1/(sd_dist*sd_precio) cor2<-cor(dist,precio) cor2-cor1 round(cor2-cor1,0)

Factores que afectan r Restricciones de rango Las mediciones solo representan una porción pequeña del rango Las mediciones representan una fracción de la población total set.seed(7) dist1<-sample(dist,4) precio1<-sample(precio,4) plot(dist,precio) points(dist1,precio1,col="red") cor3<-cor(dist1,precio1) cor3-cor1 round(cor3-cor1,0)

Factores que afectan r Falta de lineraridad La correlación de Pearson mide el grado de asociación lineal entre variables Si la relación es no linear el valor de r no representa un estadistico relevante set.seed(7) unif1<-exp(rnorm(200)) unif2<-rnorm(200) cor(unif1,unif2);plot(unif2,unif1) cor(log(unif1),unif2)

Factores que afectan r Submuestras heterogeneas Valores extremos set.seed(7) unif1<-c(rnorm(200),300) unif2<-c(rnorm(200),0) cor(unif1,unif2) plot(unif2,unif1,cex=2,col="red")

Countries With Low Consumptions Data With Restricted Range Truncated at 5 Cigarettes Per Day Cigarette Consumption per Adult per Day 5.5 5.0 4.5 4.0 3.5 3.0 2.5 CHD Mortality per 10,000 20 18 16 14 12 10 8 6 4 2

Truncation

Non-linearity

Heterogenous samples

Outliers

Como analizar la correlacion r Cuando grande es grande Pequeñas correlaciones en data set grandes son importantes Grandes correlaciones en data sets pequeños no siempre son importantes El tamaño de la muestra es fundamental https://www.researchgate.net/profile/Luis_Hurtado5/publication/293802268/figure/fig2/AS:328049343123477@1455224466641/Figure-5-Correlation-between-pairwise-genetic-distances-and-Euclidean-distances-The.png

Como probar si r es diferente de 0 Parametro r (rho)=  Hipotesis nula =0 Prueba de dependencia linear Prueba t de valor diferente de 0 Grados de libertad Df=n-2

Como probar si r es diferente de 0 dist<-c(50,175,270,375,425,580,710,790,890,980) precio<-c(1.8,1.2,2,1,1,1.2,0.8,0.6,1,0.85) plot(dist, precio,cex=2)#graficar valores cor(dist,precio) cor_t<-cor(dist,precio) GL<-10-2 T_value<- cor_t*sqrt((10-2)/(1-cor_t^2)) T_value dt(T_value,GL) cor.test(dist,precio)

Correlación y regresión En correlación se examina SOLO la relación entre las variables (covarianza) En regresión se examina como una variable independiente (x) AFECTA el cambio en una variable dependiente (y) β̂ =cor(Yi,Xi)⋅SD(Yi)/SD(Xi) Yi=α+βXi+εi

Correlación y regresión La pendiente de una regresión NUNCA es igual al valor de la correlación Excepto cuando SD(Yi)=SD(Xi) β =cor(Yi,Xi)⋅SD(Yi)/SD(Xi) β =cor(Yi,Xi)⋅(1)) Yi=α+βXi+εi

Ques es regresión? Es una técnica estadistica para predecir el valor mas probable de una variable con respecto a otra variable ”independiente” Usa la naturaleza de la relación lineal (correlación-covarianza) entre variables Contesta dos preguntas basicas: Cual es la relación entre las variables? Con que certeza podemos predecir una variable? http://www.ferdinand-engelbeen.be/klimaat/klim_img/Vostok_trends.gif

Correlación y regresión set.seed(7) a<-sort(runif(20)) a2<-(a-mean(a))/sd(a) #estandarizacion para sd=1 set.seed(3) b<-sort(runif(20)) b2<-(b-mean(b))/sd(b) #estandarizacion para sd=1 cor1<-cor(a2,b2) reg1<-lm(a2~b2) print(c(cor1,coef(reg1)[2])) plot(a2,b2) abline(reg1,col="blue", lwd=6)#linea de regresion en azul abline(0,cor1,col="red", lwd=2) #linea de corelacion en rojo

Correlación y regresión

Regresión Podemos predecir una variable desde otra variable? Cual es el nivel de precisión de la predicción? Como varia una variable con respecto a otra?

Ques es regresión? Es una técnica estadistica para predecir el valor mas probable de una variable con respecto a otra variable ”independiente” Usa la naturaleza de la relación lineal (correlación-covarianza) entre variables Contesta dos preguntas basicas: Cual es la relación entre las variables? Con que certeza podemos predecir una variable? http://www.ferdinand-engelbeen.be/klimaat/klim_img/Vostok_trends.gif

Ques es regresión? Los útimos 420 ky (hielo antartico) http://www.ferdinand-engelbeen.be/klimaat/klim_img/Vostok_trends.gif

Regresión = el valor predicho de la variable X = el valor de la variable independiente a = el valor de la variable cuando x=0 (intercepto) b = la tasa de cambio de la variable x con respecto a y (pendiente)

Regresión-coeficientes Valores a y b a = el valor de la variable cuando x=0 (intercepto) b = la tasa de cambio de la variable x con respecto a y (pendiente)

Regresión = el valor predicho de la variable X = el valor de la variable independiente a = el valor de la variable cuando x=0 (intercepto) x <- mtcars[,1]#millas y <- mtcars[,6]# peso total plot(x, y, xlab="mpg", ylab="peso") reg1<-lm(y~x) coef(reg1) abline(coef(reg1),col="red")