CORRELACIÓN CAP 8 DE Peña y Romo.

Slides:



Advertisements
Presentaciones similares
Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)
Advertisements

Estadística bivariada Pedro Godoy Gómez. Si Y es otra variable definida sobre la misma población que X, ¿será posible determinar si existe alguna relación.
Técnicas de Visualización de la Información Armando A Quiñones Quiñones.
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
Capítulo 1.4: Distribución de frecuencias unidimensionales Introducción Descripción numérica Representación gráfica.
Tema 3: Distribuciones bidimensionales: Relación estre dos variables estadísticas Relación estadísca: Correlación Diagramas de dispersión.
ESTADÍSTICAS DESCRIPTIVAS TEORÍA DE LA CORRELACIÓN Psic. Gerardo A. Valderrama M.
TEMA 3. ESTADÍSTICA BIDIMENSIONAL. INDICE 1.- Relación estadística: correlación 2.- Diagramas de dispersión o nube de puntos 3.- Tablas de frecuencia.
1. Relación estadística: correlación 2. Diagramas de dispersión o nube de puntos 3. Tablas de frecuencia simples o doble entrada 4. Distribuciones marginales.
TEMA 3: ESTADÍSTICA BIDIMENSIONAL. ÍNDICE: 1.- Relación estadística: correlación. 2.- Diagramas de dispersión o nube de puntos. 3.- Tablas de frecuencia.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
TEMA 3: Estadística Bidimensional. ● Álvaro Fernández Romero y Luis Carlos Fernández herrezuelo.
CORRELACIÓN.  La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia.
Por : ELENA MARÍA SÁNCHEZ HERBER CASTAÑEDA. Estos gráficos nos permiten realizar un primer análisis de los datos que se han recolectado para tal fin y.
ESTADÍSTICAS DESCRIPTIVAS REPRESENTACIONES GRÁFICAS Psic. Gerardo A. Valderrama M:
Tema 2. Parámetros estadísticos. Indice 1. Parámetros estadísticos. Tipos: 1.1 Medidas de centralización(medias y moda) 1.2 Medidas de posición(mediana,
República Bolivariana de Venezuela Instituto Universitario Politécnico “Santiago Mariño" Estadísticas I - OV Estadística Profesor : Bachiller: Pedro Beltrán.
FUNCIONES, PROSESAMIENTO ELEMENTAL DE DATOS
MEP- II.
Distribuciones bidimensionales: Relación entre dos variables estadísticas Tema 3:
ESTADÍSTICA BIDIMENSIONAL
DISTRIBUCION F DE FISHER.
Facultad de Ciencias Sociales
Normatividad relativa a la calidad
TEMA 3: Distribuciones bidimensionales: relación entre dos variables estadísticas. Cristhian Lopez.
ESTADÍSTICA BIDIMENSIONAL
DISTRIBUCIONES BIDIMENSIONALES
Facultad de Ciencias Sociales
Estadística bivariada
ESTADÍSTICA BIDIMENSIONAL
Clase 5: Medidas de Variación
ASIMETRÍA.
LA COVARIANZA Y EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
ESTADÍSTICA BIDIMENSIONAL
Relaciones entre variables
Análisis descriptivo y presentación de datos bivariables
Variables estadísticas bidimensionales
Sistema de Referencia sistema de coordenadas cartesiano o
REGRESIÓN LINEAL SIMPLE
GRÁFICOS EN ESTADÍSTICA
Unidad VII y VIII Medidas de forma de la distribución de datos.
Análisis de covarianza
PROBABILIDAD Y ESTADÍSTICA
CORRELACIÓN ENTRE VARIABLES
1. DISTRIBUCIONES BIDIMENSIONALES En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables que se representan.
Relaciones entre variables aleatorias y regresión lineal
Aplicaciones Estadísticas a las Finanzas
ESTADÍSTICA BÁSICA.
Estadística para investigación 1. 2 Estadística Introducción ¿Qué es la estadística? Es una Ciencia que explica y provee de herramientas para trabajar.
EQUIPO 5.
REGRESION LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE
Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva
estadistica 6 graficas Gráficas
ESTADÍSTICA BIDIMENSIONAL
Dr. Carlomagno Araya Alpízar
Elementos Básicos de Probabilidad y Estadística
Dr. Alejandro Salazar – El Colegio de Sonora
ESTADISTICA DESCRIPTIVA
PROBABILIDAD Y ESTADISTICA
MODELOS DE PRONOSTICOS
ESTADÍSTICA BIDIMENSIONAL
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
Presentación de resultados
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
ANALISIS DE REGRESION SIMPLE
REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
UNIDAD EDUCATIVA “MARIANO PICON SALAS REGRESION LINEAL SIMPLE
Transcripción de la presentación:

CORRELACIÓN CAP 8 DE Peña y Romo

Objetivo: es estudiar la relación entre dos variables continuas Nos proponemos estudiar el grado de dependencia lineal entre ellas mediante el coeficiente de correlación. Distribución conjunta de dos variables continuas. Variable bidimensional: Es cuando en cada elemento de una población se miden dos variables distintas.

Objetivo: es estudiar la relación entre dos variables continuas hijos padres menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas   menor 160 4 1 9 2 7 10 3 22 20 25 61 18 26 30 19 98 17 66 5 15 8 47 6 51 76 77 64 16 312

Distribución conjunta Unidad de análisis: la familia Variable x = estatura de los padres Variable y= estatura de los hijos N = cantidad de pares de datos (x1, y1), (x2, y2), …, (xn,yn) Distinguimos: distribución conjunta (absoluta o relativa), marginales (de x e y) y condicionales.

Distribución conjunta absoluta y relativa hijos padres menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas   menor 160 4 1 9 2 7 10 3 22 20 25 61 18 26 30 19 98 17 66 5 15 8 47 6 51 76 77 64 16 312 hijos padres menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas   menor 160 0,01 0,00 0,03 0,02 0,07 0,06 0,08 0,20 0,10 0,31 0,05 0,21 0,15 0,16 0,24 0,25 1

Distribución condicionada Ej: La distribución de la estatura de los jóvenes condicionada a que la estatura de los padres esta entre 165 y 169 cm. Hay 61 jóvenes que cumplen esa condición: menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas total   3 20 25 9 4 61 0,049 0,328 0,41 0,148 0,066 1

Gráficas: diagramas de dispersión Este diagrama se construye representando cada elemento observado por un punto en el plano de manera que sus coordenadas sobre los dos ejes cartesianos sean los valores que toman las dos variables en ese elemento. Padre 1,7 1,77 1,68 1,75 1,8 1,69 1,72 1,71 1,73 Hijo 1,74 1,78 1,76

DIAGRAMA DE DISPERSIÓN ESTATURA HIJOS ESTATURA DE LOS PADRES

COVARIANZA La relación entre dos variables puede expresarse numéricamente usando la covarianza: “Es una medida de asociación lineal entre dos variables que resume la información existente en un diagrama de dispersión”

Interpretación de la covarianza Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas. Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeños valores de y. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre sí, que tanto se mueve una cuando la otra se mueve otro tanto. Ejemplo, si la variable X se mueve 1, supongamos que la variable Y se mueve 2, entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movería la variable X.

Coeficiente de correlación La covarianza depende de las unidades de medida de las variables, por lo tanto si modificamos las unidades de medida de las variables la covarianza cambiará. Esto nos impide comparar la relación entre distintos pares de variables medidas en diferentes unidades. Para ello se dividió la covarianza por el producto de los desvíos (desviaciones típicas). El coeficiente de correlación de Pearson es independiente de la escala de medida de las variables.

Coeficiente de correlación r = Cov(x,y)/ SX . SY donde CovXY es la covarianza de (X,Y) y SX y SY las desviaciones típicas de las distribuciones marginales.

INTERPRETACIÓN COEFICIENTE DE CORRELACIÓN El valor del índice de correlación varía en el intervalo [-1, +1]: Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante. Si 0 < r < 1, existe una correlación positiva. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlación negativa. Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

r(ax+b, cy+d)=r(x,y) con a y c de igual signo Otras propiedades: El Coeficiente no depende del orden en que se consideran las variables, es decir: r(x,y) = r(y,x) No se altera por transformaciones lineales de las variables: r(ax+b, cy+d)=r(x,y) con a y c de igual signo

Tener en cuenta: Al estudiar la relación entre dos variables hay que tener en cuenta: Datos atípicos que pueden modificar el signo de la relación El coeficiente tiene que ser consistente con el gráfico del diagrama de dispersión. La existencia de una relación entre las dos variables no implica relación de causa y efecto (hay que observaciones posibles correlaciones espurias o sea. al efecto de otra variable)