Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.

Slides:



Advertisements
Presentaciones similares
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Advertisements

MSP César Eduardo Luna Gurrola
Si la estadística no miente...: ¡Cuánto influyes sobre mi!
Tema 6: Regresión lineal.
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
Correlación ©1997-Sep-06 Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística: -Correlación y regresión
REGRESION & CORRELACION
Introducción a la Estadística. Modelos de regresión
4ºESO Matemáticas B Colegio Divina Pastora (Toledo)
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
Funciones y gráficas 3º de ESO.
Unidad 8 Funciones.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
EJEMPLO COMPLETO Y APLICACIONES Bloque IV * Tema 161.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Curso de Estadística Básica
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Estadística bidimensional
MEDIDAS DE DISPERSIÓN:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis de Correlación y de Regresión lineal simple
Facultad: Turismo Y Hotelería
Distribuciones bidimensionales. Tablas de contingencia
REGRESION Y CORRELACION
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Pronósticos, Series de Tiempo y Regresión
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Departamento de Física
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
ESTADÍSTICA BIDIMENSIONAL
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
D. BIDIMENSIONALES DÍA 53 * 1º BAD CT
Diagramas de dispersión (Nube de puntos)
Variables estadísticas bidimensionales
Funciones PotenciaLES, exponenciales y logarítmicas.
Estadísticos Asunto de Estado: Estadísticos. Estadísticos Los parámetros estadísticos nos permiten tener una idea global de la población, compararla con.
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Varianza y Covarianza.
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Probabilidad y Estadística
Regresión Lineal Simple
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Variables estadísticas bidimensionales
Unidad 4 Análisis de los Datos.
TEMA 3: Estadística Bidimensional.
Medidas de dispersión: Varianza y desviación estándar
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA : ANALISIS DE REGRESION
UNIDAD IV Regresión y correlación lineal
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
FUNCIONES.
REGRESIÓN LINEAL SIMPLE
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
ESTADÍSTICA BIDIMENSIONAL
Ecuación Explícita de la Recta
Dr. Alejandro Salazar – El Colegio de Sonora
Transcripción de la presentación:

Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente e Y la dependiente (Y “depende” de X). Altura y peso de niños. Peso = f(Altura) Velocidad máxima que alcanza un coche y potencia de su motor. Velocidad = f(Potencia) Presupuesto para adquisiciones y número de libros que puede adquirir una biblioteca. Libros = f(Presupuesto) La relación puede ser claramente causal o no. La potencia del motor de un coche es la causa de que alcance una mayor velocidad, así como un mayor presupuesto el que se puedan comprar más libros. (X es la “causa” de Y) La relación altura – peso tiene parte de causalidad, pero también existen otros factores. (X y otros factores son la causa de Y) Cuando se hacen correlaciones hay que analizar bien el fenómeno para no caer en errores (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Correlaciones espúreas Hay que evitar las denominadas correlaciones espúreas o espurias, es decir, que llevan a conclusiones erróneas. Ocurren cuando dos variables, X e Y, son realmente independientes entre sí, pero dependientes ambas de una misma causa común, Z. X Y Z Ejemplo de correlación espúrea: Cierto biólogo inglés publicó un estudio en el que se comprueba que en los pueblos y ciudades con más cigüeñas en los campanarios, X, nacen más niños, Y. Llegó a la conclusión de que “los niños los trae la cigüeña”. Lo cierto es que tanto el número de cigüeñas, X, como el de niños, Y, dependen de la causa común, Z, que es el tamaño del pueblo o ciudad. En las poblaciones grandes hay siempre más cigüeñas y más niños. Tanto cigüeñas como niños están correlacionados con el tamaño de la población, pero no entre ellos mismos. (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Nubes de Puntos No hay correlación Correlación positiva Sea un conjunto de pares de valores de las variables X e Y. Si los representamos en un diagrama de dispersión obtendremos una “nube de puntos” que nos dará una idea gráfica de la posible correlación entre ambas variables. No hay correlación Correlación positiva Correlación negativa Y Y Y X X X (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Algunos tipos de correlaciones Modelo Lineal Correlación lineal positiva Correlación lineal negativa Potencial Logarítmica Otros tipos Potencial inversa Exponencial negativa Otros tipos Potencial Exponencial positiva Otros tipos (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Covarianza Recordemos que... En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si. Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relación entre ambas variables: mientras más alto sea el alumno, mayor será su peso. El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las varables es lineal (es decir, si representaramos en un gáfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta). No obstante, puede que exista una relación que no sea lineal, sino exponencial, parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la intensidad de la relación las variables, por lo que convendría utilizar otro tipo de coeficiente más apropiado. Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejor es representar los pares de valores en un gráfico y ver que forma describen. El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula: Es decir: Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamaño de la muestra. Denominador se calcula el produto de las varianzas de "x" y de "y", y a este produto se le calcula la raíz cuadrada. Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1 Si "r" > 0, la correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La correlación es tanto más fuerte cuanto más se aproxime a 1. Por ejemplo: altura y peso: los alumnos más altos suelen pesar más. Si "r" < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlación negativa es tanto más fuerte cuanto más se aproxime a -1. Por ejemplo: peso y velocidad: los alumnos más gordos suelen correr menos. Si "r" = 0, no existe correlación lineal entre las variables. Aunque podría existir otro tipo de correlación (parabólica, exponencial, etc.) De todos modos, aunque el valor de "r" fuera próximo a 1 o -1, tampoco esto quiere decir obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que este resultado podría haberse debido al puro azar. El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las varables es lineal (es decir, si representaramos en un gáfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta). Covarianza Recordemos que... Media aritmética: Suma de los valores que toma una variable dividida entre el número total, n, de valores sumados. Varianza: Es una medida de lo que se dispersan los valores de una muestra respecto de su media. Se determina con cualquiera de las formulas equivalentes siguientes: La varianza, V, es también el cuadrado de la desviación típica, S. Cuando se trata de una distribución bidimensional... Covarianza: Es una medida de lo que se dispersan los valores de una muestra bidimensional tanto del valor medio de la x como del valor medio de la y. Se determina mediante la expresión: (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Coeficiente de Correlación de Pearson, r Bondad de los ajustes El coeficiente de correlación de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones típicas (raiz cuadrada de las varianzas) Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes: (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Grado de Correlación Correlación lineal positiva El coeficiente de correlación, r, presenta valores entre –1 y +1. Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente. Correlación lineal positiva Correlación lineal negativa No hay correlación Hay correlación no lineal (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Determinar si existe correlación entre las calificaciones de matemáticas y física de un alumno.

Determinar si existe correlación entre las calificaciones de matemáticas y física de un alumno.

Regresión lineal

Ecuación Explícita de la Recta Modelos Lineales Ecuación Explícita de la Recta y y = a + bx Los valores de “y” se calculan multiplicando “x” por la pendiente, b, y sumándole la ordenada en el origen, a b a x a .- Ordenada en el orígen. Punto de corte con el eje de ordenadas o “eje y”. En este punto x está en el “origen” es decir x=0 b .- Pendiente. Grado de inclinación de la recta. Si es positiva, la recta es creciente. Si es negativa es decreciente. Es el cociente entre el incremento que se produce en la variable dependiente, Y, cuando se incrementa la variable independiente, X. (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Ejemplos de Rectas Recta decreciente, ya que la pendiente es negativa La recta decrece una unidad de y por cada unidad de x, es decir b=-1 Cuando x=0, y=4. La ordenada en el origen, a, vale 4 Recta creciente, ya que la pendiente es positiva La recta crece dos unidades de y por cada unidad de x, es decir b=2 Cuando x=0, y=1. La ordenada en el origen, a, vale 1 (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Ejemplo 1. Regresión Lineal (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Coeficiente de Determinación, R2 Para estimar la bondad de un ajuste frecuentemente se prefiere utilizar el Coeficiente de Determinación, R2, que es el Coeficiente de Correlación elevado al cuadrado. Se determina mediante cualquiera de las dos expresiones siguientes: Su valor oscila entre 0 y +1. Cuando hay una buena correlación lineal, R2 es muy cercano a +1. Normalmente se acepta para valores de R2 >= 0’99. Cuando no hay correlación o bien ésta no es lineal, R2 es bajo e incluso cercano a cero (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Ejemplo 2: Regresión lineal (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Ejemplo 4: Relación Profesores/Alumnos en las Universidades Españolas Trazar la gráfica de la distribución Calcular parámetros de la distribución ¿ Cuál es la Universidad con mejor proporción profesor/alumno? ¿Qué Universidad tiene la peor ratio y cuántos profesores necesitaría para equilibrarla? Calcular los valores teóricos de profesores de la Universidad de Granada si ésta tenía 55123 alumnos en el curso 1994-95. Calcular los valores de la FBD si ésta tenía 1100 alumnos R2=0.998 b=0.0515 a=-17 (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)

Ejemplo 4: Gráfica de distribución Relación Profesores/Alumnos en Universidades (c) Rosario Ruiz Baños. Departamento de Biblioteconomía y Documentación. Universidad de Granada (España)