Correlación 1
¿Qué es correlación? Es el método estadístico utilizado para determinar si existe relación entre las variables.
¿Qué es Regresión? Es el método estadístico utilizado para describir la naturaleza de la relación entre las variables: positiva o negativa, lineal o no-lineal.
Preguntas estadísticas que contesta un análisis de correlación y regresión ¿Están dos o más variables relacionadas? Si las variables están relacionadas, ¿Qué tan fuerte es su relación? ¿Qué clase de relación existe? ¿Qué clase de predicción puede ser realizada usando esta relación?
Diagrama de dispersión Es útil cuando deseamos conocer la relación que puede existir entre dos variables; es decir, conocer qué sucede con una variable si la otra aumenta o disminuye. Luego de ver la tendencia del diagrama de dispersión, se procede a realizar una regresión. Típicamente la primera regresión intentada es la lineal. La mediada estadística utilizada para validar la relación entre las variables se conoce como el coeficiente de correlación.
Ejemplos de diagramas de dispersión
Coeficiente de Correlación de Pearson Es computado utilizando los valores de ambas variables, para determinar la fortaleza y dirección de la relación lineal. El rango del coeficiente es de -1 a 1. Cuando el valor absoluto del coeficiente es 1, indica que existe una correlación fuerte entre las variables. El signo determina si la correlación es positiva o negativa.
Ejemplos de diagramas de dispersión
Ejemplos de diagramas de dispersión
Ejemplos de diagramas de dispersión
Ejemplo-1 Un investigador le interesa saber si existe una correlación entre la edad de los adultos y su presión sanguínea, particularmente la sistólica. Realice un diagrama de dispersión y calcule el coeficiente de correlación. Sujeto Presión Edad A 128 43 B 120 48 C 135 56 D 143 61 E 141 67 F 152 70
Ejemplo-1-Gráfico y Coeficiente de Correlación Sujeto Presión Edad A 128 43 B 120 48 C 135 56 D 143 61 E 141 67 F 152 70
Significancia del coeficiente de correlación lineal El coeficiente de correlación de una muestra es identificado por la letra r y el de una población por la letra griega . Para evaluar la significancia se utilizan los pasos tradicionales de prueba de hipótesis: establecer la hipótesis nula, encontrar los valores críticos, compute el valor de la prueba, tome decisión y concluya. La formula para calcular el valor “t-Test”, para el coeficiente de correlación: n-2, son los gados de libertad
Coeficiente de Determinación y No-determinación El coeficiente de determinación es la razón de la variación explicada entre la variación total y es representada por r2. Es la medida de la variación de la variable dependiente, explicada por la regresión lineal. El coeficiente no-determinación es la variación no explicada por la regresión. Al ser excluyente estos coeficientes, el coeficiente de no-determinación queda definido por:
Ejemplo 1- Significancia del Coeficiente de Correlación Sujeto Presión Edad A 128 43 B 120 48 C 135 56 D 143 61 E 141 67 F 152 70
Análisis de Varianza (Anova)
ANOVA Es la técnica estadística, normalmente utilizada para analizar resultados en la investigación con diseños experimentales y cuasi experimentales. Ideal para comparar tres o más distribuciones, que corresponden a variaciones de una misma variable dependiente, afectada por una o más variables independientes.
Prueba de Hipótesis Para aplicar esta prueba se tienen que cumplir los mismos supuestos que para la prueba “t-Test”. La hipótesis nula de la prueba es
Ejemplo-2-ANOVA Un investigador desea probar la efectividad de diferentes técnicas para bajar la presión sanguínea a individuos diagnosticados con alta presión. Los sujetos fueron asignados aleatoriamente en tres grupos: Medicamentos, Ejercicios, Dieta. En la siguiente tabla se presenta la reducción en la presión de cada sujeto. Medicamentos Ejercicios Dieta 10 6 5 12 8 9 3 15 13 2 4
Ejemplo-2-ANOVA-Resultado Medicamentos Ejercicios Dieta 10 6 5 12 8 9 3 15 13 2 4