La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

RELACIÓN ENTRE VARIABLES

Presentaciones similares


Presentación del tema: "RELACIÓN ENTRE VARIABLES"— Transcripción de la presentación:

1 RELACIÓN ENTRE VARIABLES
UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA RELACIÓN ENTRE VARIABLES Profa.: Brenda Yépez-Martínez

2 RELACIÓN ENTRE VARIABLES
Profa.: Brenda Yépez-Martínez

3 Relación entre variables cuantitativas
Tema 3: Descripción Global de un Colectivo y Comparaciones desde la Perspectiva Bivariable Relación entre variables cuantitativas Ecuación de una recta. Regresión: definición e importancia El método de los mínimos cuadrados: definición e importancia. Estimación de una ecuación de regresión lineal simple por el método de los Mínimos Cuadrados. Coeficiente de Correlación y Determinación: definición, cálculo e interpretación. Relación entre variables cualitativas El Coeficiente de correlación por Rangos de Pearson: definición, cálculo, importancia e interpretación. La prueba Chi-Cuadrado de Pearson: definición, cálculo, interpretación e importancia. Coeficientes de Asociación

4 ANÁLISIS ESTADÍSTICO DE DOS VARIABLES CUANTITATIVAS
_____________________Relación entre variables cuantitativas ANÁLISIS ESTADÍSTICO DE DOS VARIABLES CUANTITATIVAS Nivel de Medición: Intervalo, Razón La asociación entre variables presenta dos aspectos distintos pero estrechamente relacionados: ANÁLISIS DE REGRESIÓN SIMPLE ANÁLISIS DE CORRELACIÓN SIMPLE Establece la naturaleza de la relación entre variables, estudia la relación funcional entre las variables y por tanto proporciona un mecanismo de predicción o pronóstico Determina el grado o la fuerza de la relación o asociación entre las variables

5 Objetivo del Análisis de Regresión
_____________________Relación entre variables cuantitativas Objetivo del Análisis de Regresión El análisis de regresión se utiliza con el propósito de hacer predicciones, y su objetivo es el desarrollo de un modelo estadístico que pueda ser utilizado para predecir los valores de una variable de respuesta o dependiente basados en los valores de una variable independiente o explicativa. En regresión los datos provienen de observaciones efectuadas en dos variables, las distribuciones formadas para tales conjuntos de datos se denominan bivariantes o bivariadas. Representación Gráfica de una Distribución Bidimensional. Sean las siguientes Observaciones: X1 , X2 … Xn Y1 , Y2 … Yn Diagrama de Dispersión Y X X1 Y1 (X1 , Y1) NUBE DE PUNTOS

6 _____________________Relación entre variables cuantitativas
Y Relación Curvilinea Positiva X Y X Relación Lineal Positiva Y X Relación Lineal Positiva Perfecta Y X Relación Curvilinea Negativa Y Y X Relación Lineal Negativa X Relación Lineal Negativa Perfecta Y X Relación Curvilinea Positiva Y X No exixte relación

7 Cómo se obtiene la recta de mejor ajuste?
_____________________Relación entre variables cuantitativas En el caso de que el Diagrama de Dispersión indique una relación de tipo lineal muchas son las rectas que se pueden ajustar a la nube de puntos. Dado un conjunto de datos bivariados (x,y) Cómo se obtiene la recta de mejor ajuste? Cómo elegir una recta de tal modo que los errores o diferencias que se generan entre el valor real y el valor obtenido a través de la recta ajustada sean mínimos? El Mátemático Francés Adrian Legendre (s.XIX) Definió el método que implica encontrar la Línea Recta que mejor se ajuste a los datos MÉTODO DE LOS MÍNIMOS CUADRADOS Posee la propiedad de que la suma de los cuadrados de las desviaciones de los valores reales de “Y” o las distancias verticales de los puntos a la línea recta sea mínima . Simbólicamente:

8 _____________________Relación entre variables cuantitativas
Y X X1 Y1 (X1 , Y1) X2 Y2 (X2 , Y2) (X1 , Ŷ1) (X2 , Ŷ2) e2+ e1- Ŷ=a+bx Supongase que Ŷ=a+bx es la ecuación de una recta, donde (Ŷ) representa el valor predicho (Y) que corresponde a un valor particular de (X). El criterio de los MINIMOS CUADRADOS requiere que se encuentren constantes a y b tales que la suma sea tan pequeña como sea posible.

9 IMPORTANCIA DEL MÉTODO DE LOS MÍNIMOS CUADRADOS
_____________________Relación entre variables cuantitativas IMPORTANCIA DEL MÉTODO DE LOS MÍNIMOS CUADRADOS Permite realizar una estimación confiable ya que garantiza que la suma de los errores o desvíos al cuadrado sea mínima El procedimiento para adaptar una recta a un conjunto de puntos presenta una recta resultante con las siguientes características: Es nula la suma de las desviaciones verticales de los puntos a partir de la recta Es mínima la suma de los cuadrados de las desviaciones . SU IMPORTANCIA FUNDAMENTAL RADICA EN QUE NINGUNA OTRA RECTA DARÍA LA SUMA MENOR DE LAS DESVIACIONES ELEVADAS AL CUADRADO.

10 La ecuación de la Línea recta es: Y=a+bx donde:
_____________________Relación entre variables cuantitativas Estimación de una Ecuación de Regresión Lineal Simple por el Método de los Mínimos Cuadrados El Análisis de Regresión Lineal Simple incluye dos aspectos fundamentales: Estimar una variable a partir de otra variable; la variable que se estima es la dependiente y la variable a partir del cual se estima es la independiente. X en Y Y en X Encontrar una ecuación para describir la forma de relación entre las variables La ecuación de la Línea recta es: Y=a+bx donde: Y= Variable dependiente a= Valor de la ordenada en el origen b= Pendiente de la recta X= Variable independiente

11 La Ecuación de la Recta de mejor ajuste está determinado por:
_____________________Relación entre variables cuantitativas La Ecuación de la Recta de mejor ajuste está determinado por: La pendiente (b) indica la inclinación de la recta respecto al eje X. La ordenada en el origen (a) denominada intercepto o punto de corte de la recta con el eje de las ordenadas. Los valores de las Constantes que satisfacen el criterio de los Mínimos Cuadrados se obtienen por medio del siguiente sistema de Ecuaciones Normales: Resolviendo el Sistema de Ecuaciones 1ra Ecuación Normal 2da Ecuación Normal El coeficientes de regresión “a” es el valor que toma la variable dependiente “y” cuando la variable independiente “x” vale cero. El coeficientes de regresión “b” es el incremento negativo o positivo que sufre la variable dependiente “y” cada vez que la variable independiente “x” se incrementa en una unidad.

12 Varianza de la Recta de Regresión de y/x:
_____________________Relación entre variables cuantitativas La recta de regresión por Mínimos Cuadrados de “y” sobre “x” encontrada será: Una vez llevado a cabo el ajuste se hace necesario medir la dispersión que existe entre los valores reales y los obtenidos a través de la recta ajustada. Varianza de la Recta de Regresión de y/x: Desviación Estándar o Error Estándar de Estimación permite conocer la dispersión existente entre los valores reales y los estimados. Proporciona la desviación de los errores de predicción y por lo tanto es una indicación de la variabilidad de los valores reales respecto a los obtenidos con la recta de regresión.

13 La relación que pueda existir
_____________________Relación entre variables cuantitativas Objetivo del Análisis de Correlación Un modelo que nos permite hacer estimaciones o predicciones no estaría completo sí no conocemos acerca de la intensidad de la relación o el grado de asociación entre las dos variables en estudio. El análisis de correlación se utiliza con el propósito de de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables. La relación que pueda existir La dirección o tipo de asociación El grado de intensidad Aspectos que contempla el Análisis de Correlación

14 Correlación Negativa Perfecta r=- 1
_____________________Relación entre variables cuantitativas Coeficiente de Correlación r de Pearson (r), (Rxy): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde –1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta. Y X Correlación Positiva Perfecta r=1 Correlación Negativa Perfecta r=- 1 Sin Correlación r=0 “y” aumenta de una manera perfectamente predecible conforme se incrementa “x” “y” disminuirá de una manera perfectamente predecible en la medida en que “x” aumenta No esiste relación entre “x” e “y”.

15 _____________________Relación entre variables cuantitativas
Para llevarse a cabo un análisis de correlación de un conjunto de datos, el coeficiente de correlación se calcula trabajando directamente con los valores de las variables: La magnitud del Coeficiente de Correlación (r) indica cuan cerca están los puntos de la recta Cuando r = -1 existe una correlación negativa perfecta, inversamente proporcional Cuando r = 1 existe una correlación positiva perfecta, directamente proporcional Cuando r = 0 las variables se denominan incorrelacionadas o con ausencia asociación o dependencia entre ellas El grado de intensidad del coeficiente de correlación será más fuerte, mientras más se aleje r del valor cero.

16 Para transformar la Covarianza en el coeficiente de correlación es:
_____________________Relación entre variables cuantitativas Otra medida que se puede utilizar para expresar la relación entre dos variables aleatorias es la COVARIANZA ya que constituye una medida numérica de la variación simultánea de las dos variables aleatoria “x” y “y” es decir, indica la medida en la que dos variables VARÍAN JUNTAS. Al igual que para el coeficiente de correlación, un signo positivo indica una relación directa, en tanto que un signo negativo indica una relación inversa. Cuando el valor observado de “y” tiende a variar en la misma dirección con respecto a su media, entonces los productos de esas desviaciones tienden a ser positivos. Por ello la suma de esos productos sería positiva, indicando una relación directa. Para transformar la Covarianza en el coeficiente de correlación es: Donde Cov (xy) expresa el valor esperado del producto Y Sx, Sy las desviaciones estándar El valor estadístico r es la covarianza entre “x” y “y”.

17 _____________________Relación entre variables cuantitativas
Cuando se estudia la Varianza como una medida de aproximación del ajuste, se requiere también una medida que indique que tan bueno es el ajuste que se ha realizado. Una medida utíl es: COEFICIENTE DE DETERMINACIÓN: Es un coeficiente que se encuentra asociado a la línea de regresión y es el grado en que las predicciones que se basan en la ecuación de regresión son superiores a las basadas en el valor promedio de “y” es deir, sí las proyecciones que se fundamentan en la recta no son mejores que las que utiliza el valor promedio de “y” no tiene sentido contar con una ecuación de regresión. Y Y X X Dispersión de puntos respecto de la media del grupo Dispersión de puntos en lo referente a la línea

18 Distancia Total a “Error Total” o “Variación total”
_____________________Relación entre variables cuantitativas Y X Distancia Total a “Error Total” o “Variación total” Distancia de la línea de regresión a la Distancia de una observación individual a la línea de regresión

19 _____________________Relación entre variables cuantitativas
La dispersión (error) asociada a la recta es mucho menor que la dispersión (error) relacionada con ,las predicciones que se basan en la línea serán mejores que las basadas en La variación de los puntos respecto de recibe el nombre de variación total El porcentaje de variación explicada, r2 , Es la razón de la variación explicada a la variación total.

20 Relación entre dos Variables Cualitativas
_____________________Relación entre variables cualitativas Relación entre dos Variables Cualitativas Nivel de Medición: Ordinal y Nominal El coeficiente de Correlación por Rango de Spearman también conocido como Coeficiente de Determinación Gradual o rho de Spearman es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal de manera que los objetos o individuos en estudio puedan colocarse en dos series ordenadas. Procedimiento: 1.- Se ordenan los valores de una de las variables y lo acompañamos de su correspondiente valor ordenado en la otra variable 2.- Para cada par de observaciones (rangos) calculamos su diferencia di= rango de ui – rango de vi 3.- Se eleva al cuadrado cada di y se suman todos los valores encontrados 4.- Se calcula para determinar la discrepancia entre los rangos la siguiente fórmula: rs= -1 La asociación es negativa e inversa, las ordenaciones son perfectamente contrarias rs= 0 No existe asociación rs= 1 Las ordenaciones son todas concordantes

21 Relación entre dos variables nominales: Ji Cuadrado de Pearson
_____________________Relación entre variables cualitativas Relación entre dos variables nominales: Ji Cuadrado de Pearson La prueba Ji Cuadrado de Pearson es una medida para proporcionar el grado de asociación entre dos variables nominales, busca evidenciar la diferencia que existe entre los valores observados en las casillas y los que se habrían obtenido en el supuesto de que las dos variables no estuvieran relacionadas o fuesen independientes. Esta diferencia viene dada por el estadístico Ji cuadrado. O11 O12 O13 O1. O21 O22 O23 O2. O.1 O.2 O.3 O.. E11 E21 E22 E13 E23 E12 Total Marginal por fila Total General Total Marginal por Columna T A B L D E C O N I G

22 Coeficientes de Asociación
_____________________Relación entre variables cualitativas Coeficientes de Asociación El Coeficiente PHI denotado (Φ) , es un caso particular del coeficiente de correlación de Pearson, y se utiliza para conocer el grado de asociación entre dos variables supeditadas al diseño 2x2. A fin de utilizar adecuadamente el coeficiente PHI como medida de asociación entre las variables “x” y “y” dicotomizadas, de deben tomar en cuenta las siguientes condiciones: Datos nominales: Las variables “x” y “y”, deben ser nominales, ya que se requerirán las frecuencias observadas. Tablas de contingencia 2x2: Los datos deben poder colocarse en un diseno 2x2 (2 renglones y 2 columnas). Es inadecuado aplicar el coeficiente PHI a disenos mayores de 2x2, donde se comparan varios grupos o varias categorías. Muestreo aleatorio: Para poder comprobar la significancia y validez de PHI, la muestra en estudio debe haber sido extraída en forma aleatoria. Límite Máximo: Aunque su límite máximo es igual a 1, algunas veces el máximo que se puede alcanzar es inferior a la unidad. Para interpretar el coeficiente PHI, es preciso calcular el PHI máximo y tener un punto de referencia respecto a la cuantía de la relación:

23 Coeficientes de Asociación
_____________________Relación entre variables cualitativas Coeficientes de Asociación El Coeficiente de Contingencia denotado (C) y El Coeficiente V de Cramer denotado (V), son medidas que determina el grado de asociación o relación entre dos conjuntos de atributos colocados en una tabla de contingencia (doble entrada) con un diseño mayor de 2x2. Características de los Coeficientes de Asociación : a) Cuando exista una completa carencia de asociación, el coeficiente debe ser nulo, igual a cero. b) Cuando las variables muestran completa dependencia entre sí, estando perfectamente correlacionadas, el coeficiente debe ser igual a la unidad. Coeficiente de Contingencia Coeficiente V de Cramer Donde: X2= Valor Calculado de Ji Cuadrado N = Número Total de Casos Donde: X2= Valor Calculado de Ji Cuadrado n = Número Total de Casos l = Columna o renglón más pequeño de los dos El límite superior es una función del número de categorías. Cuando K=r (Columnas = filas), el límite superior es Limitación en b

24 Relación entre variables cuantitativas
C O N C L U S I Ó N Tema 3: Descripción Global de un Colectivo y Comparaciones desde la Perspectiva Bivariable Relación entre variables cuantitativas Ecuación de una recta Regresión: definición e importancia El método de los mínimos cuadrados Estimación de una ecuación (MMC) Coeficiente de Correlación y Determinación Relación entre variables cualitativas El Coeficiente de correlación por Rangos de Pearson La prueba Ji-Cuadrado de Pearson Coeficientes de Asociación


Descargar ppt "RELACIÓN ENTRE VARIABLES"

Presentaciones similares


Anuncios Google