ELEMENTOS DE ESTADÍSTICA BIVARIANTE Dpto. de Cs. Matemáticas y Física Área Estadística Prof. Juan Moncada Herrera
Estadística Bivariante Objetivos Estudiar, explorar y/o valorar la relación o asociación existente entre DOS variables
Estadística Bivariante Escenarios posibles
Estadística Bivariante Esquema de análisis
AMBAS VARIABLES CUANTITATIVAS Estadística Bivariante AMBAS VARIABLES CUANTITATIVAS
Cuantitativa Descriptiva > Gráfica Estadística Bivariante Diagrama de Dispersión
Cuantitativa Descriptiva > Gráfica Estadística Bivariante Diagrama de Dispersión
Cuantitativa Descriptiva > Gráfica Estadística Bivariante Diagrama de Dispersión
Coeficiente de correlación Estadística Bivariante Cuantitativa Descriptiva > Numérica Coeficiente de correlación lineal de Pearson
Cuantitativa Descriptiva > Numérica Estadística Bivariante El porcentaje de variabilidad de Y explicado por la variabilidad en X lo mide el coeficiente de determinación, que corresponde a r2.
Cuantitativa Descriptiva > Numérica Estadística Bivariante X 16 14 22 10 17 13 19 12 18 11 Y 77 70 85 50 62 52 63 80 57 81 54 X: Puntaje en un sistema de aprendizaje Y: Costo asociado al logro del puntaje
Cuantitativa Inferencial H0: Las variables son independientes Estadística Bivariante Cuantitativa Inferencial H0: Las variables son independientes (Variables no relacionadas) Ha: Las variables No son independientes (Variables relacionadas)
Estadística Bivariante Cuantitativa Inferencial Estadístico de Prueba:
AMBAS VARIABLES CUALITATIVAS Estadística Bivariante AMBAS VARIABLES CUALITATIVAS
Cualitativa Los Objetivos Estadística Bivariante DADAS DOS CARACTERÍSTICAS DE LA POBLACIÓN, Y EN BASE A LAS FRECUENCIAS U OBSERVACIONES CORRESPONDIENTES: ¿EXISTE ALGUNA RELACIÓN ENTRE TALES CARACTERÍSTICAS, O MÁS BIEN SON ELLAS INDEPENDIENTES?
Cualitativa Preliminares Estadística Bivariante Punto de partida: El cuestionario
Variables cualitativas Estadística Bivariante Cualitativa Preliminares Variables cualitativas Individuos X1 X2 1 2 ... n La Tabla de Datos
Cualitativa Preliminares Estadística Bivariante Ind Carrera Adsc.Rel 1 B C2 2 C 3 A C1 4 5 6 D 7 8 9 10 11 12 13 14 15 Tabla de códigos condensados
Cualitativa Resumen-Descripción Estadística Bivariante Ind Carrera Adsc.Rel 1 B C2 2 C 3 A C1 4 5 6 D 7 8 9 10 11 12 13 14 15 La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A B C D TOTALES COLUMNA
Cualitativa Resumen-Descripción Estadística Bivariante Ind Carrera Adsc.Rel 1 B C2 2 C 3 A C1 4 5 6 D 7 8 9 10 11 12 13 14 15 La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Construcción ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas Frecuencias Absolutas Frecuencias Relativas ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15 ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2/15 B C D TOTALES COLUMNA
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas Frecuencias Absolutas Frecuencias Relativas ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15 ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2/15 B C D TOTALES COLUMNA
Cualitativa Resumen-Descripción Estadística Bivariante La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas Frecuencias Absolutas Frecuencias Relativas ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15 ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2/15 4/15 B 1/15 3/15 C D TOTALES COLUMNA 6/15 9/15 1
Cualitativa Resumen-Descripción Estadística Bivariante Comparaciones pertinentes: Las Tablas de Perfiles Frecuencias absolutas Perfiles Fila (o Linea) ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15 ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2/4 1 B 1/3 2/3 C 1/4 3/4 D TOTALES COLUMNA 6 9 15
Cualitativa Resumen-Descripción Estadística Bivariante Comparaciones pertinentes: Las Tablas de Perfiles Frecuencias absolutas Perfiles columna ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15 ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2/6 2/9 4 B 1/6 3 C 3/9 D TOTALES COLUMNA 1 15
Cualitativa Inferencia Las Hipótesis Estadística Bivariante H0: Las variables son independientes (Variables no relacionadas) Ha: Las variables No son independientes (Variables relacionadas)
Cualitativa Inferencia Estadística Bivariante Midiendo la relación entre las variables: La tabla de Valores Esperados Valores Observados Valores Esperados ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A 2 4 B 1 3 C D TOTALES COLUMNA 6 9 15 ADSC. RELIG. CARRERA C1 C2 TOTALES FILAS A (4*6)/15 B C (4*9)/15 D TOTALES COLUMNA
=(No filas - 1)(No columnas – 1) Estadística Bivariante Cualitativa Inferencia Midiendo la relación entre las variables: El estadístico Chi-cuadrado fobs: Frecuencia absoluta observada fESP: Frecuencia esperada 2: Distribución Chi-cuadrado con grados de libertad, =(No filas - 1)(No columnas – 1)
Análisis Factorial de Correspondencias
Análisis Factorial de Correspondencias OBJETIVO: Jean Paul Benzecri (1932 - ) Gráficamente: Visualizar, mediante proyecciones sobre planos, las proximidades entre perfiles línea, entre perfiles columna y entre perfiles línea y perfiles columna de una tabla de contingencia.
Variables Cualitativas Análisis Factorial de Correspondencias LA TABLA DE DATOS: Variables Cualitativas Individuos X1 X2 1 n
Frecuencias relativas Análisis Factorial de Correspondencias TRANSFORMACIONES INICIALES: Tabla de contingencia … j … i … nij … ni. … n.j … n.. Frecuencias relativas … j … i … fij … fi. … f.j … 1
Frecuencias relativas Análisis Factorial de Correspondencias TRANSFORMACIONES INICIALES: Perfiles línea … j … i … …. 1 … f.j … Frecuencias relativas … j … i … fij … fi. … f.j … 1 Perfiles columna … j … i … …. fi. … 1 … 1
Análisis Factorial de Correspondencias TRANSFORMACIONES INICIALES: Perfiles línea … j … i … …. 1 … f.j … Perfiles columna … j … i … …. fi. … 1 … 1 Espacio de filas Espacio de columnas
Análisis Factorial de Correspondencias EL REFERENCIAL: PROCESO DE DIAGONALIZACIÓN REPRESENTACIÓN DE FILAS REPRESENTACIÓN DE COLUMNAS SE TRATA DE DOS SUBESPACIOS DE MISMA NATURALEZA REGLAS DE TRANSICIÓN
Análisis Factorial de Correspondencias EFECTO DE LAS REGLAS DE TRANSICIÓN: Espacio de filas Espacio de columnas REPRESENTACIÓN BIPLOT
Análisis Factorial de Correspondencias EL REFERENCIAL: IMPORTANTE: A una tabla de contingencia se asocian dos referenciales. Uno se obtiene cuando perfiles fila son entendidos como individuos (y perfiles columna como variables) y la otra cuando perfiles columna son entendidos como individuos (y perfiles fila como variables). No obstante esto, se puede demostrar que ambos procesos de diagonalización producen la misma descomposición de la inercia, y que los espacios resultantes se encuentran fuertemente relacionados entre sí, por medio de las llamadas relaciones pseudobaricéntricas. Estas relaciones permiten, en definitiva, superponer los dos espacios obtenidos. En cada uno de los espacios se representan distancias Ji–cuadrado.
Análisis Factorial de Correspondencias REGLAS DE LECTURA E INTERPRETACIÓN: CALIDAD DE REPRESENTACIÓN CONTRIBUCIONES DISTANCIA AL ORIGEN Perfiles bien representados se observan siempre alejados del origen del sistema.
Sugerencias Bibliográficas Daniel W.: Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill. Mexico, 19997. Canavos G.: Probabilidad y Estadística. Aplicaciones y métodos. Mc Graw Hill. México, 1995. Hernández–Fernández–Baptista: Metodología de la Investigación. Mc Graw Hill. México, 1998.