4. Análisis de Correspondencias Múltiples

Slides:



Advertisements
Presentaciones similares
Análisis de Correspondencia
Advertisements

ANALISIS PARAMÉTRICOS
Tema 6: Regresión lineal.
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Medidas de Posición Central:
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
DESCRIPCION DE SISTEMAS
Estadística Administrativa I
UNIVERSIDAD TECNICA DE AMBATO
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
Taller 2. Medición de distancia entre variables y sujetos
Estadística Descriptiva
Regresión y correlación
MATEMÁTICAS 2º ESO UD8 ESTADÍSTICA.
UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA CENTRO DE INVESTIGACIONES PSICOLÓGICAS.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
El Informe Estadístico
Distribuciones de frecuencias bidimensionales
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Estadística bidimensional
Facultad: Turismo Y Hotelería
Análisis no paramétricos
Distribuciones bidimensionales. Tablas de contingencia
DETERMINANTES Autora: Mª Soledad Vega Fernández
Biograma Introducir datos en una matriz. Elegir método para máximos y mínimos. Calcular los máximos y mínimos observados. Límites.
ANALISIS DE DATOS CON EXCEL
ELEMENTOS DE ESTADÍSTICA BIVARIANTE
METODOLOGÍA ANÁLISIS DE DATOS PROPUESTA DE IMPLANTACIÓN DE UN OBSERVATORIO ECONÓMICO DE LA PYME Grupo de Investigación Análisis Estratégico para el Desarrollo.
Mt. Martín Moreyra Navarrete.
Caso: Situación de las Comunidades Autónomas españolasen cuanto a indicadores de bienestar En el periódico “El País” del día 17 de enero de 2002 se publicó.
Los datos que se dan a continuación corresponden a los pesos en Kg
Análisis de Datos.
ESTADÍSTICAS DESCRIPTIVA
3. Análisis de Correspondencias Simples
Medidas de Posición y Centralización Estadística E.S.O.
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
ESTADÍSTICA BIDIMENSIONAL
Herramientas básicas.
1. Actualmente el marco general en el que una organización lleva a cabo su actividad se caracteriza por una alta dinamicidad y cambios permanentes. Ante.
MoMento S Grupo 33: Ignacio Ayllón Benito Félix A. Velázquez Salas.
Análisis de correspondencia canónica (CCA)
Dr. D. Ángel M. Ramos Domínguez Director-Profesor del Curso
Capítulo 1. Conceptos básicos de la Estadística
Introducción Estadística ¿Qué es la estadística?
coeficientes de correlación de
Análisis de los Datos Cuantitativos
Herramientas de Mejora de la Calidad
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Distribución de frecuencias y gráficos
MEDIDAS DE TENDENCIA CENTRAL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Matrices Pág. 1. Matrices Pág. 2 Se llama matriz traspuesta de A, y se representa por A t a la matriz que resulta de intercambiar las filas y las columnas.
Seminario 5  1 tablas de frecuencia  2 ejercicio 1  3 ejercicio 2  4 ejercicio 3.
Tabla de frecuencia Estándar: Interpreto datos de información
TEMA 3: Estadística Bidimensional.
TEMA 3: Estadística Bidimensoional.
Por: Agustín Audor Julian Tole
Coeficiente de variación
Capitulo 1 Análisis descriptivo
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Estadística descriptiva
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión.
Medidas de tendencia central
Análisis de datos: La ordenación de datos. ● En el análisis de datos se define la información recogida ● Se deben seleccionar las propiedades que se han.
Estadística y probabilidad
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
PRUEBA DE SIGNIFICANCIA
Transcripción de la presentación:

4. Análisis de Correspondencias Múltiples Generalización del ACS. Permite describir grandes tablas binarias, referidas por ejemplo a ficheros de encuestas socio-económicas. Líneas: individuos u observaciones. Columnas: Modalidades de variables nominales. El ACM es un Análisis de Correspondencias Simple aplicado, no a tablas de contingencia sino a una tabla disyuntiva completa Z, en la que para cada modalidad de cada variable hay sólo dos valores posibles: 0 = el encuestado no contesta esa modalidad. 1= es la respuesta elegida por él. Las propiedades de Z son interesantes y los procedimientos de cálculo y sus reglas de interpretación de las representaciones obtenidas son simples y específicas. La mayoría de los ficheros de encuestas presentan las respuestas a las preguntas bajo la forma de una tabla disyuntiva completa.

La tabla disyuntiva completa La forma de la matriz Z (Tabla disyuntiva completa) será: Las frecuencias marginales de las líneas de la tabla disyuntiva completa son iguales al número de preguntas, s, y las frecuencias marginales de las columnas corresponden al número de sujetos que han elegido la modalidad j de la pregunta q, por lo que para cada subtabla, el número total de individuos es n. En consecuencia, si para n individuos se dispone de respuestas respecto a, por ejemplo, dos variables nominales que tienen respectivamente p1 y p2 modalidades, entonces es equivalente someter a un Análisis de Correspondencias Simples la tabla de contingencia (p1, p2) y analizar la tabla binaria de n líneas y (p1 + p2) columnas que describe las respuestas. p Si hay alguna variable continua, debe transformarse en nominal, ordenándose en intervalos a los que se da un rango de valores.

La tabla de Burt A partir de la tabla disyuntiva completa se puede construir la tabla de contingencia de Burt, B, que es una tabla simétrica de orden (p, p): B = Z´Z B es una yuxtaposición de tablas de contingencia y está formada de s2 bloques de la forma: B = Z´Z = Cada bloque es una submatriz formada por tablas de contingencia de las variables dos a dos, salvo los bloques que se están en la diagonal que son las tablas de contingencia de cada variable consigo misma. p1 p2 ps p1 p2 ps p p

Principios del análisis de correspondencias múltiples Es el análisis de correspondencias de una tabla disyuntiva completa, estudiándose la nube de los individuos y la nube de las modalidades. Sus principios son, por tanto, los del análisis de correspondencias: Iguales transformaciones de la tabla en los perfiles líneas y columnas Igual criterio de ajuste con ponderación de los puntos por sus frecuencias marginales Igual distancia, la chi-cuadrado Presenta propiedades particulares debido a la naturaleza misma de la tabla disyuntiva completa. La Tabla disyuntiva completa es equivalente a la tabla de Burt y ambos producen los mismos factores

Caso: Estudio de los turistas en función del lugar de residencia, sexo y alojamiento A partir de la base de datos referida a los turistas que vienen a Tenerife, se quiere estudiar la asociación existente entre el lugar donde residen en la isla, el sexo y el tipo de alojamiento en el que se quedan, con sus respectivas modalidades.

Con estas tres variables se ha construido la tabla de Burt. A partir de ella se ha creado una hoja de cálculo en spss (corres multiple turismo.sav).

Resultados Utilizaremos una tabla de Burt. Con ella se podrán obtener las puntuaciones (distancias al centro de gravedad), contribuciones absolutas de cada modalidad y variable a los ejes o factores obtenidos (contribución de cada modalidad o variable a la inercia de los nuevos ejes) y contribuciones relativas o correlaciones de cada modalidad con los nuevos ejes. El número de ejes considerado fue de 2. Como en la Tabla de Burt las filas y las columnas representan las mismas modalidades, el estudio de ambas ofrece iguales resultados, por lo que sólo presentaremos los de las filas. Para la resolución en el SPSS, en primer lugar hay que introducir los datos de la misma forma que en el análisis de correspondencias simples, creando por tanto tres variables. Las dos primeras corresponden a los rangos de todas las modalidades y, en la tercera, se incluirán las frecuencias conjuntas de los pares de modalidades, las cuales funcionarán como ponderaciones.

Los valores singulares, inercia, porcentajes de varianza explicada y sus acumulados fueron: Los valores singulares son los valores propios que se obtendrían si hubiéramos partido de una tabla disyuntiva completa, cuyo cuadrado es igual a la Inercia o valores propios resultantes de la matriz de Burt. En el Análisis de Correspondencias Múltiples, los porcentajes de varianza explicada suelen ser pequeños para cada eje y no se pueden explicar de igual forma que en el análisis de correspondencias simples.

Examen de los puntos Las distancias de las modalidades, mientras más alejadas se encuentren del origen, mejor representados estarán. Mientras más alejadas estén las modalidades entre sí en el gráfico menos asociación existirá entre ellas y cuanto más cercanas, más asociación existirá entre ellas. La contribución de los puntos a la inercia de cada dimensión o contribución de cada una de las filas a la inercia o varianza explicada en cada uno de los ejes considerados La contribución de las dimensiones a la inercia de cada punto. Se refiere a la correlación existente entre cada uno de los caracteres y los nuevos ejes. A continuación se presentan los resultados y el diagrama de dispersión de los dos ejes obtenidos.

Eje 1: Se contraponen los turistas que se quedan en el Puerto de la Cruz y que destacan por alojarse en hoteles de 1, 2 y 4*, todos ellos en el lado positivo, a los turistas que van al Sur y que se alojan en hoteles de 5*, aparthoteles de 4 y 5* y apartamentos de 1, 3, 4 y 5 llaves, todos ellos en el lado negativo. Las variables con mayor contribución absoluta a la inercia del eje 1 son Puerto de la Cruz, Sur y Hoteles de 4*. Las variables más correlacionadas con el eje 1 son Puerto Cruz, Sur y Hoteles de 4*. Eje 2: Sobresalen en el lado positivo los turistas mujeres, que se alojan en hoteles de 3*, apartamentos de dos llaves y Time sharing y propiedad, contraponiéndose a los turistas hombres que se alojan en hoteles de 1 y 2*, apartamentos de 1, 3, 4 y 5 llaves, todas ellas en el lado negativo. Las variables con mayor contribución absoluta a la inercia del eje 2 son: Hombres, mujeres y apartamentos de 2 llaves. Las variables más correlacionadas con el eje 2 son hombre y mujer. Por tanto, podemos decir que el eje 1 viene afectado por la variable lugar de residencia, mientras que en el eje 2 influye la variable sexo.

CONCLUSIONES En cuanto al lugar de residencia y al sexo de los turistas, éstos residen en el Puerto de La Cruz y en el Sur, independientemente del sexo. Las diferencias se encuentran en el tipo de alojamiento que utilizan. Así, en el Puerto de la Cruz se caracterizan los que se quedan en hoteles de 4*, frente al Sur, que se caracterizan por alojarse en aparthoteles de 4 y 5* y en hoteles de 5*.En cuanto al tipo de alojamiento por sexo, las mujeres se caracterizan por preferir especialmente los apartamentos de 2 llaves y el Time sharing y propiedad, frente a los hombres, que prefieren especialmente los apartamentos de 1, 3, 4 y 5 llaves. Nos referimos a que en esos tipos de alojamientos se diferencian hombres y mujeres o Puerto de la Cruz y Sur.