Master en Recursos Humanos

Slides:



Advertisements
Presentaciones similares
ANÁLISIS DE CONGLOMERADOS
Advertisements

Tema 13. Inferencia estadística Principales conceptos. Muestreo
Tema 19: Contraste no paramétrico de hipótesis: Conceptos básicos
U UNIVERSIDAD DE QUINTANA ROO
Introducción En toda investigación, y antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis.
Cluster.
TABLAS EN WORD.
GRÁFICOS EN SPSS UTILIDADES Y PROCEDIMIENTO DE CREACIÓN
Estimación de los Errores de Muestreo Encuestas de Salud Reproductiva   RHS Usando SPSS 19.
UNIVERSIDAD TECNICA DE AMBATO
FRANCISCO JAVIER RODRÍGUEZ
ANALISIS DE COMPONENTES PRINCIPALES.
ANALISIS DE CONGLOMERADOS
Baremos del Test de Dominos
MÉTODOS DE INVESTIGACIÓN
Metodología De las Ciencias Sociales III
Optimización de sistemas de trading
TUTORIAL SPSS Comparación de medias con el Paquete Estadístico para las Ciencias Sociales Unidad 4.
ESTADISTICA PARA RELACIONES LABORALES
Introducción al Análisis Cluster
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
INFOMATICA EMPRESARIAL Principales Contenidos: Clase 26 de Mayo de 2012 Alejandra Meliza Caro Profesor.
Población y Muestra.
Estadística aplicada al análisis financiero
UNIDAD 2:Crear, abrir y cerrar una base de datos Hacer clic sobre la opción Nuevo de la pestaña Archivo. Se mostrarán las distintas opciones para nuevos.
ANÁLISIS DE CONGLOMERADOS
CATEDRÁTICO: ARIEL GUTIÉRREZ VALENCIA MATERIA: HERRAMIENTAS INFORMATICAS DE APOYO A LA INVESTIGACIÓN CUANTITATIVA POR: MARÍA GRISELDA IZQUIERDO MARTÍNEZ.
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Mt. Martín Moreyra Navarrete.
Geo procesos.
ANÁLISIS DE CONGLOMERADOS
Estadística Descriptiva continuación
Investigación Experimental
Análisis de Agrupamientos y Componentes Principales
Seminario de TesisUnidad I. Marco Metodológico“Estadística Descriptiva” Dr. Javier Moreno Tapia.
Manejo de datos en el Paquete Estadístico para las Ciencias Sociales
TUTORIAL SPSS Análisis descriptivos con el Paquete Estadístico para las Ciencias Sociales Unidad 3.
ESTADÍSTICAS DESCRIPTIVA
Medidas de Variabilidad
3. Análisis de Correspondencias Simples
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
ANÁLISIS DE LOS DATOS LOS 10 PASOS DE LA INVESTIGACIÓN
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
Martín Enrique Guerra Cáceres ESTADÍSTICA APLICADA A LA INVESTIGACIÓN II MAESTRÍA EN DOCENCIA E INVESTIGACION EDUCATIVA.
Investigación cualitativa y cuantitativa
TIPOS DE INVESTIGACION CUANTITATIVA Y CUALITATIVA
Titular: Agustín Salvia
SAUL QUEVEDO ANA MARIA RANGEL PRISCILA EGAS
TIPOS DE INVESTIGACIÓN CUANTITATIVA Y CUALITATIVA
Análisis de los Datos Cuantitativos
EXCEL 14 CLASE 14.
Graficas en la pantalla 2D. Generalidades Para visualizar la gráfica correspondiente a una función de una variable o una ecuación de dos variables se.
TRATAMIENTO DE DATOS CON SPSS MATERIA: INFORMÁTICA APLICADA A LA PSICOLOGÍA ALUMNA: ELMA AZUCENA MONROY AXLE.
Septiembre 2009 Mtra. Laura Myriam Franco Sánchez.
MUESTREO : Generalidades
INTRODUCCIÓN A SPSS Statistic Package for Social Sciencies.
DATOS ESTADÍSTICOS.
Estadística descriptiva
Por: Agustín Audor Julian Tole
Para cada uno de los atributos, indicaremos su campo de descripción. Cuando un campo no dispone de este (como el.
Estadística descriptiva
Análisis de datos: La ordenación de datos. ● En el análisis de datos se define la información recogida ● Se deben seleccionar las propiedades que se han.
METODO DE MAXIMA PENDIENTE
Estadística y probabilidad
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia METODOS ALEATORIOS.
Master en Recursos Humanos Análisis de Conglomerados (Cluster Analysis): prácticas con SPSS Ana María López Área de Metodología de las Ciencias del Comportamiento.
Transcripción de la presentación:

Master en Recursos Humanos Análisis de Conglomerados (Cluster Analysis): prácticas con SPSS Ana María López Área de Metodología de las Ciencias del Comportamiento Departamento de Psicología Experimental

Conglomerados jerárquicos El objetivo es agrupar a los sujetos en función de su parecido en las subescalas del WISC-R. dado que todas las variables son cuantitativas utilizaremos como medida de disimilaridad la distancia euclídea y como procedimiento de agregación los métodos de la media, mínimo y máximo. La matriz con la que vamos a trabajar es: datos1. Para ejecutar un análisis de conglomerados con SPSS en primer lugar hay que seleccionar el menú Analizar como muestra el siguiente cuadro:

Conglomerados jerárquicos En segundo lugar seleccionamos Conglomerados jerárquicos y accedemos al siguiente cuadro: El cuadro contiene: la lista de variables del archivo. De esta lista seleccionamos aquellas sobre las que deseemos evaluar el parecido de los sujetos. En nuestro caso son las correspondientes a las subescalas del WISC-R. Una vez seleccionadas las variables las trasladamos al cuadro Variables. Existe la posibilidad de agrupar (Conglomerar) casos, este es el uso más frecuente del análisis de conglomerados, o de agrupar variables y el resultado sería el equivalente a un análisis factorial. Además disponemos de una serie de botones que nos permiten acceder a las diferente opciones implementadas en SPSS. En las transparencias siguientes comentaremos las opciones de los cuadros: Estadísticos, Gráficos, Método y Guardar en este orden.

Conglomerados jerárquicos Cuadro Estadísticos: En este cuadro podemos solicitar: además del Historial de conglomeración que lo proporciona por defecto si tenemos seleccionada la opción Estadísticos dell cuadro Análisis de conglomerados jerárquico, la Matriz de distancias. Podemos pedir que nos proporcione una tabla con el conglomerado de pertenencia de cada sujeto si nos decidimos por una solución en un número de conglomerados determinado o en un rango. Estas opciones son muy útiles cuando tenemos claro el número de conglomerados que constituye la solución a nuestro problema de investigación. No obstante lo más importante no es visualizar la tabla crear una variable en el archivo de datos con valores que indican el conglomerado al que pertenece el sujeto esto podemos hacerlo con las opciones del cuadro Guardar variables nuevas.

Conglomerados jerárquicos Cuadro Método: En este cuadro podemos seleccionar entre una larga lista de métodos de conglomeración: vinculación inter-grupo (método de la media), vinculación intra-grupos (distancia media entre las distancias de los elementos del grupo unión), vecino más próximo (mínimo), vecino más lejano (máximo), agrupación de centroides (distancia entre centroides), agrupación de medianas (media de centroides) y Método de Ward (minimiza la varianza intragrupo). En principio convendría explorar con distintos métodos hasta encontrar la solucción más satisfactoria. El método de Ward sólo puede aplicarse a variables cuantitativas. Seleccionar la medida de distancia adecuada a la métrica de las variables. Podemos optar por calcular las distancias entre los sujetos a partir de puntuaciones estandarizadas con las opciones del cuadro Transformar valores. Se recomienda estandarizar cuando las variables están medidas en escalas distintas. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Conglomerados jerárquicos Cuadro Guardar variables nuevas: Este cuadro nos permite crear nuevas variables en el archivo de datos con el grupo de pertenencia de cada sujeto. Podemos crear una única variable correspondiente a una Solución única en K conglomerados. Esta variable toma valores desde 1 hasta K e indica el grupo al que pertenece el sujeto. Si seleccionamos un Rango de soluciones crea una variable para cada una de las soluciones desde Número mínimo de conglomerados hasta Número máximo de conglomerados. Por ejemplos si en Número mínimo de conglomerados escribimos 2 y en Número máximo 4 creará 3 variables: una para la solución en dos conglomerados, otras para la solución en tres conglomerados y la última para la solución en cuatro conglomerados. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Resultados Conglomerados jerárquicos Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine

Vinculación simple (método del mínimo) Dendrogram using Single Linkage Rescaled Distance Cluster Combine

Vinculación completa (método del máximo)

Vinculación completa (método del máximo)

Vinculación completa (método del máximo)

Vinculación completa (método del máximo)

Resultados: Si a partir del dendograma anterior, en el cuadro Guardar variables nuevas, seleccionamos Rango de soluciones y en Número mínimo de conglomerados escribimos 2 y en Número máximo de conglomerados escribimos 4 se crean tres nuevas variables en el editor de datos que clasifican a los sujetos en función del cluster al que pertenecen para cada una de las soluciones en dos, tres y cuatro conglomerados. Las nuevas variables se denominan: CLU4_1, CLU3_1 y CLU2_1 como podemos observar en la porción del editor de datos siguiente. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Resultados: Tabla de frecuencia La interpretación de los conglomerados depende del valor medio de las variables en cada uno de ellos. Es decir, para caracterizar a cada clase y diferenciarla de las demás vamos a obtener el centroide de cada una de ellas y vamos a realizar un gráfico de lineas. Vamos también a realizar una análisis de frecuencias para saber el número de sujetos de cada cluster y para cada solución. Tabla de frecuencia Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Resultados: Perfil de medias de cada solución Tablas personalizadas Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media Los gráficos de perfiles obtenerlos del archivo: perfiles

Resultados: Perfil de medias de cada solución Tablas personalizadas Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Resultados: Perfil de medias de cada solución Tablas personalizadas Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Conglomerados de k medias Con la misma matriz y variables con las que hemos realizado el análisis de conglomerados jerárquico vamos a realizar un análisis de conglomerados de k-medias. Ahora del menú Clasificar seleccionamos Conglomerado de K medias

Conglomerados de k medias El cuadro contiene: la lista de variables del archivo. De esta lista seleccionamos aquellas sobre las que deseemos evaluar el parecido de los sujetos. En nuestro caso son las correspondientes a las subescalas del WISC-R. Una vez seleccionadas las variables las trasladamos al cuadro Variables. Por defecto el Nº de conglomerados en que divide a los sujetos es 2 pero podemos segmentar la muestra en un número mayor de clases. Sólo tenemos que sustituir el 2 por otro número. Sabemos que la primera partición la inducen un número de sujetos igual al número de conglomerados elegidos mediante diferentes procedimientos. Por defecto SPSS elige a los dos sujetos más distantes. Podemos no obstante escribir en un archivo los centros de los conglomerados que dan lugar a la primera partición marcando en Leer iniciales. También podemos escribir en un archivo los centros de los conglomerados finales seleccionando Escribir finales.

Conglomerados de k medias Si pulsamos en los botones Guardar del cuadro anterior obtenemos podemos crear una nueva variable en el editor de datos de manera que asigne a cada sujeto un valor que identifica el conglomerado al que pertenece. : Si pulsamos en el botón Opciones podemos seleccionar una Tabla de ANOVA con la única utilidad de identificar a las variables que desde un punto de vista descriptivo discriminan entre los conglomerados. Las inferencias a partir de estos resultados de ANOVA serían incorrectas. :

Resultados: Análisis de conglomerados de K medias

Resultados: Análisis de conglomerados de K medias

Resultados:

Conglomerados en dos etapas Dado que en la matriz además de las variables de la evaluación intelectual disponemos de otras variables de naturaleza cualitativa tales como la presencia de ansiedad, válvulas, retrasos en el desarrollo, etc. Vamos a realizar un análisis de conglomerados en dos fases. Para ello elegimos Conglomerado en dos fases…

Conglomerados en dos etapas A diferencia del resto de los procedimientos aquí disponemos de dos cuadros: en uno insertamos las variables cualitativas y en el otro las cuantitativas.

Conglomerados en dos etapas Como en el resto de los cuadros de diálogo si pinchamos en el botón Gráficos podemos seleccionar dos tipos de gráficos que nos ayudarán a interpretar el perfil de los conglomerados tanto en las variables cualitativas como cuantitativas.

Conglomerados en dos etapas Pulsando en el botón Resultados podemos Estadísticos Descriptivos por conglomerado y Frecuencias de los conglomerados.

Resultados: Conglomerados en dos fases Perfiles de los conglomerados El cambio en BIC más pequeño es el que se utiliza para decidir la solución en dos conglomerados.

Resultados: Frecuencias

Resultados: Importancia de los atributos

Resultados: Importancia de los atributos

Resultados: Variación intra-conglomerado

Resultados: Importancia según agrupación

Resultados:

Resultados:

Resultados: