La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

U UNIVERSIDAD DE QUINTANA ROO

Presentaciones similares


Presentación del tema: "U UNIVERSIDAD DE QUINTANA ROO"— Transcripción de la presentación:

1 U UNIVERSIDAD DE QUINTANA ROO
Análisis de Conglomerados jerárquicos (prácticas con SPSS) por: Hernandez ramos citlali Campos couoh yeraldin

2 Conglomerados El análisis clúster es un conjunto de técnicas multivariantes cuyo objetivo es agrupar objetos o individuos basándose en las características que estos poseen. El Análisis Clúster clasificara a los objetos, de tal forma que cada objeto será muy parecido a los que hay en su grupo. Los grupos resultantes deben mostrar mucha homogeneidad entre los elementos del grupo y un alto grado de heterogeneidad entre los diferentes grupos. A estos grupos se les denomina clúster.

3 Es la distancia entre la variable X1 y la X2.
DISTANCIA EUCLÍDEA Es la diferencia entre la distancia de los valores de las variables. A B C DISTANCIA MINKOWSKY Es la distancia entre la variable X1 y la X2. X X2 OBSERVACIÓN trabaja tiene hijos OBSERVACIÓN no trabaja tienen hijos OBSERVACIÓN trabaja no tiene hijos

4 Medidas de proximidad AÑOS OBSERVACIÓN 1 20 (20-21)= 1
OBSERVACIÓN (21-21)= años OBSERVACIÓN (22-21)=1 media 21 años

5 CONGLOMERADOS JERÁRQUICOS
Existen dos grandes grupos de técnicas de análisis clúster, que son los métodos jerárquicos y no jerárquicos. Métodos jerárquicos: son aquellos que para formar un clúster nuevo une o separa alguno ya existente para dar origen a otros dos de forma que se maximice una similaridad o se minimice una distancia. Por ejemplo: Empresas respecto a la tecnología EMPRESAS CON ALTA TECNOLOGÍA EMPRESAS CON TECNOLOGÍA INTERMEDIA EMPRESAS CON BAJA TECNOLOGÍA

6 1. Asociativos o aglomerativos: se parte de tantos grupos como individuos y se van agrupando hasta llegar a tener todos los individuos en un solo grupo. 2. Disociativos o Divisivos: se parte de un solo grupo que contenga a todos los individuos y se va separando hasta llegar a formar grupos individuales.

7 EJEMPLO: AGLOMERATIVOS

8 Conglomerados jerárquicos en spss

9 Conglomerados jerárquicos
En segundo lugar seleccionamos Conglomerados jerárquicos y accedemos al siguiente cuadro: El cuadro contiene: la lista de variables del archivo. De esta lista seleccionamos aquellas sobre las que deseemos evaluar el parecido de los sujetos. En nuestro caso son las correspondientes a las subescalas del WISC-R. Una vez seleccionadas las variables las trasladamos al cuadro Variables. Existe la posibilidad de agrupar (Conglomerar) casos, este es el uso más frecuente del análisis de conglomerados, o de agrupar variables y el resultado sería el equivalente a un análisis factorial. Además disponemos de una serie de botones que nos permiten acceder a las diferente opciones implementadas en SPSS. En las transparencias siguientes comentaremos las opciones de los cuadros: Estadísticos, Gráficos, Método y Guardar en este orden.

10 Conglomerados jerárquicos
Cuadro Estadísticos: En este cuadro podemos solicitar: además del Historial de conglomeración que lo proporciona por defecto si tenemos seleccionada la opción Estadísticos dell cuadro Análisis de conglomerados jerárquico, la Matriz de distancias. Podemos pedir que nos proporcione una tabla con el conglomerado de pertenencia de cada sujeto si nos decidimos por una solución en un número de conglomerados determinado o en un rango. Estas opciones son muy útiles cuando tenemos claro el número de conglomerados que constituye la solución a nuestro problema de investigación. No obstante lo más importante no es visualizar la tabla crear una variable en el archivo de datos con valores que indican el conglomerado al que pertenece el sujeto esto podemos hacerlo con las opciones del cuadro Guardar variables nuevas.

11 Conglomerados jerárquicos
Cuadro Método: En este cuadro podemos seleccionar entre una larga lista de métodos de conglomeración: vinculación inter-grupo (método de la media), vinculación intra-grupos (distancia media entre las distancias de los elementos del grupo unión), vecino más próximo (mínimo), vecino más lejano (máximo), agrupación de centroides (distancia entre centroides), agrupación de medianas (media de centroides) y Método de Ward (minimiza la varianza intragrupo). En principio convendría explorar con distintos métodos hasta encontrar la solucción más satisfactoria. El método de Ward sólo puede aplicarse a variables cuantitativas. Seleccionar la medida de distancia adecuada a la métrica de las variables. Podemos optar por calcular las distancias entre los sujetos a partir de puntuaciones estandarizadas con las opciones del cuadro Transformar valores. Se recomienda estandarizar cuando las variables están medidas en escalas distintas. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

12 Conglomerados jerárquicos
Cuadro Guardar variables nuevas: Este cuadro nos permite crear nuevas variables en el archivo de datos con el grupo de pertenencia de cada sujeto. Podemos crear una única variable correspondiente a una Solución única en K conglomerados. Esta variable toma valores desde 1 hasta K e indica el grupo al que pertenece el sujeto. Si seleccionamos un Rango de soluciones crea una variable para cada una de las soluciones desde Número mínimo de conglomerados hasta Número máximo de conglomerados. Por ejemplos si en Número mínimo de conglomerados escribimos 2 y en Número máximo 4 creará 3 variables: una para la solución en dos conglomerados, otras para la solución en tres conglomerados y la última para la solución en cuatro conglomerados. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

13 dendograma Es una representación gráfica o diagrama de datos en forma de árbol, que organiza los datos en subcategorias que se van divididiendo en otros hasta llegar al nivel de detalle deseado.


Descargar ppt "U UNIVERSIDAD DE QUINTANA ROO"

Presentaciones similares


Anuncios Google