La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

5. Análisis Cluster Etapas:

Presentaciones similares


Presentación del tema: "5. Análisis Cluster Etapas:"— Transcripción de la presentación:

1 5. Análisis Cluster Etapas:
Conjunto de técnicas multivariantes de clasificación que ante un conjunto de datos derivados de una muestra de entidades, tratan de reorganizarlas en clases, tipos o grupos, internamente los más homogéneos posible y heterogéneos entre sí. Etapas: Elección de las entidades (objetos, variables, individuos, etc..) que se van a clasificar. Elección de las características que permiten la definición de las entidades y sobre las que se basará la clasificación final. Elección de una medida que defina la proximidad entre entidades. Selección de un método de clasificación. Interpretación de los grupos resultantes.

2 Método Objetivo: condiciona en buena medida los criterios empleados en la agrupación, por lo que no existe una metodología cluster única. Describiremos aquí la clasificación jerárquica que es la más utilizada. Puede aplicarse a variables cuantitativas o cualitativas. Procedimiento de agrupamiento: Formar los conglomerados en distintas etapas. Representación gráfica: Dendograma. Medida de homogeneidad entre dos elementos, viene dada por la distancia entre ellos. Hemos utilizado la distancia euclídea, ya que trabajaremos con valores y no con frecuencias:

3 MATRIZ DE CASOS ROTADOS
Caso: Resultados de la rotación varimax en el ACP para el posicionamiento de turistas en Tenerife MATRIZ DE CASOS ROTADOS Nacionalidad F1 F2 Alemana 0,293 0,280 Austriaca -0,471 -0,512 Belga -0,294 -0,226 Británica 0,008 -0,692 Española -0,252 0,640 Europa excomunista -0,775 -0,520 Finlandesa 3,467 -0,580 Francesa -0,036 0,510 Holandesa -0,691 -1,370 Italiana -0,449 0,281 Resto América -0,454 -2,142 Resto Europa -0,112 0,769 Resto mundo -0,123 1,430 Sueca -0,067 1,515 Suiza -0,044 0,616 El objetivo es clasificar a las distintas nacionalidades de turistas de la muestra en grupos homogéneos, en función de las dos nuevas variables creadas en el Análisis de Componentes Principales. Los resultados obtenidos fueron:

4 Clasificación jerárquica
Procedimiento de clasificación: Análisis cluster jerárquico. Identifica grupos relativamente homogéneos de casos (o de variables) basándose en las características seleccionadas, mediante un algoritmo que comienza con cada caso (o variable) en un conglomerado diferente y combina los conglomerados hasta que sólo queda uno. Es posible analizar las variables brutas o elegir de entre una variedad de transformaciones de estandarización. Medidas de distancia o similitud: Proximidades. Los estadísticos se muestran en cada etapa para ayudar a seleccionar la mejor solución. Propósito: Unir los objetos (nacionalidades) en clusters sucesivamente más grandes, usando una cierta medida de semejanza o de distancia. Un resultado típico de este tipo de agrupación es el árbol jerárquico. Método: Transformación de matriz de datos originales en matriz de distancias euclídeas. 1ª etapa: agrupar los elementos con distancias más pequeñas. A continuación, atender a la menor de las distancias entre cada elemento agrupado con anterioridad y los que quedan en conglomerados individuales. El procedimiento continuará hasta llegar a alcanzar el número de conglomerados que se hayan fijado con anterioridad.

5 Ventanas de SPSS Analizar Clasificar Conglomerados jerárquicos

6 Resultados: Matriz distancias euclídeas al cuadrado
Casos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1:Alemana 0,000 1,211 0,601 1,027 0,426 1,781 10,813 0,161 3,693 0,550 6,427 0,403 1,495 1,654 0,227 2:Austriaca 0,113 0,262 1,374 0,093 15,510 1,233 0,785 0,630 2,658 1,769 3,892 4,270 1,454 3:Belga 0,309 0,750 0,318 14,272 0,607 1,467 0,281 3,699 1,022 2,770 3,081 0,771 4:Británica 1,841 0,643 11,977 1,446 0,949 1,156 2,317 2,149 4,520 4,875 1,713 5:Española 1,618 15,317 0,064 4,231 0,167 7,779 0,036 0,641 0,800 0,044 6:Eur. Exc. 17,998 1,606 0,730 0,748 2,735 2,100 4,226 4,640 1,823 7:Finlandesa 13,454 17,918 16,075 17,818 14,632 16,929 16,877 13,759 8:Francesa 3,962 0,223 7,207 0,073 0,855 1,012 0,011 9:Holandesa 2,786 0,653 4,910 8,162 8,711 4,362 10:Italiana 5,874 0,351 1,425 1,667 0,275 11:R.América 8,592 12,870 13,523 7,775 12:R.Europa 0,437 0,558 0,028 13:R.mundo 0,010 0,669 14:Sueca 0,809 15:Suiza Están resaltados en negrilla, las distancias más pequeñas como son la existente entre la nacionalidad sueca y resto del mundo con una distancia de 0.010, francesa y suiza con una distancia de y suiza y resto de Europa con una distancia euclídea al cuadrado de y española y resto de Europa con una distancia de

7 Resultados: Historial de conglomeración

8 Diagrama de Témpanos

9 Resultados: Dendograma

10 CONCLUSIONES Cluster 1:
Resto del Mundo, suecos, franceses, suizos, españoles, resto de Europa, italianos y Alemanes. Cluster 2: Austriacos, Europa excomunista, belgas, británicos, holandeses y resto de América. Cluster 3: Finlandeses.


Descargar ppt "5. Análisis Cluster Etapas:"

Presentaciones similares


Anuncios Google