5. Análisis Cluster Etapas:

Slides:



Advertisements
Presentaciones similares
¿ Que es una muestra?.
Advertisements

Curso: Seminario de estadística Aplicada a la investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio.
ANÁLISIS DE CONGLOMERADOS
P3. Tests y escalas: Uso profesional
Tema 4: Medidas de posición individual.
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Funciones lógicas y su simplificación
ELASTICIDAD Y RESISTENCIA DE MATERIALES
Agrupación de datos cuantitativos definiciones básicas y otras explicaciones.
U UNIVERSIDAD DE QUINTANA ROO
METODOS CUALITATIVOS DE RECOLECCION DE DATOS
Cluster.
UNIDAD III: Semana No. 23 MARCO METODOLÓGICO
Guía práctica para el diseño de proyectos sociales
Master en Recursos Humanos
DESCRIPCION DE SISTEMAS
4. Análisis de Correspondencias Múltiples
Arreglos (IV): Arreglos multidimensionales
SEGMENTACION DE MERCADOS
FRANCISCO JAVIER RODRÍGUEZ
ANALISIS DE COMPONENTES PRINCIPALES.
ANALISIS DE CONGLOMERADOS
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
UNIVERSIDAD ESTATAL DE MILAGRO Curso de Nivelación y Admisión 2012
Taller 2. Medición de distancia entre variables y sujetos
Agrupación de datos cualitativos Discusión de definiciones básicas, procedimiento y utilidad.
Metodología De las Ciencias Sociales III
PROBABILIDAD Y ESTADÍSTICA PARA CEA MTRA. MA. DEL CARMEN LÓPEZ MUNIVE
ANÁLISIS DISCRIMINANTE Conjunto de técnicas multivariantes de clasificación que ante un conjunto de datos derivados de una muestra de entidades, tratan.
QUÍMICA ANALÍTICA I FUNDAMENTO DE QUÍMICA ANALÍTICA
Recursos humanos y responsabilidad social corporativa
Medidas de Dispersión Estadística E.S.O.
Modelo de partícula en la superficie de una esfera
Estrategias de comprensión lectora
OBJETIVOS MULTIPLES EXPERT CHOICE Teoría de la Decisión
Introducción al Análisis Cluster
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
Estadística Administrativa I
UNIVERSIDAD NACIONAL DEL SANTA
METODOLOGÍA DE LA INVESTIGACIÓN
Población y Muestra.
Estadística aplicada al análisis financiero
ANÁLISIS DE CONGLOMERADOS
CAMBIOS Y SECUENCIAS MUCHOS OBJETOS, SUCESOS Y PROCESOS QUE OBSERVAMOS CAMBIAN O EVOLUCIONAN EN EL TRANSCURSO DEL TIEMPO. PARA COMPRENDER LOS CAMBIOS HAY.
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Mt. Martín Moreyra Navarrete.
ANÁLISIS DE CONGLOMERADOS
Análisis de Conglomerados (Cluster Analysis)
ESTADÍSTICA DESCRIPTIVA
3. Análisis de Correspondencias Simples
La Investigación científica
Dr. D. Ángel M. Ramos Domínguez Director-Profesor del Curso
Análisis de los datos.
Análisis de componentes principales
Investigación cualitativa y cuantitativa
TIPOS DE INVESTIGACION CUANTITATIVA Y CUALITATIVA
SAUL QUEVEDO ANA MARIA RANGEL PRISCILA EGAS
Apuntes de Matemáticas 3º ESO
ESTADÍSTICA: VARIABLES
TIPOS DE INVESTIGACIÓN CUANTITATIVA Y CUALITATIVA
ANÁLISIS ESTADÍSTICO MULTIVARIANTE CON SPSS
Septiembre 2009 Mtra. Laura Myriam Franco Sánchez.
SENA REGIONAL HUILA Huila.
Diagrama de Tallos Y Hojas
Diagrama de Tallos Y Hojas
Un Método Cuantitativo podría definirse como aquellos modelos matemáticos puesto al servicio de los procesos de resolución de problemas de un modo racional.
Capitulo 1 Análisis descriptivo
Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia DISEÑOS MUESTRALES DE USO FRECUENTE.
Estadística y probabilidad
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

5. Análisis Cluster Etapas: Conjunto de técnicas multivariantes de clasificación que ante un conjunto de datos derivados de una muestra de entidades, tratan de reorganizarlas en clases, tipos o grupos, internamente los más homogéneos posible y heterogéneos entre sí. Etapas: Elección de las entidades (objetos, variables, individuos, etc..) que se van a clasificar. Elección de las características que permiten la definición de las entidades y sobre las que se basará la clasificación final. Elección de una medida que defina la proximidad entre entidades. Selección de un método de clasificación. Interpretación de los grupos resultantes.

Método Objetivo: condiciona en buena medida los criterios empleados en la agrupación, por lo que no existe una metodología cluster única. Describiremos aquí la clasificación jerárquica que es la más utilizada. Puede aplicarse a variables cuantitativas o cualitativas. Procedimiento de agrupamiento: Formar los conglomerados en distintas etapas. Representación gráfica: Dendograma. Medida de homogeneidad entre dos elementos, viene dada por la distancia entre ellos. Hemos utilizado la distancia euclídea, ya que trabajaremos con valores y no con frecuencias:

MATRIZ DE CASOS ROTADOS Caso: Resultados de la rotación varimax en el ACP para el posicionamiento de turistas en Tenerife MATRIZ DE CASOS ROTADOS Nacionalidad F1 F2 Alemana 0,293 0,280 Austriaca -0,471 -0,512 Belga -0,294 -0,226 Británica 0,008 -0,692 Española -0,252 0,640 Europa excomunista -0,775 -0,520 Finlandesa 3,467 -0,580 Francesa -0,036 0,510 Holandesa -0,691 -1,370 Italiana -0,449 0,281 Resto América -0,454 -2,142 Resto Europa -0,112 0,769 Resto mundo -0,123 1,430 Sueca -0,067 1,515 Suiza -0,044 0,616 El objetivo es clasificar a las distintas nacionalidades de turistas de la muestra en grupos homogéneos, en función de las dos nuevas variables creadas en el Análisis de Componentes Principales. Los resultados obtenidos fueron:

Clasificación jerárquica Procedimiento de clasificación: Análisis cluster jerárquico. Identifica grupos relativamente homogéneos de casos (o de variables) basándose en las características seleccionadas, mediante un algoritmo que comienza con cada caso (o variable) en un conglomerado diferente y combina los conglomerados hasta que sólo queda uno. Es posible analizar las variables brutas o elegir de entre una variedad de transformaciones de estandarización. Medidas de distancia o similitud: Proximidades. Los estadísticos se muestran en cada etapa para ayudar a seleccionar la mejor solución. Propósito: Unir los objetos (nacionalidades) en clusters sucesivamente más grandes, usando una cierta medida de semejanza o de distancia. Un resultado típico de este tipo de agrupación es el árbol jerárquico. Método: Transformación de matriz de datos originales en matriz de distancias euclídeas. 1ª etapa: agrupar los elementos con distancias más pequeñas. A continuación, atender a la menor de las distancias entre cada elemento agrupado con anterioridad y los que quedan en conglomerados individuales. El procedimiento continuará hasta llegar a alcanzar el número de conglomerados que se hayan fijado con anterioridad.

Ventanas de SPSS Analizar Clasificar Conglomerados jerárquicos

Resultados: Matriz distancias euclídeas al cuadrado Casos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1:Alemana 0,000 1,211 0,601 1,027 0,426 1,781 10,813 0,161 3,693 0,550 6,427 0,403 1,495 1,654 0,227 2:Austriaca 0,113 0,262 1,374 0,093 15,510 1,233 0,785 0,630 2,658 1,769 3,892 4,270 1,454 3:Belga 0,309 0,750 0,318 14,272 0,607 1,467 0,281 3,699 1,022 2,770 3,081 0,771 4:Británica 1,841 0,643 11,977 1,446 0,949 1,156 2,317 2,149 4,520 4,875 1,713 5:Española 1,618 15,317 0,064 4,231 0,167 7,779 0,036 0,641 0,800 0,044 6:Eur. Exc. 17,998 1,606 0,730 0,748 2,735 2,100 4,226 4,640 1,823 7:Finlandesa 13,454 17,918 16,075 17,818 14,632 16,929 16,877 13,759 8:Francesa 3,962 0,223 7,207 0,073 0,855 1,012 0,011 9:Holandesa 2,786 0,653 4,910 8,162 8,711 4,362 10:Italiana 5,874 0,351 1,425 1,667 0,275 11:R.América 8,592 12,870 13,523 7,775 12:R.Europa 0,437 0,558 0,028 13:R.mundo 0,010 0,669 14:Sueca 0,809 15:Suiza Están resaltados en negrilla, las distancias más pequeñas como son la existente entre la nacionalidad sueca y resto del mundo con una distancia de 0.010, francesa y suiza con una distancia de 0.011 y suiza y resto de Europa con una distancia euclídea al cuadrado de 0.028 y española y resto de Europa con una distancia de 0.036.

Resultados: Historial de conglomeración

Diagrama de Témpanos

Resultados: Dendograma

CONCLUSIONES Cluster 1: Resto del Mundo, suecos, franceses, suizos, españoles, resto de Europa, italianos y Alemanes. Cluster 2: Austriacos, Europa excomunista, belgas, británicos, holandeses y resto de América. Cluster 3: Finlandeses.