U UNIVERSIDAD DE QUINTANA ROO

Slides:



Advertisements
Presentaciones similares
ANÁLISIS DE CONGLOMERADOS
Advertisements

ANALISIS DE DATOS CUANTITATIVOS
VARIABLES Una de las etapas fundamentales de toda investigación es la identificación de variables, entendiendo como variable la medida de una característica.
Técnicas para el análisis de datos en el enfoque cuantitativo
Técnicas para el análisis de datos en el enfoque cuantitativo
Introducción En toda investigación, y antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis.
Cluster.
GRÁFICOS EN SPSS UTILIDADES Y PROCEDIMIENTO DE CREACIÓN
Master en Recursos Humanos
GUÍA DEL POSTULANTE Esta Guía le proporcionará ayuda para realizar de manera efectiva, postulaciones a Concursos de Alta Dirección Pública.
“Estadística Descriptiva”
FRANCISCO JAVIER RODRÍGUEZ
CATALINA AGUDELO, HAIDY PAOLA, JULIETH PINO
ANALISIS DE COMPONENTES PRINCIPALES.
ANALISIS DE CONGLOMERADOS
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
Taller 2. Medición de distancia entre variables y sujetos
Optimización de sistemas de trading
ANÁLISIS DISCRIMINANTE Conjunto de técnicas multivariantes de clasificación que ante un conjunto de datos derivados de una muestra de entidades, tratan.
Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002.
Envío de Informes Trimestrales de Dotación de Personal
TALLER TIPO IFCES Resuelve situaciones problema, a partir de la interpretación de preguntas tipo Icfes.
Medidas de Dispersión Estadística E.S.O.
UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA CENTRO DE INVESTIGACIONES PSICOLÓGICAS.
Introducción al Análisis Cluster
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Programa de Formación del CEDEX – 2007 Curso de TÉCNICAS ESTADÍSTICAS DE ANÁLISIS MULTIVARIANTE TÉCNICAS ESTADÍSTICAS DE ANÁLISIS MULTIVARIANTE Objetivo:
Búsqueda de Aproximaciones: Algoritmos
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
INFOMATICA EMPRESARIAL Principales Contenidos: Clase 26 de Mayo de 2012 Alejandra Meliza Caro Profesor.
ANALISIS DE DATOS CON EXCEL
Población y Muestra.
Estadística aplicada al análisis financiero
UNIDAD 2:Crear, abrir y cerrar una base de datos Hacer clic sobre la opción Nuevo de la pestaña Archivo. Se mostrarán las distintas opciones para nuevos.
ANÁLISIS DE CONGLOMERADOS
CATEDRÁTICO: ARIEL GUTIÉRREZ VALENCIA MATERIA: HERRAMIENTAS INFORMATICAS DE APOYO A LA INVESTIGACIÓN CUANTITATIVA POR: MARÍA GRISELDA IZQUIERDO MARTÍNEZ.
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Mt. Martín Moreyra Navarrete.
ANÁLISIS DE CONGLOMERADOS
Análisis de Conglomerados (Cluster Analysis)
Estadística Descriptiva continuación
Análisis de Agrupamientos y Componentes Principales
Seminario de TesisUnidad I. Marco Metodológico“Estadística Descriptiva” Dr. Javier Moreno Tapia.
TUTORIAL SPSS Análisis descriptivos con el Paquete Estadístico para las Ciencias Sociales Unidad 3.
Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002.
Estadística La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos,
1 DISTRIBUCION DEL EMPLEO EN PAISES EUROPEOS Se dispone de 26 observaciones de porcentajes de empleo en 9 sectores económicos. Cada observación corresponde.
3. Análisis de Correspondencias Simples
Tratamiento de datos y azar
Herramientas básicas.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
Jorge Galbiati1 INDICE DE PRODUCCION FISICA MENSUAL INDUSTRIA MANUFACTURERA, CHILE 2002 Se tienen datos de índices de la producción de la industria manufacturera.
TEMA IX.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Titular: Agustín Salvia
SAUL QUEVEDO ANA MARIA RANGEL PRISCILA EGAS
Métodos Cuantitativos
Análisis de los Datos Cuantitativos
Septiembre 2009 Mtra. Laura Myriam Franco Sánchez.
Distribución de frecuencias y gráficos
Febrero 2014 ORIENTACIONES PARA CARGUE DE LA EVALUACION DE DESEMPEÑO DOCENTE Y DIRECTIVO DOCENTE EN EL APLICATIVO HUMANO DE LA SED CHOCÓ.
SENA REGIONAL HUILA Huila.
¿Qué es la Estadística? Guayaquil, 20 de Octubre del 2015
ESTADÍSTICA DESCRIPTIVA
Estadística descriptiva
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
Para cada uno de los atributos, indicaremos su campo de descripción. Cuando un campo no dispone de este (como el.
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Master en Recursos Humanos Análisis de Conglomerados (Cluster Analysis): prácticas con SPSS Ana María López Área de Metodología de las Ciencias del Comportamiento.
Transcripción de la presentación:

U UNIVERSIDAD DE QUINTANA ROO Análisis de Conglomerados jerárquicos (prácticas con SPSS) por: Hernandez ramos citlali Campos couoh yeraldin

Conglomerados El análisis clúster es un conjunto de técnicas multivariantes cuyo objetivo es agrupar objetos o individuos basándose en las características que estos poseen. El Análisis Clúster clasificara a los objetos, de tal forma que cada objeto será muy parecido a los que hay en su grupo. Los grupos resultantes deben mostrar mucha homogeneidad entre los elementos del grupo y un alto grado de heterogeneidad entre los diferentes grupos. A estos grupos se les denomina clúster.

Es la distancia entre la variable X1 y la X2. DISTANCIA EUCLÍDEA Es la diferencia entre la distancia de los valores de las variables. A B C DISTANCIA MINKOWSKY Es la distancia entre la variable X1 y la X2. X1 X2 OBSERVACIÓN 1 trabaja tiene hijos OBSERVACIÓN 2 no trabaja tienen hijos OBSERVACIÓN 3 trabaja no tiene hijos

Medidas de proximidad AÑOS OBSERVACIÓN 1 20 (20-21)= 1 OBSERVACIÓN 2 21 (21-21)= 0 2 años OBSERVACIÓN 3 22 (22-21)=1 media 21 años

CONGLOMERADOS JERÁRQUICOS Existen dos grandes grupos de técnicas de análisis clúster, que son los métodos jerárquicos y no jerárquicos. Métodos jerárquicos: son aquellos que para formar un clúster nuevo une o separa alguno ya existente para dar origen a otros dos de forma que se maximice una similaridad o se minimice una distancia. Por ejemplo: Empresas respecto a la tecnología EMPRESAS CON ALTA TECNOLOGÍA EMPRESAS CON TECNOLOGÍA INTERMEDIA EMPRESAS CON BAJA TECNOLOGÍA

1. Asociativos o aglomerativos: se parte de tantos grupos como individuos y se van agrupando hasta llegar a tener todos los individuos en un solo grupo. 2. Disociativos o Divisivos: se parte de un solo grupo que contenga a todos los individuos y se va separando hasta llegar a formar grupos individuales.

EJEMPLO: AGLOMERATIVOS

Conglomerados jerárquicos en spss

Conglomerados jerárquicos En segundo lugar seleccionamos Conglomerados jerárquicos y accedemos al siguiente cuadro: El cuadro contiene: la lista de variables del archivo. De esta lista seleccionamos aquellas sobre las que deseemos evaluar el parecido de los sujetos. En nuestro caso son las correspondientes a las subescalas del WISC-R. Una vez seleccionadas las variables las trasladamos al cuadro Variables. Existe la posibilidad de agrupar (Conglomerar) casos, este es el uso más frecuente del análisis de conglomerados, o de agrupar variables y el resultado sería el equivalente a un análisis factorial. Además disponemos de una serie de botones que nos permiten acceder a las diferente opciones implementadas en SPSS. En las transparencias siguientes comentaremos las opciones de los cuadros: Estadísticos, Gráficos, Método y Guardar en este orden.

Conglomerados jerárquicos Cuadro Estadísticos: En este cuadro podemos solicitar: además del Historial de conglomeración que lo proporciona por defecto si tenemos seleccionada la opción Estadísticos dell cuadro Análisis de conglomerados jerárquico, la Matriz de distancias. Podemos pedir que nos proporcione una tabla con el conglomerado de pertenencia de cada sujeto si nos decidimos por una solución en un número de conglomerados determinado o en un rango. Estas opciones son muy útiles cuando tenemos claro el número de conglomerados que constituye la solución a nuestro problema de investigación. No obstante lo más importante no es visualizar la tabla crear una variable en el archivo de datos con valores que indican el conglomerado al que pertenece el sujeto esto podemos hacerlo con las opciones del cuadro Guardar variables nuevas.

Conglomerados jerárquicos Cuadro Método: En este cuadro podemos seleccionar entre una larga lista de métodos de conglomeración: vinculación inter-grupo (método de la media), vinculación intra-grupos (distancia media entre las distancias de los elementos del grupo unión), vecino más próximo (mínimo), vecino más lejano (máximo), agrupación de centroides (distancia entre centroides), agrupación de medianas (media de centroides) y Método de Ward (minimiza la varianza intragrupo). En principio convendría explorar con distintos métodos hasta encontrar la solucción más satisfactoria. El método de Ward sólo puede aplicarse a variables cuantitativas. Seleccionar la medida de distancia adecuada a la métrica de las variables. Podemos optar por calcular las distancias entre los sujetos a partir de puntuaciones estandarizadas con las opciones del cuadro Transformar valores. Se recomienda estandarizar cuando las variables están medidas en escalas distintas. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

Conglomerados jerárquicos Cuadro Guardar variables nuevas: Este cuadro nos permite crear nuevas variables en el archivo de datos con el grupo de pertenencia de cada sujeto. Podemos crear una única variable correspondiente a una Solución única en K conglomerados. Esta variable toma valores desde 1 hasta K e indica el grupo al que pertenece el sujeto. Si seleccionamos un Rango de soluciones crea una variable para cada una de las soluciones desde Número mínimo de conglomerados hasta Número máximo de conglomerados. Por ejemplos si en Número mínimo de conglomerados escribimos 2 y en Número máximo 4 creará 3 variables: una para la solución en dos conglomerados, otras para la solución en tres conglomerados y la última para la solución en cuatro conglomerados. Características de los clusters en función del método de conglomeración: 1) Método del mínimo da lugar a clusters encadenados (escalera) 2) El método del máximo da lugar a conglomerados compactos más fácil para una solución en un número de clases disjuntas relativamente homogéneas. 3) El enlace completo es menos sensible a outliers que el enlace simple 4) El método de Ward y el método de la media son muy sensibles (poco resistentes) a la presencia de valores atípicos (outliers). 5) El método de Ward tiene tendencia a formar clusters más compactos y de igual tamaño y forma en comparación el método de la media

dendograma Es una representación gráfica o diagrama de datos en forma de árbol, que organiza los datos en subcategorias que se van divididiendo en otros hasta llegar al nivel de detalle deseado.