Master en Recursos Humanos Análisis de Conglomerados (Cluster Analysis): prácticas con SPSS Ana María López Área de Metodología de las Ciencias del Comportamiento.

Slides:



Advertisements
Presentaciones similares
U UNIVERSIDAD DE QUINTANA ROO
Advertisements

Master en Recursos Humanos
IIIº Medio  Comprender conceptos de estadística y construir e interpretar tablas de frecuencia, valorando su utilidad en diversos contextos de.
Introducción a la Metodología de investigación 2 Definición de investigación Indagación organizada, sistemática, basada en datos, orientada de forma.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
Bioestadística Muestreo. Objetivos de la estadística. n Describir cuantitativamente una serie de personas, lugares o cosas (estadística descriptiva ).
DETERMINACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL POBLACIONAL Y MUESTRAL. POR: JUDITH MARITZA JUAN CARLOS ANA MARTIN AXEL GILBERTO FÁTIMA.
ÉSTADÍSTICAS DESCRIPTIVAS ORGANIZACIÓN DE DATOS
SESION 2: AGRUPACIÓN DE DATOS (TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS)
Apuntes de Matemáticas 3º ESO
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
A este grupo de personas que tenemos aquí…
Técnica de evaluación y revisión de programas
INVESTIGACIÓN DE OPERACIONES
Statistic Package for Social Sciencies
Análisis de varianza Paramétricos vs. No Paramétricos
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
Estadística Descriptiva Dr. Javier Moreno Tapia
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
INTRODUCCIÓN AL ESTUDIO DE LA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA: OBTENCIÓN Y ORGANIZACIÓN DE LOS DATOS
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
Fuente:
Muestreo. El muestreo es un tópico sumamente importante en los modelos mixtos de investigación y tradicionalmente se ha clasif cado en dos tipos principales.
Capitulo 10 Análisis de los datos cuantitativos. Programas Computacionales La Matriz de Datos Estadística Pasos SPSS Minitab SAS Stats Como Reportar resultados.
TEMA II. ESTUDIO DE MERCADO 2.2 El muestreo estadístico en la investigación de mercados. Métodos de pronósticos de corto plazo.
CAMBIOS Y SECUENCIAS MUCHOS OBJETOS, SUCESOS Y PROCESOS QUE OBSERVAMOS CAMBIAN O EVOLUCIONAN EN EL TRANSCURSO DEL TIEMPO. PARA COMPRENDER LOS CAMBIOS HAY.
 ANALISIS DE DATOS CUANTITATIVOS Se efectúa con: Programas computacionales de análisis estadístico CAPITULO 10 Paola Pérez Montiel.
ANALISIS DE DATOS CUANTITATIVOS
Estimación de parámetros: Estimación puntual y por intervalos
  TABLAS DE FRECUENCIA Además de la ventana editor de datos, SPSS cuenta con otras ventanas como la de Resultados o la de Sintaxis.
Tutorial de las diferentes modalidades de preguntas
ETAPA DE ANÁLISIS E INTERPRETACIÓN DE DATOS: MEDIDAS DE RESUMEN
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
ESTADÍSTICA BÁSICA.
Selección de la muestra
ANÁLISIS ESTADÍSTICO PROFESOR: PIA VEGA CODOCEO. MEDIA ARITMÉTICA Es la suma de los valores de una variable dividida por, él numero de ellos. La media.
Niveles de Medición de las Variables Javier Andrés Gómez- Díaz, Ps. Mg. Fuente Imágenes: y
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS TECNOLOGÍAS DE LA INFORMACIÓN I YOSIRIS MARTÍNEZ ZAMORANO 1 G M 14/05/18.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS TECNOLOGÍAS DE LA INFORMACIÓN I YOSIRIS MARTÍNEZ ZAMORANO 1 G M 14/05/18.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS TABLA DE CONTENIDO 1. Los hipervínculos Como insertar un hipervínculo Sintaxis para insertar.
Análisis descriptivo A.F.C. Naturaleza de las variables VARIABLES ESCALARES (CUANTITATIVAS) CONTINUAS T°: 36.5°C Utiliza decimales DISCRETAS 1 SUJETO.
POBLACIÓN MUESTRA MUESTRA ESTADISTICA ESTADISTICA ENCUESTA ENCUESTA.
ANALISIS DE VARIANZA
Excel Macros Macros Automáticas.
FILTROS AUTOMÁTICOS Un filtro es una orden que damos a Excel para que extraiga de una lista de datos, aquellos que cumplan una o unas condiciones determinadas.
ESTADÍSTICA DESCRIPTIVA
El problema de la medición en psicología.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS VALERIA ALEJANDRA PÉREZ ROMERO 1º F- MATUTINO.
Herramientas de Microsoft Word Hipervínculos Guadalupe Margarita Catedral Cruz 1ª A/ Turno: M Tecnologías de la Información 1 Guadalupe Margarita Catedral.
HERRAMIENTAS DE MICROSOFT WORD LOS HIPERVINCULOS.
ACTIVIDAD 3 MENDEZ SOTO KARLA ELIZABETH 1º F T/M 22/11/18 MAESTRA: ADRIANA UBIARCO TECNOLOGÍAS DE LA INFORMACIÓN HIPERVINCULOS.
HERRAMIENTAS DE MICOSOFT WORD LOS HIPERVINCULOS. HIPERVÍNCULO  Los hipervínculos son enlaces o rutas de acceso a otro archivo, pagina Web o una dirección.
HERRAMIENTAS DE MICROSOFT WORD LOS HIPERVINCULOS Estefany Marcela Arce Velázquez 1°E T/V MAESTRA Adriana Ubiarco.
UNIVERSIDAD DE LOS ANDES CENTRO DE INVESTIGACIONES PSICOLÓGICAS
Seminario 6. Ejercicio obligatorio tema 5.
Apuntes de Matemáticas 3º ESO
Actividad 3: Ejecutar procesos de recolección de datos, organización y análisis de los datos recolectados para la identificación de la línea de base de.
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Distribución Normal de una Variable
Se dispone de N individuos, con información sobre n variables.
Comparación de medias para datos relacionados
Leonardo Gael Lopez Santillan 09/05/2019. LOS HIPERVINCULOS Los hipervínculos son enlaces o rutas de acceso a otro archivo, pagina Web o una dirección.
Leonardo Gael Lopez Santillan 09/05/2019. LOS HIPERVINCULOS Los hipervínculos son enlaces o rutas de acceso a otro archivo, pagina Web o una dirección.
Mg. Homero Ango Aguilar Mg. Jimmy Homero Ango Bedriñana Población, Muestra y Unidad de Análisis Universidad Nacional San Cristóbal de Huamanga Curso de.
01/08/ Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.
Modulo 1 MANUEL PINEDA 03/05/2017. Introducción  Estadística descriptiva-inferencial  Tipos de variables  Tipos de análisis  SPSS y sus contribuciones.
ESTADÍSTICA Y SU CLASIFICACIÓN 1. 2 La estadística es la ciencia encargada de recoger, clasificar, describir, analizar datos numéricos para deducir conclusiones.
EXCEL INTERMEDIO FILTROS AVANZADOS – TABLA DINAMICA – AUDITORIA DE FORMULAS JORGE LUIS AGUILAR ALCALDE.
Transcripción de la presentación:

Master en Recursos Humanos Análisis de Conglomerados (Cluster Analysis): prácticas con SPSS Ana María López Área de Metodología de las Ciencias del Comportamiento Departamento de Psicología Experimental

El objetivo es agrupar a los sujetos en función de su parecido en las subescalas del WISC-R. dado que todas las variables son cuantitativas utilizaremos como medida de disimilaridad la distancia euclídea y como procedimiento de agregación los métodos de la media, mínimo y máximo. La matriz con la que vamos a trabajar es: datos1. Para ejecutar un análisis de conglomerados con SPSS en primer lugar hay que seleccionar el menú Analizar como muestra el siguiente cuadro:datos1 Conglomerados jerárquicos

En segundo lugar seleccionamos Conglomerados jerárquicos y accedemos al siguiente cuadro: Conglomerados jerárquicos El cuadro contiene: 1.la lista de variables del archivo. De esta lista seleccionamos aquellas sobre las que deseemos evaluar el parecido de los sujetos. En nuestro caso son las correspondientes a las subescalas del WISC-R. Una vez seleccionadas las variables las trasladamos al cuadro Variables. 2.Existe la posibilidad de agrupar (Conglomerar) casos, este es el uso más frecuente del análisis de conglomerados, o de agrupar variables y el resultado sería el equivalente a un análisis factorial. 3.Además disponemos de una serie de botones que nos permiten acceder a las diferente opciones implementadas en SPSS. En las transparencias siguientes comentaremos las opciones de los cuadros: Estadísticos, Gráficos, Método y Guardar en este orden.

Conglomerados jerárquicos Cuadro Estadísticos: En este cuadro podemos solicitar: 1.además del Historial de conglomeración que lo proporciona por defecto si tenemos seleccionada la opción Estadísticos dell cuadro Análisis de conglomerados jerárquico, la Matriz de distancias. 2.Podemos pedir que nos proporcione una tabla con el conglomerado de pertenencia de cada sujeto si nos decidimos por una solución en un número de conglomerados determinado o en un rango. Estas opciones son muy útiles cuando tenemos claro el número de conglomerados que constituye la solución a nuestro problema de investigación. No obstante lo más importante no es visualizar la tabla crear una variable en el archivo de datos con valores que indican el conglomerado al que pertenece el sujeto esto podemos hacerlo con las opciones del cuadro Guardar variables nuevas.

Conglomerados jerárquicos Cuadro Método: En este cuadro podemos 1.seleccionar entre una larga lista de métodos de conglomeración: vinculación inter-grupo (método de la media), vinculación intra- grupos (distancia media entre las distancias de los elementos del grupo unión), vecino más próximo (mínimo), vecino más lejano (máximo), agrupación de centroides (distancia entre centroides), agrupación de medianas (media de centroides) y Método de Ward (minimiza la varianza intragrupo). En principio convendría explorar con distintos métodos hasta encontrar la solucción más satisfactoria. El método de Ward sólo puede aplicarse a variables cuantitativas. 2.Seleccionar la medida de distancia adecuada a la métrica de las variables. 3.Podemos optar por calcular las distancias entre los sujetos a partir de puntuaciones estandarizadas con las opciones del cuadro Transformar valores. Se recomienda estandarizar cuando las variables están medidas en escalas distintas.

Conglomerados jerárquicos Cuadro Guardar variables nuevas: Este cuadro nos permite crear nuevas variables en el archivo de datos con el grupo de pertenencia de cada sujeto. Podemos crear una única variable correspondiente a una Solución única en K conglomerados. Esta variable toma valores desde 1 hasta K e indica el grupo al que pertenece el sujeto. Si seleccionamos un Rango de soluciones crea una variable para cada una de las soluciones desde Número mínimo de conglomerados hasta Número máximo de conglomerados. Por ejemplos si en Número mínimo de conglomerados escribimos 2 y en Número máximo 4 creará 3 variables: una para la solución en dos conglomerados, otras para la solución en tres conglomerados y la última para la solución en cuatro conglomerados.

Resultados Conglomerados jerárquicos

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine

Vinculación simple (método del mínimo) Dendrogram using Single Linkage Rescaled Distance Cluster Combine

Vinculación completa (método del máximo)

Resultados: Si a partir del dendograma anterior, en el cuadro Guardar variables nuevas, seleccionamos Rango de soluciones y en Número mínimo de conglomerados escribimos 2 y en Número máximo de conglomerados escribimos 4 se crean tres nuevas variables en el editor de datos que clasifican a los sujetos en función del cluster al que pertenecen para cada una de las soluciones en dos, tres y cuatro conglomerados. Las nuevas variables se denominan: CLU4_1, CLU3_1 y CLU2_1 como podemos observar en la porción del editor de datos siguiente.

Resultados: La interpretación de los conglomerados depende del valor medio de las variables en cada uno de ellos. Es decir, para caracterizar a cada clase y diferenciarla de las demás vamos a obtener el centroide de cada una de ellas y vamos a realizar un gráfico de lineas. Vamos también a realizar una análisis de frecuencias para saber el número de sujetos de cada cluster y para cada solución. Tabla de frecuencia

Resultados: Perfil de medias de cada solución Tablas personalizadas Los gráficos de perfiles obtenerlos del archivo: perfilesperfiles

Resultados: Perfil de medias de cada solución Tablas personalizadas

Resultados: Perfil de medias de cada solución Tablas personalizadas

Con la misma matriz y variables con las que hemos realizado el análisis de conglomerados jerárquico vamos a realizar un análisis de conglomerados de k-medias. Ahora del menú Clasificar seleccionamos Conglomerado de K medias Conglomerados de k medias

El cuadro contiene: 1.la lista de variables del archivo. De esta lista seleccionamos aquellas sobre las que deseemos evaluar el parecido de los sujetos. En nuestro caso son las correspondientes a las subescalas del WISC-R. Una vez seleccionadas las variables las trasladamos al cuadro Variables. 2.Por defecto el Nº de conglomerados en que divide a los sujetos es 2 pero podemos segmentar la muestra en un número mayor de clases. Sólo tenemos que sustituir el 2 por otro número. 3.Sabemos que la primera partición la inducen un número de sujetos igual al número de conglomerados elegidos mediante diferentes procedimientos. Por defecto SPSS elige a los dos sujetos más distantes. Podemos no obstante escribir en un archivo los centros de los conglomerados que dan lugar a la primera partición marcando en Leer iniciales. 4.También podemos escribir en un archivo los centros de los conglomerados finales seleccionando Escribir finales.

Conglomerados de k medias Si pulsamos en los botones Guardar del cuadro anterior obtenemos podemos crear una nueva variable en el editor de datos de manera que asigne a cada sujeto un valor que identifica el conglomerado al que pertenece. : Si pulsamos en el botón Opciones podemos seleccionar una Tabla de ANOVA con la única utilidad de identificar a las variables que desde un punto de vista descriptivo discriminan entre los conglomerados. Las inferencias a partir de estos resultados de ANOVA serían incorrectas. :

Resultados: Análisis de conglomerados de K medias

Resultados: Análisis de conglomerados de K medias

Resultados:

Dado que en la matriz además de las variables de la evaluación intelectual disponemos de otras variables de naturaleza cualitativa tales como la presencia de ansiedad, válvulas, retrasos en el desarrollo, etc. Vamos a realizar un análisis de conglomerados en dos fases. Para ello elegimos Conglomerado en dos fases… Conglomerados en dos etapas

A diferencia del resto de los procedimientos aquí disponemos de dos cuadros: en uno insertamos las variables cualitativas y en el otro las cuantitativas. Conglomerados en dos etapas

Como en el resto de los cuadros de diálogo si pinchamos en el botón Gráficos podemos seleccionar dos tipos de gráficos que nos ayudarán a interpretar el perfil de los conglomerados tanto en las variables cualitativas como cuantitativas. Conglomerados en dos etapas

Pulsando en el botón Resultados podemos Estadísticos Descriptivos por conglomerado y Frecuencias de los conglomerados. Conglomerados en dos etapas

Resultados: Conglomerados en dos fases Perfiles de los conglomerados

Resultados: Frecuencias

Resultados: Importancia de los atributos

Resultados: Importancia de los atributos

Resultados: Variación intra-conglomerado

Resultados: Importancia según agrupación

Resultados: