ANÁLISIS DE CONGLOMERADOS

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANÁLISIS DE CONGLOMERADOS
U UNIVERSIDAD DE QUINTANA ROO
Cluster.
GRÁFICOS EN SPSS UTILIDADES Y PROCEDIMIENTO DE CREACIÓN
Master en Recursos Humanos
Estimación de los Errores de Muestreo Encuestas de Salud Reproductiva   RHS Usando SPSS 19.
ANALISIS DE SUPERVIVENCIA
4. Análisis de Correspondencias Múltiples
ANALISIS MATEMATICO PARA ECONOMISTAS
KRIGING.
ANALISIS DE CONGLOMERADOS
Facultad de Derecho y Ciencias Políticas Carrera de Ciencias Políticas Curso de metodología de la investigación Lic. Blithz Lozada Pereira, M.Sc.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
Tema 2: Métodos de ajuste
MEDIDAS DE DISPERSIÓN:
Análisis no paramétricos
ANALISIS DE DATOS CON EXCEL
Población y Muestra.
Programación Lineal Unidad 1 Parte 3.
Estadística aplicada al análisis financiero
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Mt. Martín Moreyra Navarrete.
Geo procesos.
Análisis de Conglomerados (Cluster Analysis)
Estadística Descriptiva continuación
Carla Rodríguez Francisco Álvarez Métodos Cuantitativos Capitulo 9, SPSS para Windows.
Tema 2: Parámetros Estadísticos
Programación Lineal ANÁLISIS DE SENSIBILIDAD en Programación Lineal.
Elaboración de gráficas
ESTADÍSTICAS DESCRIPTIVA
GRÁFICOS ESTADÍSTICOS
Guías Modulares de Estudio Cálculo diferencial – Parte B
Estadística La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos,
ESTADÍSTICA COMERCIO PESO KGS F.A HOSPITAL TRABAJO.
3. Análisis de Correspondencias Simples
Medidas de Posición y Centralización Estadística E.S.O.
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Econometría Clase 10 Caso práctico. El Gerente General de la compañía Aceros del Pacífico considera que los ingresos podrían aumentar un 3,5% durante.
Estadística bidimensional
Estadísticas Datos y Azar
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.
Jorge Galbiati1 INDICE DE PRODUCCION FISICA MENSUAL INDUSTRIA MANUFACTURERA, CHILE 2002 Se tienen datos de índices de la producción de la industria manufacturera.
Análisis de los datos.
Variables estadísticas bidimensionales
ANÁLISIS DE LOS DATOS LOS 10 PASOS DE LA INVESTIGACIÓN
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
LOS ALUMNOS REPROBADOS
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
ESTADÍSTICA UNIDIMENSIONAL
Aplicaciones Estadísticas a las Finanzas Clase 1
Variables estadísticas bidimensionales
Septiembre 2009 Mtra. Laura Myriam Franco Sánchez.
Construcción de modelos con regresión y correlación
MEDIDAS DE TENDENCIA CENTRAL
Diagrama de Tallos Y Hojas
Medidas de dispersión IIIº Medio 2015.
Calidad de las Mediciones; Repetibilidad y Reproducibilidad
Por: Agustín Audor Julian Tole
Aplicaciones Estadísticas a las Finanzas Clase 1
SESIÓN 14 El análisis de datos en el enfoque cuantitativo.
ESTADÍSTICA DESCRIPTIVA
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
PROCEDIMIENTO DE MUESTREO
Medidas de tendencia central
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia METODOS ALEATORIOS.
Transcripción de la presentación:

ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Método por conglomerados Método en el que se separa la muestra obteniendo grupos de objetos de forma que, por un lado, los objetos pertenecientes a un mismo grupo sean muy semejantes entre sí (homogéneos), es decir, que el grupo esté cohesionado internamente y, por el otro, los objetos pertenecientes a grupos diferentes tengan un comportamiento distinto con respecto a las variables analizadas, es decir, que cada grupo sea completamente distinto y distante al otro.

Ejercicio de conglomerados Considerando un grupo de n integrantes con base a una encuesta con tema “¿ que alcohol no beben por tener efectos negativos en si mismos?”. De acuerdo con la investigaciónecha, se identificaron siete variables, cada una correspondiente al tipo de alcohol que no se ingerían por la muestra. Se sospecha que la variación en alguno de estos elementos, demostrará cual es el que peor efecto tiene en los encuestados. N=Número de individuos (filas) P= Número de variables observadas (columnas) N=14 P= (Ron, Vodka, Vino, Pisco, Tequila, Cerveza,Caipirinha)

Pasos para realizar el análisis por conglomerados para el ejercicio planteado 1º Establecer medida de distancia entre individuos: Para este paso utilizaremos la distancia euclídea

2º Luego realizaremos las correlaciones respectivas: (En cuadro de diálogo) Analizar -> correlaciones-> Bivariadas Variables: vodka, ron, vino Aceptar.

3º Análisis de valor tipificados: (En cuadro de diálogo) Analizar->estadísticos descriptivos->descriptivos Variables: vodka, Ron, vino. Guardar variables tipificados como variables Aceptar. Habiendo realizado ambos pasos procederemos a realizar el paso de las K-medias en el cual especificaremos el número de iteraciones (repeticiones del proceso) para poder obtener los centros iniciales.

4º Método de las K-medias: Este método no jerárquico realiza una división de los individuos en grupos donde k debe ser definido anteriormente. Este método realiza los siguientes pasos: Elegir número de conglomerados Especificar centros de k conglomerados iniciales ( en el caso que sea desconocidos, estimarlos) En función del centro más cercano, agrupar pacientes en conglomerados Calcular centro de conglomerados a partir de la agrupación en el paso anterior. Repetir paso 3 y 4 hasta que se de algún criterio de parada. Para k conocida: (Cuadro de dialogo) Gráficos->dispersión 3-D -> definir Eje y: Puntua (Ron) (ZRon) Eje X: Puntua (Vodka) (ZVodka) Eje Z: Puntua (Vino) (ZVino) Aceptar.

Para k desconocido : Para el método de las K-medias al momento de determinar los conglomerados se debe realizar el siguiente procedimiento en el cuadro de diálogo del programa: (Cuadro de dialogo) Analizar-> clasificar-> conglomerado de k medias Variables: Puntua (Ron) (ZRon), Puntua (Vodka) (Z Vodka), Puntua (Vino) (ZVino) Nº de conglomerados: 4 Opciones Estadísticos: Centros de conglomerados iniciales Información del conglomerado para cada caso Continuar: Guardar Conglomerado de pertenencia Continuar Aceptar.

Dando como resultado los siguientes cuadros y representaciones gráficas:

Luego de haber localizado los primeros centros se procederá a realizar un cálculo para los nuevo centros, que corresponderá al centro de cada uno de los conglomerados, para proceder a la siguiente agrupación, hasta que alguna de las soluciones coincida (criterio de parada), dando como resultado la siguiente tabla. Los siguientes cuadros resumen la pertenencia de cada individuo en su variable respectiva.

Mediante la opción Guardar: Conglomerado de pertenecia, se generará la variable QCL_1 , a partir de esta variable podremos ver que tienen en común las personas clasificadas en un mismo conglomerado, a través de un grafico matricial analizaremos este tópico. (Cuadro de dialogo) Gráficos-> dispersión Matricial-> definir Variables en la matriz: RON, VODKA, VINO. Etiquetar los casos mediante: Numero inicial de casos (QCL_1) Opciones Mostrar el gráfico con las etiquetas de caso Continuar Aceptar Generándose el siguiente grafico matricial.

Método jerárquico Aglomerativo: Promedio entre grupos Este proceso tiene el mismo proceso que el de K-medias, se debe determinar las distancias entre conglomerados pero con la diferencia que ésta se determina con el promedio de las distancias entre todos los pares de individuos o con distancia euclídea que justamente en este caso seguiremos utilizándola. En este método cada individuo se convierte en un conglomerado en particular para luego agruparse de a dos en dos hasta formar entre todos un gran conglomerado.

El número de casos en este método se puede definir con anterioridad dependiendo de lo obtenido en cada etapa. Obtención de conglomerados: (Cuadro de diálogo) Analizar->Clasificar ->Conglomerados jerárquicos. Variables: Puntua (ron), puntua (vodka), puntua (vino) Método Método de conglomeración: Vinculación Inter- Grupos Medida: Intervalo: Distancia Euclidea Continuar. Estadísticos Conglomerado de pertenencia Rango de soluciones: Desde 2 hasta 13 grupos Continuar Gráficos Dendograma Témpano: Orientación: Horizontal. Aceptar.

Número de conglomerados Caso Número de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 X 14

Conclusión El Análisis Cluster, también conocido como Análisis de Conglomerados, es una técnica estadística multivariante cuya finalidad es dividir un conjunto de objetos en grupos (cluster en inglés) de forma que los perfiles de los objetos en un mismo grupo sean muy similares entre sí (cohesión interna del grupo) y los de los objetos de clusters diferentes sean distintos (aislamiento externo del grupo). Realizando distintos pasos podemos decir que cada grupo de individuos tendrá una reacción negativa ante el tipo de variable en que se ubicado el conglomerado. Los resultados del análisis deberían tomarse como punto de partida en la elaboración de teorías que expliquen dichos resultados.

Maria de los Angeles Navarrete Salas Maria Fernanda 26 de Octubre del 2009