ANÁLISIS DE CONGLOMERADOS

Slides:

Advertisements

Presentaciones similares

DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE

Advertisements

ANÁLISIS DE CONGLOMERADOS

U UNIVERSIDAD DE QUINTANA ROO

GRÁFICOS EN SPSS UTILIDADES Y PROCEDIMIENTO DE CREACIÓN

Master en Recursos Humanos

Estimación de los Errores de Muestreo Encuestas de Salud Reproductiva RHS Usando SPSS 19.

ANALISIS DE SUPERVIVENCIA

4. Análisis de Correspondencias Múltiples

ANALISIS MATEMATICO PARA ECONOMISTAS

ANALISIS DE CONGLOMERADOS

Facultad de Derecho y Ciencias Políticas Carrera de Ciencias Políticas Curso de metodología de la investigación Lic. Blithz Lozada Pereira, M.Sc.

ANÁLISIS DE CORRESPONDENCIAS SIMPLE

FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.

Tema 2: Métodos de ajuste

MEDIDAS DE DISPERSIÓN:

Análisis no paramétricos

ANALISIS DE DATOS CON EXCEL

Población y Muestra.

Programación Lineal Unidad 1 Parte 3.

Estadística aplicada al análisis financiero

Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.

Mt. Martín Moreyra Navarrete.

Análisis de Conglomerados (Cluster Analysis)

Estadística Descriptiva continuación

Carla Rodríguez Francisco Álvarez Métodos Cuantitativos Capitulo 9, SPSS para Windows.

Tema 2: Parámetros Estadísticos

Programación Lineal ANÁLISIS DE SENSIBILIDAD en Programación Lineal.

Elaboración de gráficas

ESTADÍSTICAS DESCRIPTIVA

GRÁFICOS ESTADÍSTICOS

Guías Modulares de Estudio Cálculo diferencial – Parte B

Estadística La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos,

ESTADÍSTICA COMERCIO PESO KGS F.A HOSPITAL TRABAJO.

3. Análisis de Correspondencias Simples

Medidas de Posición y Centralización Estadística E.S.O.

SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO

Econometría Clase 10 Caso práctico. El Gerente General de la compañía Aceros del Pacífico considera que los ingresos podrían aumentar un 3,5% durante.

Estadística bidimensional

Estadísticas Datos y Azar

Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.

¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.

Jorge Galbiati1 INDICE DE PRODUCCION FISICA MENSUAL INDUSTRIA MANUFACTURERA, CHILE 2002 Se tienen datos de índices de la producción de la industria manufacturera.

Análisis de los datos.

Variables estadísticas bidimensionales

ANÁLISIS DE LOS DATOS LOS 10 PASOS DE LA INVESTIGACIÓN

COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.

LOS ALUMNOS REPROBADOS

SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.

ESTADÍSTICA UNIDIMENSIONAL

Aplicaciones Estadísticas a las Finanzas Clase 1

Variables estadísticas bidimensionales

Septiembre 2009 Mtra. Laura Myriam Franco Sánchez.

Construcción de modelos con regresión y correlación

MEDIDAS DE TENDENCIA CENTRAL

Diagrama de Tallos Y Hojas

Medidas de dispersión IIIº Medio 2015.

Calidad de las Mediciones; Repetibilidad y Reproducibilidad

Por: Agustín Audor Julian Tole

Aplicaciones Estadísticas a las Finanzas Clase 1

SESIÓN 14 El análisis de datos en el enfoque cuantitativo.

ESTADÍSTICA DESCRIPTIVA

MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.

Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca

PROCEDIMIENTO DE MUESTREO

Medidas de tendencia central

TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.

Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia METODOS ALEATORIOS.

Transcripción de la presentación:

ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Método por conglomerados Método en el que se separa la muestra obteniendo grupos de objetos de forma que, por un lado, los objetos pertenecientes a un mismo grupo sean muy semejantes entre sí (homogéneos), es decir, que el grupo esté cohesionado internamente y, por el otro, los objetos pertenecientes a grupos diferentes tengan un comportamiento distinto con respecto a las variables analizadas, es decir, que cada grupo sea completamente distinto y distante al otro.

Ejercicio de conglomerados Considerando un grupo de n integrantes con base a una encuesta con tema “¿ que alcohol no beben por tener efectos negativos en si mismos?”. De acuerdo con la investigaciónecha, se identificaron siete variables, cada una correspondiente al tipo de alcohol que no se ingerían por la muestra. Se sospecha que la variación en alguno de estos elementos, demostrará cual es el que peor efecto tiene en los encuestados. N=Número de individuos (filas) P= Número de variables observadas (columnas) N=14 P= (Ron, Vodka, Vino, Pisco, Tequila, Cerveza,Caipirinha)

Pasos para realizar el análisis por conglomerados para el ejercicio planteado 1º Establecer medida de distancia entre individuos: Para este paso utilizaremos la distancia euclídea

2º Luego realizaremos las correlaciones respectivas: (En cuadro de diálogo) Analizar -> correlaciones-> Bivariadas Variables: vodka, ron, vino Aceptar.

3º Análisis de valor tipificados: (En cuadro de diálogo) Analizar->estadísticos descriptivos->descriptivos Variables: vodka, Ron, vino. Guardar variables tipificados como variables Aceptar. Habiendo realizado ambos pasos procederemos a realizar el paso de las K-medias en el cual especificaremos el número de iteraciones (repeticiones del proceso) para poder obtener los centros iniciales.

4º Método de las K-medias: Este método no jerárquico realiza una división de los individuos en grupos donde k debe ser definido anteriormente. Este método realiza los siguientes pasos: Elegir número de conglomerados Especificar centros de k conglomerados iniciales ( en el caso que sea desconocidos, estimarlos) En función del centro más cercano, agrupar pacientes en conglomerados Calcular centro de conglomerados a partir de la agrupación en el paso anterior. Repetir paso 3 y 4 hasta que se de algún criterio de parada. Para k conocida: (Cuadro de dialogo) Gráficos->dispersión 3-D -> definir Eje y: Puntua (Ron) (ZRon) Eje X: Puntua (Vodka) (ZVodka) Eje Z: Puntua (Vino) (ZVino) Aceptar.

Para k desconocido : Para el método de las K-medias al momento de determinar los conglomerados se debe realizar el siguiente procedimiento en el cuadro de diálogo del programa: (Cuadro de dialogo) Analizar-> clasificar-> conglomerado de k medias Variables: Puntua (Ron) (ZRon), Puntua (Vodka) (Z Vodka), Puntua (Vino) (ZVino) Nº de conglomerados: 4 Opciones Estadísticos: Centros de conglomerados iniciales Información del conglomerado para cada caso Continuar: Guardar Conglomerado de pertenencia Continuar Aceptar.

Dando como resultado los siguientes cuadros y representaciones gráficas:

Luego de haber localizado los primeros centros se procederá a realizar un cálculo para los nuevo centros, que corresponderá al centro de cada uno de los conglomerados, para proceder a la siguiente agrupación, hasta que alguna de las soluciones coincida (criterio de parada), dando como resultado la siguiente tabla. Los siguientes cuadros resumen la pertenencia de cada individuo en su variable respectiva.

Mediante la opción Guardar: Conglomerado de pertenecia, se generará la variable QCL_1 , a partir de esta variable podremos ver que tienen en común las personas clasificadas en un mismo conglomerado, a través de un grafico matricial analizaremos este tópico. (Cuadro de dialogo) Gráficos-> dispersión Matricial-> definir Variables en la matriz: RON, VODKA, VINO. Etiquetar los casos mediante: Numero inicial de casos (QCL_1) Opciones Mostrar el gráfico con las etiquetas de caso Continuar Aceptar Generándose el siguiente grafico matricial.

Método jerárquico Aglomerativo: Promedio entre grupos Este proceso tiene el mismo proceso que el de K-medias, se debe determinar las distancias entre conglomerados pero con la diferencia que ésta se determina con el promedio de las distancias entre todos los pares de individuos o con distancia euclídea que justamente en este caso seguiremos utilizándola. En este método cada individuo se convierte en un conglomerado en particular para luego agruparse de a dos en dos hasta formar entre todos un gran conglomerado.

El número de casos en este método se puede definir con anterioridad dependiendo de lo obtenido en cada etapa. Obtención de conglomerados: (Cuadro de diálogo) Analizar->Clasificar ->Conglomerados jerárquicos. Variables: Puntua (ron), puntua (vodka), puntua (vino) Método Método de conglomeración: Vinculación Inter- Grupos Medida: Intervalo: Distancia Euclidea Continuar. Estadísticos Conglomerado de pertenencia Rango de soluciones: Desde 2 hasta 13 grupos Continuar Gráficos Dendograma Témpano: Orientación: Horizontal. Aceptar.

Número de conglomerados Caso Número de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 X 14

Conclusión El Análisis Cluster, también conocido como Análisis de Conglomerados, es una técnica estadística multivariante cuya finalidad es dividir un conjunto de objetos en grupos (cluster en inglés) de forma que los perfiles de los objetos en un mismo grupo sean muy similares entre sí (cohesión interna del grupo) y los de los objetos de clusters diferentes sean distintos (aislamiento externo del grupo). Realizando distintos pasos podemos decir que cada grupo de individuos tendrá una reacción negativa ante el tipo de variable en que se ubicado el conglomerado. Los resultados del análisis deberían tomarse como punto de partida en la elaboración de teorías que expliquen dichos resultados.

Maria de los Angeles Navarrete Salas Maria Fernanda 26 de Octubre del 2009