Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002.

Slides:



Advertisements
Presentaciones similares
¿ Que es una muestra?.
Advertisements

Cargas Fabriles o Costos generales de fabricación
ANÁLISIS DE CONGLOMERADOS
Tema 4: Medidas de posición individual.
INDICADORES ECONÓMICOS
Niveles de investigación. Investigación cuantitativa
U UNIVERSIDAD DE QUINTANA ROO
TECNICATURA UNIVERSITARIA EN INFORMATICA
COLEGIO FERNANDO MAZUERA VILLEGAS
TEORIA DE DECISIONES Introducción.
La medición en Sociología
Master en Recursos Humanos
Herramienta de Control
Formulación de Objetivos
DISEÑOS NO EXPERIMENTALES
MÉTODOS DE ANÁLISIS FINANCIEROS
Análisis Estadístico de Datos Climáticos
Muestreo para la inspección por atributos
ANALISIS DE CONGLOMERADOS
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
MUESTREO DE AUDITORIA PARA PRUEBAS DE DETALLES DE SALDOS
Taller 2. Medición de distancia entre variables y sujetos
Muestreo Obtención de evidencia confiable y pertinente, suficiente para brindar una base razonable sobre la cual emitir una opinión. Procedimientos que.
NÚMEROS DE INDICE GRUPO 4: INTEGRANTES Karla Zepeda Doris Carbajal
Clustering (Agrupamiento)
1. FUNCIONES. LÍMITES. Depto. Matemáticas – IES Elaios
Unidad 4. Muestreo de Aceptación
ESTADISTICA PARA RELACIONES LABORALES
Introducción al Análisis Cluster
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Búsqueda de Aproximaciones: Algoritmos
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
Reunión Jefes UTP 2012 Dirección de Educación I. Municipalidad de Santiago JUNIO.
vii.- Impacto Neto del Proyecto
Aprendizaje Automático en Bioinformática
ANÁLISIS DE CONGLOMERADOS
Ajustes de datos: transformación de datos.
LA VALORACIÓN DE CARGO UNIVERSIDAD DE ORIENTE NÚCLEO DE MONAGAS
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Geo procesos.
ANÁLISIS DE CONGLOMERADOS
Análisis de Conglomerados (Cluster Analysis)
Análisis de la inversión, mantenimiento y seguridad.
Análisis de Agrupamientos y Componentes Principales
Ordenación Polar (Bray Curtis)
Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002.
Seminario de Titulación (9) Mtra. Marcela Alvarez.
Escalamiento Multidimensional No-Métrico Capítulo 16 de McCune y Grace 2002.
Herramientas básicas.
Capítulo 4 de McCune y Grace 2002
Método para evaluar valores y cualidades
Análisis de correspondencia canónica (CCA)
ELABORACIÓN DE INDICADORES
Análisis de componentes principales
MÉTODOS DE EVALUACIÓN DEL DESEMPEÑO
Medidas de similaridad y distancia Capítulo 6 de McCune y Grace 2002, y páginas de Ruokolainen et al
INGENIERÍA DEL SOFTWARE GESTIÓN DE PROYECTOS
Escalamiento Multidimensional No-Métrico. Rasgos generales Busca las mejores posiciones de n objetos en un espacio de k dimensiones que se asemejen más.
Reducción de dimensionalidad por ordenación Capítulo 13 de McCune y Grace 2002.
PLANES DE MUESTREO Y GRAFICAS DE CONTROL
Ing. Efrain Licuona Rojas Consultor de CELAP
CLASIFICACIÓN SUPERVISADA
Conceptos Básicos y Estadística Descriptiva
Medidas de similaridad y distancia
EVALUACION Y RESULTADOS DEL PROYECTO DE INVESTIGACION
DIMENSIONALIDAD del instrumento Y ANÁLISIS FACTORIAL
Procedimientos de multirespuesta por permutación (MRPP)
Métodos para evaluación de proyectos Introducción Los proyectos podrán evaluarse considerando principalmente su pronta recuperabilidad y su rentabilidad.
Las Variables Son elementos o atributos del objeto de investigación que puede ser clasificados en categorías y que además se pueden medir y cuantificar.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002

Clasificar Proceso natural humano para interpretar el mundo Pero estamos acostumbrados a sólo observar pocas dimensiones Más complejo cuando intentamos clasificar objetos de muchas dimensiones como los datos de composición

Opciones generales Clasificación jerárquica o no-jerárquica Clasificación politética o monotética Clasificación aglomerativa o divisiva

Clasificación jerárquica aglomerativa Pasos: –Calcular la matriz de distancias (o similaridades) –Unir 2 elementos de acuerdo a algún criterio de distancia mínima –Combinar los atributos de las entidades en ambos grupos –Unir los próximos 2 grupos, etc. Los resultados se pueden presentar en un dendrograma

Ejemplo Método de enlace sencillo (o de vecino más cercano)

Matriz de similaridades

Subgráfica conectada

Dendrograma

Dendrogramas

La escala en el dendrograma se puede expresar por: –Similaridad según la medida utilizada –Función objetiva: –% de información restante:

¿Dónde podar el dendrograma? Los criterios dependen de los objetivos –Homogeneidad dentro de grupos –Número de grupos vs número de elementos Pocos grupos pueden ser muy heterogéneos Muchos grupos derrotan el propósito de clasificar

Tres métodos de enlace recomendados para datos de comunidades UPGMA, Ward y Beta flexible

UPGMA: “Unweighted Pair-Group Mathematical Average”

UPGMA

Enlace sencillo vs. UPGMA

Método de Ward

Método de Beta flexible

¿UPGMA, Ward o Beta flexible? UPGMA: –Bastante conservador de espacio –Pero tiende al encadenamiento Ward: –Conservador de espacio –Pero incompatible con distancias por proporción Beta flexible: –Encadenamiento es alto cuando beta se acerca a +1 –Contrae el espacio cuando beta se acerca a -1 –Resultados más aceptables cuando beta ~ -0.25

Ventajas y desventajas de clasificación jerárquica aglomerativa El resultado en multiniveles puede sugerir relaciones entre grupos Puede haber agrupaciones incorrectas porque las fusiones subsiguientes dependerán de las anteriores. Para datos bien heterogéneos puede ser conveniente subdividir en grupos más manejables y luego analizar con ordenaciones.

Métodos no jerárquicos Este tipo de clasificación asigna las unidades en un número de grupos que uno decida inicialmente. Bien útil cuando el conjunto de datos es bien grande.

Evaluación de la calidad de la clasificación Grado de encadenamiento Interpretabilidad Comparación con algún atributo independiente

Grado de encadenamiento

Interpretabilidad ¿Hace sentido el dendrograma? ¿Son los grupos el resultado de algún proceso biológico interesante?

Comparar con atributo independiente ¿Son los miembros de un grupo similares según los valores de alguna variable (no incluida en los datos analizados) pero distintos en esa variable a los miembros de otros grupos?

¿Qué informar? Medida de distancia utilizada Método de enlazar Si se buscaron elementos clasificados erróneamente, cómo se hizo y cómo se corrigieron. Dendrograma y cuál medida se utilizó en la escala Criterios para podar el dendrograma (mencionar la cantidad de información retenida a ese nivel).

Ejercicio Generar una clasificación manualmente por enlace sencillo con los datos de Oak_t_6x5r Comparar con UPGMA, Ward y Beta flexible