Búsqueda de Aproximaciones: Algoritmos

Slides:



Advertisements
Presentaciones similares
ANÁLISIS DE CONGLOMERADOS
Advertisements

U UNIVERSIDAD DE QUINTANA ROO
VARIABLES Las variables son los aspectos o características
Cluster.
Investigación de Operaciones
Capítulo 3: Medidas de posición
Master en Recursos Humanos
El Diseño de Algoritmos Paralelos
Binomial Poisson Hipergeométrico Modelos Discretos
Dra. Rocío C. Romero Zaliz
Investigación de Operaciones II
Investigación de Operaciones II
Análisis Estadístico de Datos Climáticos
K-Means Integrantes Natalia Merino (85828) Gastón Sabatelli (85523)
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
Clase # 8: Análisis Conformacional (II)
PROGRAMACION DE ESTRUCTURAS DE DATOS
Representación en espacio de estado
ANALISIS DE CONGLOMERADOS
Ajustando el Algoritmo al problema Universidad Nacional Oscar Lozano.
K-Means Integrantes Natalia Merino (85828) Gastón Sabatelli (85523)
Clustering (Agrupamiento)
Tema 3. Optimización de Código
Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002.
Algoritmos Genéticos (AG) Integrantes: Rubén Levineri Miguel Rozas Juan Yañez Faltan autores y bibliografía.
Introducción al Análisis Cluster
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
Optimización Multiobjetivo Por: Antonio H
 La resolución de problemas algorítmicos no solamente implica que los informáticos sepan programar sino necesitan de otras habilidades como tener una.
Optimización Combinatoria usando Algoritmos Evolucionistas Problemas de Optimización. Idea: Encontrar una solución "factible" y "óptima" de acuerdo a algún.
Aprendizaje Automático en Bioinformática
Flujo de carga en Sistemas de Potencia.
ANÁLISIS DE CONGLOMERADOS
Análisis y Diseño de Algoritmos. Propiedades : f ( n )  O ( f ( n ) ) a ) O ( f ( n ) )  O ( g ( n ) )  f ( n )  g ( n )
Optimización, Búsqueda Heurística
Algoritmos.
Estructura de Datos II Equipo 4 Equipo 7 Acosta Montiel Miguel A.
Programación IMC José Andrés Vázquez Flores. Definición Un arreglo es un conjunto finito e indexado de elementos homogéneos, que se referencian por un.
Complejidad de los problemas de decisión
Sesión 6: Campos de Markov
ANÁLISIS DE CONGLOMERADOS
Análisis de Conglomerados (Cluster Analysis)
Computacion inteligente Clustering Fuzzy. 2 Contenido  Conceptos basicos  Tipos de clustering  Tipos de Clusters  La tarea del clustering  Nociones.
Computacion inteligente
complejidad de un problema.
METODOS DE BUSQUEDA INFORMADOS CAPITULO 5
MÉTODO DE PIXELES DE BORDE
EXPERIMENTACIÓN NUMÉRICA
GRÁFICOS ESTADÍSTICOS
Definición de grupos: clasificación Capítulos 10 y 11 de McCune y Grace 2002.
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería Maestría en Ingeniería Eléctrica.
Escalamiento Multidimensional No-Métrico Capítulo 16 de McCune y Grace 2002.
CARPLATE Reconocimiento del marco de la matrícula de un coche
Una introducción a la computación evolutiva
PROBLEMAS DE SATISFACCIÓN DE RESTRICCIONES
Clase # 7: Análisis Conformacional (I)
Sabemos reconocerlas, y calcularlas como soluciones de sistemas de ecuaciones, o de desigualdades Buscamos métodos de cálculo generales y eficientes Problemas.
Capa de Red4-1 Capítulo 4: Capa de Red  4. 1 Introducción  4.2 Circuitos virtuales y redes de datagramas  4.3 ¿Qué hay dentro de un router?  4.4 IP:
1 Condiciones de extremo Proceso para derivar las condiciones De problema más simple a más complejo Progresión de problemas: Problema sin restricciones.
Asignación de Horarios
Universidad Nacional del Nordeste Facultad de Humanidades CARRERA DE ESPECIALIZACION TECNOLOGIAS DE LA INFORMACION GEOGRAFICA (TIG) Resoluciones 511/10-CS.
Investigación Algorítmica ChasquiSoft. Integrantes Contreras Ames, Roy Carlos Gaspar Calle, Ronald Urlich Ames, Rafael Paredes.
Escalamiento Multidimensional No-Métrico. Rasgos generales Busca las mejores posiciones de n objetos en un espacio de k dimensiones que se asemejen más.
Taller: Inteligencia Computacional
INFERENCIA ESTADÍSTICA
Computacion inteligente Clustering Fuzzy. 2 Contenido  Conceptos basicos  Tipos de clustering  Tipos de Clusters  La tarea del clustering  Nociones.
El proceso de diseño de sistemas: el paradigma de los sistemas
Clustering Pablo Palacios 1.  Introducción  Clasificación de Clustering  Clusters de particionamiento ◦ N-means  Clusters difusos ◦ GFN-means ◦ Gath-Geva.
Gestión de Memoria – Parte 2
Transcripción de la presentación:

Búsqueda de Aproximaciones: Algoritmos Taller de Base de Datos Búsqueda de Aproximaciones: Algoritmos Basados en centroides Jerárquicos: aglomerativos o divisivos

Algoritmos Basados en Centroides Taller de Base de Datos Algoritmos Basados en Centroides El problema tiene la siguiente definición: -Buscar k grupos de los datos que maximicen una función de evaluación que usa alguna noción de centroide Problema de búsqueda en hasta aprox. Mk posibles agrupaciones. Búsqueda exhustiva no es factible, problema NP--hard. Heurística general de estos algoritmos : Reubicación Iterativa

Algoritmo K-Means Taller de Base de Datos Elegir k objetos (semillas) como centroides de los grupos. Asignar los objetos al grupo cuyo centroide esté más cerca. Recalcular los centroides Reasignar cada objeto al grupo cuyo centroide sea más cercano. Así sucesivamente hasta que la calidad de la agrupación sea aceptable c.r.a función de evaluación aceptada.

Funciones de Evaluación en K-means Taller de Base de Datos Funciones de Evaluación en K-means Varianza intra-grupo W(C) donde C={C1,...,Ck} y mi es el centroide del grupo i: Varianza inter-grupo B(C): Función de evaluación: Problema: incluso si fijamos k, F(C) nos puede llevar a una mala agrupación

Taller de Base de Datos Costo de K-Means Complejidad O(kmdI), donde: -I es el número de iteraciones, -m el número de objetos, -d es el costo de computar una distancia (depende del número de dimensiones) Si la base de datos no cabe en RAM tenemos que hacer I lecturas de la base de datos.

Taller de Base de Datos Cómo Determinamos k? K F(C) 1 100 2 80 3 60 4 50 6 46 .. ..

Taller de Base de Datos Variantes K-Modes: espacios con variables categóricas. K-Medoid: utiliza el objato mas central en lugar del centroide -Más robusto ante ruido pero más costoso. Fuzzy K-Means

Taller de Base de Datos Fuzzy K-Means Dunn y Bezdek 1981. Un objeto puede pertenecer a distintos grupos, con grados de pertenencia. Definir semillas para grupos iniciales En una iteración, encontrar el grado de pertenencia U(x, Cj) de cada objeto a x a cada grupo Cj, por ejemplo: Recalcular los centroides ponderando para cada punto por su grado de pertenencia al grupo.

Taller de Base de Datos Problemas de K-Means Converge a un mínimo local: la elección de la semilla es clave. - Ejecutar con distintas semillas. - Usar técnicas de optimización. Sólo opera en espacios euclidianos. Se necesita noción de centroide. Encuentra agrupaciones esféricas - No funciona para agrupaciones con forma de cadenas de puntos

Algoritmos Jerárquicos Taller de Base de Datos Algoritmos Jerárquicos Objetivo: generar un dendograma o jerarquía de grupos. Algoritmos Aglomerativos: Inicialmente cada punto es un cluster En cada paso juntamos pares de clusters más cercanos. Sucesivamente hasta agrupar todo.

Criterios para Determinar Fusiones Taller de Base de Datos Criterios para Determinar Fusiones Single-Link: la distancia entre dos grupos es igual a la distancia entre sus puntos más cercanos. -útil para detectar cadenas. -Sensible a pequeñas perturbaciones en los datos -Propiedad: el orden en que se producen las fusiones no altera el resultado final. Complete-Link: la distancia entre dos grupos es igual a la distancia entre sus puntos más lejanos. - Tiende a generar grupos que ocupan volúmenes similares. Optros criterios:cualquier medida de distancia inter-grupos

Algoritmos Aglomerativos Taller de Base de Datos Algoritmos Aglomerativos Ventajas: No existe noción de función de evaluación global. No requiere espacio euclidiano, sólo necesitamos distancias. Desventajas: El costo.

Complejidad Algoritmos Aglomerativos Taller de Base de Datos Complejidad Algoritmos Aglomerativos En la iteración i hay que encontrar los pares de grupos más cercanos. Existen muchos métodos para definir la distancia entre grupos, pero todos ellos necesitan al menos combinarlos pares de grupos, lo que toma O(m2) como mínimo. El número de iteraciones es log m por lo que el algoritmo toma O(m2log m)