Aprendizaje no Supervisado: Clustering

Slides:

Advertisements

Presentaciones similares

Mapa de Posiconamiento Material Preparado por Samuel Ñanco S.

Advertisements

Dra. Rocío C. Romero Zaliz

K-Means Integrantes Natalia Merino (85828) Gastón Sabatelli (85523)

MODELO DE REGRESIÓN MÚLTIPLE

SUPPORT VECTOR MACHINE SVM

K-Means Integrantes Natalia Merino (85828) Gastón Sabatelli (85523)

Modelo Relacional Base de Datos I.

RECONOCIMIENTO DE OBJETOS

Clustering (Agrupamiento)

Observación: Las diapositivas son sólo una herramienta para trabajar en clase (están diseñadas para corregir y completar en clase) de ninguna manera pueden.

APRENDIZAJE WIDROW- HOFF

FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.

RECONOCIMIETO DE PATRONES

Representación del Conocimiento

Profesor: Julio Canales

Sesión 2: Métodos Probabilísticos Básicos

Aprendizaje Automático en Bioinformática

Sesión 4: Métodos Probabilísticos Básicos “... tenemos razones para creer que hay en la constutución de las cosas leyes de acuerdo a las cuales suceden.

Universidad Domingo Savio Facultad de Ciencias y Tecnología de la Información Carrera Ingeniería en Redes y Telecomunicaciones Materia : Programación I.

Business Intelligence y Data Mining

Aplicaciones de las Redes Neuronales Artificilaes Dr. Héctor Allende

Análisis de Conglomerados (Cluster Analysis)

Computacion inteligente Clustering Fuzzy. 2 Contenido  Conceptos basicos  Tipos de clustering  Tipos de Clusters  La tarea del clustering  Nociones.

Combinación de Clasificadores

J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática Universidad de Sevilla.

Redes Competitivas.

ELVIRA II -- Granada’03 TRABAJO REALIZADO POR EL GRUPO I.S.G. (UPV-EHU) Junio’02  Mayo’03.

Técnicas Supervisadas Aproximación no paramétrica Reconocimiento de Patrones 2003 Notas basadas en el curso Reconocimiento de Formas de F.Cortijo, Univ.

Proceso KDD MSc. Carlos Alberto Cobos Lozada

Intelligent Systems Group U.P.V. / E.H.U. APORTACIONES EN EL SOFTWARE ELVIRA: MAYO’03-MAYO’04 GRUPO ISG, UPV-EHU Donostia, 14-V-2004.

Inferencia Estadística

Matrices Departamento de Computación Escuela de Ingeniería de Sistemas

Clustering de Pixels basado en el Modelo El nivel de expresión de un gen es proporcional a las intensidades de los pixels de un spot. Los pixels de un.

Mapping the forest types and landcover of Puerto Rico. Lo discutiremos pronto. Lo consiguen en el portal del curso.

Inferencia Multivariante Cap 10 y 11

Estimación de modelos ARMA

BioInformática Una nueva ciencia Interdisciplinar Norberto Díaz Díaz Bioinformatics Group of Seville (BIGS) Dpto. de Lenguajes y Sistemas Informaticos.

Introducción al Biclustering

Analisis de datos en imagenes hiperespectrales: intro 1 Analisis de datos hiperespectrales: otra revisión Hyperespectral image data analysis, D. Landgrebe,

Aprendizaje No Supervisado y Redes de Kohonen

Nieves Ábalos Serrano Mª Teresa Jiménez Ramírez

Complementos de Procesado de Señales y Comunicaciones

SISTEMA PARA LA CATEGORIZACIÓN AUTOMÁTICA DE CORREO ELECTRÓNICO Camilo Rodríguez, Departamento de Ingeniería de Sistemas, Universidad Nacional de Colombia.

Identificación de Sistemas El problema de la Identificación de Sistemas.

Donuts, Scratches and Blanks: Robust Model-Based Segmentation of Microarray Images Qunhua Li, Chris Fraley, Roger E. Bumgarner, Ka Yee Yeung, Adrian E.

Taller Europeo de la Red Eureka Investigación en Minería de Datos José C. Riquelme Universidad de Sevilla Granada, 7 y 8 de Julio.

Sistemas Expertos Integrantes Javier Farfán Katherine Jara Héctor Gatica.

UNIVERSIDAD TECNOLÓGICA ECOTEC. ISO 9001:2008 Estadística EJERCICIO EN CLASE I TABLA DE FRECUENCIA.

DEFINICION  Las bases de datos son una colección organizada de información dividida en campos los cuales nos proporcionan datos detallados e individuales.

Primer examen: martes 5 de marzo. Procesamiento de imágenes digitales para generar mapas temáticos Páginas del Manual de Idrisi.

DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.

Mapping the forest types and landcover of Puerto Rico. Lo discutiremos pronto. Lo consiguen en el portal del curso.

Modelos ocultos de Markov (HMM)

Cooperación en POO Eliseo Melgarejo Desarrollo de sistemas Udec.

Procesamiento de imágenes digitales

Microsoft Office Project INTRODUCCIÓN A LA GESTIÓN DE PROYECTOS Microsoft Office Project 2010.

Informática " Universidad Privada de Trujillo FACULTAD DE INGENIERIA FACULTAD DE INGENIERIA ESCUELA PROFESIONAL DE INGENIERIA CIVIL UPT.

Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff.

Lab. 8: Métodos directos e iterativos para sistemas de Ec. lineares Algoritmos paralelos Glen Rodríguez.

Procesamiento de imágenes digitales para generar mapas temáticos Páginas del Manual de Idrisi.

 Una base de datos es una colección de información organizada de forma que un programa de ordenador pueda seleccionar rápidamente los fragmentos de datos.

Laboratorio Informática II Clase 9 Ejercicios. Ejercicio 1 Indique cuál es el Camino Crítico del siguiente Proyecto

BASE DE DATOS DISTRIBUIDAS Objetivo

BASE DE DATOS. NOMBRE: Paula Andrea Bedoya Rojas. GRADO: 7.3 Institución educativa Débora Arango Pérez.

Support Vector Machines.  Vocabulario básico: ◦ Repositorio de datos ◦ Atributos y Instancias ◦ Aprendizaje supervisado  Clasificación (Clase) ◦ Aprendizaje.

Extracción de conocimiento a partir de Recursos Digitales para el Aprendizaje Mtro. Alfredo Zapata González Escuela Superior de Informática.

Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.

Unsupervised visual learning of three-dimensional objects using a modular network architecture Ando, Suzuki, Fujita Neural Networks 12 (1999)

Transcripción de la presentación:

Aprendizaje no Supervisado: Clustering Norberto Díaz Díaz Bioinformatics Group of Seville (BIGS) Dpto. de Lenguajes y Sistemas Informaticos Universidad de Sevilla

Jerárquico: CobWeb, FarthestFirst Tabla de Contenidos Introducción Clustering Jerárquico: CobWeb, FarthestFirst Basado en Particiones: K-means Algoritmo EM

Introducción Aprendizaje Supervisado (Clasificación) El conjunto de datos contiene un atributo que “guía” el aprendizaje (clase). Clasificadores: K-NN (IBk), C4.5 (J48)… Aprendizaje Semi-Supervisado Algunos ejemplos tienen clase y otros no. Aprendizaje No Supervisado (Clustering-Biclustering) No existe atributo clase.

El clustering solo actua bajo una dimensión. Objetivo: crear conjunto de elementos los cuales tengan alguna característica común. Crear conjuntos de genes según su expresión bajo condiciones experimentales. Crear conjuntos de condiciones según la expresión de los genes de un genoma. filas columnas El clustering solo actua bajo una dimensión.

Clustering Jerárquico - Algoritmo Se basa en descomponer jerárquicamente el conjunto de datos de entrada

Clustering Jerárquico - Ejemplo Partición recursiva de los datos 1 2 3 4 5 1-clustering 2-clustering 3-clustering 4-clustering 5-clustering 5 1 4 2 3

Clustering Jerárquico – CobWeb (en Weka)

Clustering Jerárquico – FarthestFirst (en Weka)

Clustering Basado en particiones: K-Medias Consiste en minimizar las distancias de los elementos de la partición y el centroide de ésta.

K-Medias: Ejemplo 1

K-Medias: Ejemplo online http://www.lsi.us.es/~ndiaz/proyectosFinCarrera.html http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/AppletKM.html

Kmedias – SimpleKMeans (en Weka)

Clustering EM (Expectation Maximization) Se basa en el modelo estadístico de Gauss: Estima parámetros por máxima verosimilitud Imputación de datos inexistentes El proceso es similar a K-means Los parámetros son recalculados hasta que los valores convergen Suele utilizarse para estimar la distribución de los datos a priori Esto puede verse en el algoritmo de clustering CLICK

Clustering EM - Weka

Ejercicio – Supervisado vs NoSupervisado ¿Quién consigue el mejor resultado para la base de datos “zoo.arf”, usando supervisado y no-Supervisado?

FIN