Multiclasificadores para minería de datos Cèsar Ferri 1 1 Dep. de Sistemes Informàtics i Computació,Universitat Politècnica de València,València, Spain.

Slides:



Advertisements
Presentaciones similares
SISTEMAS DE INFORMACIÓN I
Advertisements

Ciclo de Vida de Desarrollo de los Sistemas de Información
Jacqueline Chávez Cuzcano
Técnicas de Grupo Nominal
Algoritmos de Minería Los métodos básicos.
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
D ATA M INING Mª José Ramírez (DMIP) Índice Presentación Líneas de Investigación DMIP Negociación basada en Minería de Datos.
El proceso de extracción de conocimiento
Guia Diseño Robert Echeverria
Estructura Curricular: Sistema de Conceptos Empleados
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Métodos clasificación
Introducción a la Computación
PROBABILIDAD Y ESTADÍSTICA PARA CEA MTRA. MA. DEL CARMEN LÓPEZ MUNIVE
METODOLOGIA DE LA PROGRAMACION
CLASIFICACIÓN DE COMPUTADORAS
El Perceptrón  El psicólogo Frank Ronsenblant desarrolló un modelo simple de neurona basado en el modelo de McCulloch y Pitts que utilizaba.
ANALISIS SINTACTICO El análisis gramatical es la tarea de determinar la sintaxis, o estructura, de un programa. Por esta razón también se le conoce como.
REDES NEURONALES ARTIFICIALES
¿Por qué comparar y qué comparar?
MODULO MATERIALES DIDACTICOS
Algoritmos Bayesianos Karina Figueroa. Preliminares Aprendizaje ◦ cuál es la mejor hipótesis (más probable) dados los dato? Red Bayesiana (RB) ◦ Red de.
Sesión 2: Métodos Probabilísticos Básicos
Red Maestro de Maestros
10 ideas Clave. Evaluar para aprender Neus Sanmartí
EMPLEAR COMO DISEÑO UNA FRACCION FACTORIAL
 El primer navegador Web incluía un lenguaje de estilo interno que utilizaba dicho navegador para mostrar las páginas HTML.  Sin embargo estos primeros.
Actividad 6. Requisitos del software, referente a la estructura y base de datos. M.C. Juan Carlos Olivares Rojas Syllabus May,
1 Problema no separable linealmente Se busca obtener un algoritmo más general que permita integrar el aprendizaje entre las dos capas.
 Los sistemas de control según la Teoría Cibernética se aplican en esencia para los organismos vivos, las máquinas y las organizaciones. Estos sistemas.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
3. Funciones discriminantes para la f.d.p normal.
UNIVERSIDAD NACIONAL INTERCULTURAL DE LA AMAZONIA
TOPICOS DE ECONOMETRIA APLICADA Variables dependientes limitadas
Combinación de Clasificadores
Evaluación de los Aprendizajes
Red de Minería y Aprendizaje Grupo de Aprendizaje Automático Universidad de Oviedo en Gijón Selección de Atributos en Aprendizaje.
Redes Competitivas.
REDES NEURONALES.
Capítulo 8 Análisis de Usabilidad y Inspección
Aprendizaje en Árboles de Decisión
Temas a considerar en la enseñanza de la lectura y la escritura. Desarrollo del lenguaje oral. Objetivos: Enriquecer el lenguaje oral. Desarrollar e incrementar.
Deds Funciones kernel en espacios discretos. Aplicación a la evaluación del riesgo de crédito* La tesi que presentem a continuacio titulada: “Estructures.
Introducción a las Ciencias Computacionales
ALGORITMOS La palabra algoritmo se deriva de la traducción al latín de la palabra árabe alkhowarizmi, nombre de un matemático y astrónomo árabe que escribió.
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS

TEMA 3 LA FUNCIÓN PRODUCTIVA.
Diseño de Combinacionales. Diseño Combinacional El diseño consiste en crear un sistema que cumpla con unos requerimientos establecidos, siempre tratando.
10 IDEAS CLAVE. EVALUAR PARA APRENDER”
Las Pruebas del Software y sus Fundamentos
Medición y Métricas del Software
Capitulo 1: “La ciencia en las ciencias sociales”
Entendiendo las partes
Fundamentos de Sistemas Expertos
PRESENTADO POR: LINA MARCELA IGUA TORRES SONIA MOYANO ESPINOSA DAVID MAHECHA MEDINA CRISTIAN HERNÁNDEZ GERMAN RAMÍREZ.
Clasificación Computador
Métodos cuantitativos Construcción y validación de instrumentos en Salud Pública.
PRESENTADO POR: MARIO ALBERTO MEDINA CORTEZ ACTIVIDAD DE APROPIACION.
Aplicación JAVA implementando Arboles de Decisión
SQL Server Integration Services SSIS
ELABORADO POR: MABEL LORENA MARIN   Se define como una familia de comunicación usada por los computadores que conforman una red para intercambiar.
Un requerimiento es una condición o capacidad a la que el sistema (siendo construido) debe conformar [ Rational ]. Un requerimiento de software puede.
INFERENCIA ESTADÍSTICA
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.


Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
TIPOS DE ALGORITMO DE APRENDIZAJE Aprendizaje Supervisado Aprendizaje no Supervisado Aprendizaje por Refuerzo.
Transcripción de la presentación:

Multiclasificadores para minería de datos Cèsar Ferri 1 1 Dep. de Sistemes Informàtics i Computació,Universitat Politècnica de València,València, Spain Reunión red minería de datos Madrid 2004

2 Métodos Multiclasificadores zMétodos que construyen un conjunto de hipótesis y entonces combinan las predicciones del conjunto.

3 Métodos Multiclasificadores zLa precisión obtenida por esta combinación de hipótesis supera, generalmente, la precisión de cada componente individual del conjunto. ySubsana el problema del sobreajuste de los datos de entrenamiento. yCombinar hipótesis puede verse también como un incremento en el poder expresivo del lenguaje de representación.

4 Métodos Multiclasificadores zLa calidad del modelo combinado depende en alto grado de la precisión y diversidad de los componentes del conjunto dado un conjunto de clasificadores {h 1, h 2, h 3 } y un nuevo dato x w h 1  h 2  h 3 si h 1 (x) es incorrecto, h 2 (x) y h 3 (x) también lo serán w h 1  h 2  h 3 si h 1 (x) es incorrecto, h 2 (x) y h 3 (x) pueden ser correctos

5 Métodos Multiclasificadores z Los dos puntos clave que afectan la calidad final de un modelo multiclasificador son principalmente: yLa construcción de modelos lo suficientemente diferentes y precisos. yLa forma de combinación de los modelos.

6 Métodos ensemble zEstos métodos construyen un conjunto de hipótesis utilizando una sola técnica de aprendizaje.

7 Métodos híbridos zTécnicas de aprendizaje formadas por partes de otras técnicas de aprendizaje básicas

8 Métodos de construcción de métodos ensemble z Dietterich ha establecido una taxonomía de métodos de construcción de conjuntos de clasificadores o regresores: yManipulación de los datos de entrenamiento yManipulación de los atributos de entrada yManipulación de los datos de salida yMétodos aleatorios

9 Problemas de los métodos multiclasificadores zAlto consumo de recursos para entrenar el conjunto de modelos zNecesidad de almacenar todos los modelos del conjunto zIncremento considerable del tiempo de respuesta (throughput) zPérdida de la comprensiblidad del modelo

10 Algunas soluciones zPodar el ensemble yMiniboosting (Quinlan) yPruning Adaptative Boosting (Margineantu & Dietterich) zUtilización de estructuras que compartan las partes comunes entre los modelos (multi- árboles)

11 Extracción de reglas comprensibles zMétodo Combined Multipled Models (Domingos 1997)

12 Delegating Classifiers z(Ferri, Flach, Hernández 2004)