Aprendizaje Automatizado

Slides:



Advertisements
Presentaciones similares
Búsqueda en árboles de juego
Advertisements

Introducción a las Redes neuronales
DATA MINING MINERIA DE DATOS Gersom Costas.
Algoritmos de Minería Los métodos básicos.
Silvana Arias Carla Espinosa Livia Loaiza INGENIERIA EN SISTEMAS
K-NN: K vecinos más cercanos
PROYECTO DE GRADO CARLOS STALIN ALVARADO SANCHEZ
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
Inteligencia Artificial Adquisición automática del conocimiento
Inteligencia Artificial (BAIA)  Se propone lograr que las computadoras se comporten de manera que podamos reconocerlas como inteligentes.  Tiene por.
REDES NEURONALES ARTIFICIALES
Representación del Conocimiento
Aprendizaje Automatizado
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Algoritmo ID3.
Sesión 2: Métodos Probabilísticos Básicos
CÁLCULO DE PROBABILIDADES
LENGUAS ELECTRÓNICAS.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Aprendizaje Automatizado Ár boles de Clasificación.
Aprendizaje (Machine Learning)  Pregunta interesante: Podemos hacer que las computadoras aprendan?  Aprender: mejorar automáticamente con la experiencia.
Sistemas Inteligentes Distribuidos Sistemas Inteligentes Distribuidos Sesión 13 L. Enrique Sucar / Marco López Sesión 13 L. Enrique Sucar / Marco López.
Aprendizaje en Árboles de Decisión
Aprendizaje Automatizado
Redes Neuronales Artificiales 2 - Aprendizaje
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
Sistemas Expertos Integrantes Javier Farfán Katherine Jara Héctor Gatica.
POO U1: INTRODUCCIÓN AL PARADIGMA DE LA PROGRAMACIÓN ORIENTADA A OBJETOS.
Aprendizaje Automatizado Caso de Estudio. Problema a resolver (I)
REDES NEURONALES TEORÍA MODERNA DE LA FIRMA 2010.
MEDIDAS DE TENDENCIA CENTRAL
Aplicación JAVA implementando Arboles de Decisión
Ramas de I.A. ROBOTICA SISTEMAS DE VISION SISTEMAS EXPERTOS
Técnicas de Minería de Datos Centro Universitario Valle de México Minería de Datos Dra. Maricela Quintana López Elaborado por:
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.

INTRODUCCIONHISTORIAQUE ES UN PLCELEMENTOS VENTAJAS TIPOSCONCLUSIONESREFERENCIAS.
2-1 2 Gráficos,Tablas y Diagramas – Describiendo los datos.
Support Vector Machines.  Vocabulario básico: ◦ Repositorio de datos ◦ Atributos y Instancias ◦ Aprendizaje supervisado  Clasificación (Clase) ◦ Aprendizaje.
La Investigación Científica
REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.
Digitalización de la información. La digitalización consiste en la transformación de la información analógica, propia de la naturaleza en información digital.
PROYECTO DE MODERNIZACION ¿Que es Un Indicador?
VARIABLE ALEATORIA Y DISTRIBUCIÓN NORMAL
PERSONALIDAD Y COMPORTAMIENTO DEL CONSUMIDOR
Seminario de Tesis/ina
“unas buenas herramientas no hacen que un profesor sea excelente, pero un excelente profesor si puede emplear bien las herramientas” E NSEÑANZA G ESTIONADA.
Clase II Estructuras dinámicas (TAD) Listas Enlazadas. ¿A que llamamos estructuras dinámicas? ¿Por qué son necesarias? Ventajas y Desventajas que tendremos.
EN EL INFRAMUNDO.  Logicly, simulador online de circuitos basado en puertas lógicas.  Sitio donde obtener el software : Try Online – Logicly y para.
RECONOCIMIENTO DE PATRONES Domingo Mery Capítulo 1 Material de apoyo DEPARTAMENTO DE CIENCIA DE LA COMPUTACIÓN – UNIVERSIDAD CATÓLICA DE CHILE (2006)
Active Atlas: Una herramienta de coreferenciación de objetos en la Web Antonio Carlos Maraver Martín.
Ing. Leticia de la Torre González ESTADISTICA DESCRIPTIVA.
Estadística I.
Diagramas UML Richard Mora Republica Bolivariana de Venezuela Ministerio del poder popular para la educación I.U.T. Antonio José de Sucre Barquisimeto,
? ISO/IEC 9126 ISO/IEC Descripción del estándar.
Universidad Autónoma del Estado de México Plantel “Nezahualcóyotl” Material de apoyo para la asignatura de Álgebra y trigonometría CBU 2009 Solo visión.
 Objetivo: Comprender conceptos y procedimientos de la estadística básica y los aplica para interpretar y transmitir diversas informaciones del entorno.
Carlos A. Andújar Rojas, Ph.D. 1. Razonamiento estadístico  Es el proceso por el que se utiliza la lógica para tratar de describir, explicar, predecir.
Representación en espacio de estado
Rodrigo Ferrer Urbina Universidad de Tarapacá.  ¿Qué es? ◦ Un conjunto de procedimientos.  ¿Qué hacen? ◦ Resumir y organizar información.  ¿Para que?
Redes Neuronales Artificiales (ANN)
SANDRA MILENA VEGA.  Es una ciencia que estudia una serie de datos y trata de extraer conclusiones sobre el comportamiento de estas variables Ejemplo;

Mercados financieros artificiales CÓMPUTO EVOLUTIVO Y BIOINSPIRADO Y SU CAMPO DE APLICACIÓN, IIMAS. DANYA ANAHID ESQUIVEL MORALES 20 DE MARZO DE 2015.
Curso: Metodología de la Investigación – Semana 6.
Por: Valentina Pérez Oyuela 11ª.  El entorno social, depende mucho de los datos cuantitativos, las matemáticas nos dan herramientas para interpretar.
Por José R. Rodríguez Ríos PROG2300. gráfica Una gráfica es una manera de representar información que relaciona datos cuantitativos y/o cualitativos mediante.
Con apoyo y asesoría del MAESTRO
1 Lenguaje de Programación Clase 1 Alberto Huamani Escobar
LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar.
Transcripción de la presentación:

Aprendizaje Automatizado

Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto de ejemplos clasificados o etiquetados). APRENDIZAJE SUPERVISADO. Mediante exploración autónoma (ej. software que aprende a jugar al ajedrez mediante la realización de miles de partidas contra sí mismo). APRENDIZAJE NO SUPERVISADO.

Tipos de Aprendizaje Aprendizaje inductivo. Aprendizaje deductivo. Datos de entrada específicos: un usuario provee un subconjunto de todas las posibles situaciones. Datos de salida generales: regla o modelo que puede ser aplicada a cualquier situación. Aprendizaje deductivo. Se basa en una especialización. Aprendizaje por refuerzo. Sistemas que aprenden mediante prueba y error. Exploración autónoma para inferir reglas de comportamiento.

Aprendizaje Inductivo El objetivo es generar un modelo a partir de ejemplos. El conjunto de ejemplos usados se llama conjunto de entrenamiento. Cuatro elementos fundamentales: hipótesis (modelo resultante), instancias, atributos y clases.

Definiciones Resultado: modelo que se infiere a partir de los ejemplos (también llamado hipótesis). Instancia: cada uno de los ejemplos. Atributo: cada una de las propiedades que se miden (observan) de un ejemplo. Clase: el atributo que debe ser deducido a partir de los demás.

Ejemplo Modelado de la probabilidad de fallo de una máquina. Clases: la máquina fallará / la máquina no fallará. Atributos: Temperatura. Nivel de vibraciones. Horas de funcionamiento. Meses desde la última revisión.

Ejemplo Instancias: ejemplos pasados (situaciones conocidas). [Temp = alta, Nivel vibrac. = bajo, horas = 800, meses = 2, fallo = SÍ] Resultado: relación entre las medidas y la clase resultante. SI nivel_vibraciones = alto Y temp = alta ENTONCES fallará.

Atributos Hay múltiples tipos de atributos: Real: puede tomar cualquier valor dentro de un cierto rango. Ej. temperatura como un número real [grados]. Discreto: Ej. horas de funcionamiento como un número natural. Categórico: Ej. color como {azul, rojo, amarillo} Se puede pensar como 'discreto no ordenado'.

Resultados Las hipótesis se pueden expresar de diversas formas: Árboles de decisión. Listas de reglas. Redes neuronales. Modelos bayesianos o probabilísticos. Etc.

Árboles de Decisión (I) Ejemplo: modelado de la probabilidad de fallo de una máquina.

Árboles de Decisión (II) Compuestos de nodos y ramas. Representan reglas lógicas (if - then). Nodos internos = atributos. Nodos hoja = clases. Nodo raíz = nodo superior del árbol. Objetivo en aprendizaje automatizado: Obtener un árbol de decisión (resultado) a partir de un conjunto de instancias o ejemplos.

Árboles de Decisión (III) Ejemplo de un conjunto de entrenamiento.

Árboles de Decisión (IV) Crearemos un árbol a partir de los ejemplos de entrenamiento anteriores. ¿Qué atributo elegir para el primer nodo?

Árboles de decisión (V) Árbol construido hasta el momento: ¿Qué atributo usamos en el siguiente nivel del árbol (rama izquierda)?

Árboles de decisión (VI) Sólo aquellos ejemplos de entrenamiento que llegan al nodo (nivel_vibracion = alto) se utilizan para elegir el nuevo atributo:

Árboles de decisión (VI) Árbol construido hasta el momento: ¿Qué atributo usamos en el siguiente nivel del árbol (rama derecha)?

Otros modelos Los árboles de decisión son sólo uno de los posibles modelos. Dependiendo de la aplicación se deberá elegir un modelo u otro. A continuación se indican algunos criterios para elegir modelos.

Criterios de selección del modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales, modelos probabilísticos, etc.) El algoritmo utilizado para construir o ajustar el modelo a partir de las instancias de entrenamiento (existen varias maneras de construir árboles de decisión, varias maneras de construir redes neuronales, etc.)

Selección del modelo y/o algoritmo Capacidad de representación. Legibilidad. Tiempo de cómputo on-line. Tiempo de cómputo off-line. Dificultad de ajuste de parámetros. Robustez ante el ruido. Sobreajuste. Minimización del error.

Selección del modelo y/o algoritmo Capacidad de representación (I) Relacionado con el tipo de fronteras de decisión que se pueden expresar. Fronteras de decisión: separación de clases distintas. Cada modelo crea diferentes fronteras.

Selección del modelo y/o algoritmo Capacidad de representación (II) Ejemplo con sólo dos atributos: Árboles de decisión: fronteras perpendiculares a los ejes

Selección del modelo y/o algoritmo Capacidad de representación (III) Redes Neuronales (NN), fronteras no lineales: Mayor capacidad de representación. Permiten representar conceptos más complejos que los árboles de decisión. Se estudiarán más adelante.

Selección del modelo y/o algoritmo Legibilidad (I) Capacidad de ser leído e interpretado por un humano. Árboles de decisión: fáciles de entender e interpretar: conjunto de reglas. en los niveles más altos están los atributos más importantes. Redes neuronales: difíciles (o imposibles) de interpretar: - pesos de conexiones entre neuronas.

Selección del modelo y/o algoritmo Legibilidad (II) Un modelo legible puede ofrecer información sobre el problema que se estudia (ej. indicar qué atributos afectan la probabilidad de fallo de una máquina y cómo). Un modelo no legible sólo puede ser usado como un clasificador (ej. permite predecir si una máquina fallará o no aplicando el modelo).

Selección del modelo y/o algoritmo Tiempo de cómputo on-line (I) Es el tiempo necesario para clasificar una instancia: Árboles de decisión: tiempo necesario para recorrer el árbol, evaluando las funciones lógicas de cada nodo. Redes neuronales: tiempo necesario para realizar las operaciones (sumas, productos, sigmoides) incluidas en la red.

Selección del modelo y/o algoritmo Tiempo de cómputo on-line (II) Este tiempo se consume cada vez que se debe clasificar una nueva instancia. Algunas aplicaciones requieren clasificar miles de instancias. Ejemplo: clasificación de cada uno de los píxeles de una imagen aérea de un cultivo, río, ruta, etc. Se requiere clasificar millones de instancias. El tiempo de cómputo es muy importante.

Selección del modelo y/o algoritmo Tiempo de cómputo off-line (I) Es el tiempo necesario para construir o ajustar el modelo a partir de los ejemplos de entrenamiento. Árboles de decisión: tiempo necesario para elegir la estructura del árbol, los atributos a situar en cada nodo y la optimización mediante la poda. Redes neuronales: tiempo necesario para ajustar los pesos de las conexiones (puede tomar valores muy grandes).

Selección del modelo y/o algoritmo Tiempo de cómputo off-line (II) Sólo se consume una vez, cuando mediante la utilización de los ejemplos de entrenamiento se genera y selecciona el resultado (modelo o hipótesis) más adecuado. Dependiendo de la aplicación no es un problema que el tiempo de cómputo off-line sea elevado (se deja una computadora procesando uno o tres días enteros).

Selección del modelo y/o algoritmo Dificultad de ajuste de parámetros Se prefieren los algoritmos con pocos (o ninguno) parámetros que ajustar. Se prefieren algoritmos con muy poca sensibilidad a la modificación de sus parámetros. Hay modelos muy difíciles de ajustar mediante parámetros (puede ocurrir con redes neuronales).

Selección del modelo y/o algoritmo Robustez ante el ruido Instancia de entrenamiento ruidosa: etiquetada incorrectamente (ejemplo: una máquina que no falló, etiquetada como que sí falló). algún atributo no está valorizado. Algunos algoritmos pueden funcionar adecuadamente aunque haya instancias ruidosas en el conjunto de entrenamiento (ej. árboles de decisión, redes neuronales). Otros algoritmos no ofrecen buenos resultados (ej. k-vecinos más cercanos).

Selección del modelo y/o algoritmo Sobreajuste (overfitting). (I) Problema muy común. El modelo está demasiado ajustado a las instancias y no funciona adecuadamente con nuevos casos. El modelo no es capaz de generalizar. Normalmente, fronteras de decisión muy complejas producen sobreajuste.

Selección del modelo y/o algoritmo Sobreajuste (overfitting). (I) Ejemplo con dos atributos:

Selección del modelo y/o algoritmo Minimización del error Ejemplo: Resultados arrojados para el problema de clasificar los datos de Contraceptive Method Choice (CMC), con diferentes métodos. Árboles de decisión Redes neuronales Naive-Bayes con normales Naive-Bayes con histogramas k-primeros vecinos Medias 26.41 23.711339 33.9851806 25.4706348 26.094287 Desviaciones estándar 2.96739691 4.40077215 4.67207077 3.70521908 3.50755602

Selección del modelo y/o algoritmo ¿Cuáles de los criterios anteriores se relacionan con la selección del modelo? ¿Cuáles de los criterios anteriores se relacionan con la selección del algoritmo? ¿Y con ambos? ¿Cuáles de los criterios anteriores se relacionan entre sí?

Bibliografía Machine Learning - Tom Mitchell – McGrawHill Curso de doctorado "Aprendizaje Automatizado y Data Mining" Grupo de Ingeniería de Sistemas y Automática (Universidad Miguel Hernández) http://isa.umh.es/asignaturas/aprendizaje/index.html