Tópicos en Inteligencia Artificial I Universidad Católica San Pablo.

Slides:



Advertisements
Presentaciones similares
Network Management – Recent Advances and Future Trends IEEE Journal on selected areas in Communications, Vol 6, No 4, May 1988 Héctor Manuel Lara García.
Advertisements

INTRODUCCION A TECNICAS DE MINERIA DE DATOS
Introducción a las Redes neuronales
Silvana Arias Carla Espinosa Livia Loaiza INGENIERIA EN SISTEMAS
Tratamiento de Imágenes por Computadora – Proyecto Final
PROYECTO DE GRADO CARLOS STALIN ALVARADO SANCHEZ
Fernando Paganini y Enrique Mallada Universidad ORT Uruguay IntegraTICS, 7 diciembre 2006 Optimización conjunta del ruteo multi-camino y el control de.
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
REINFORCEMENT LEARNING
Using Localised “Gossip” to Structure Distributed Learning Bruce Edmonds Centre for Policy Modelling Manchester Metropolitan University.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
APRENDIZAJE WIDROW- HOFF
El Perceptrón  El psicólogo Frank Ronsenblant desarrolló un modelo simple de neurona basado en el modelo de McCulloch y Pitts que utilizaba.
REDES NEURONALES ARTIFICIALES
Un Algoritmo Genético Mejorado para la Calibración de Modelos Hidrológicos CI71F – MODELACIÓN HIDROLÓGICA JAIME VERGARA A.
Fundamentos de Programación Matemática y Casos de Estudio en Economía.
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
INCORPORACIÒN DE LA SIMULACIÓN VÍA REDES NEURONALES COMO HERRAMIENTA DE UNIVERSALIZACIÓN DEL CONOCIMIENTO. M.Sc. Manuel Marqués 1*, Dr. Luis Oliva Ruiz.
Programación Básica con NQC Patricio A. Castillo Pizarro 11/08/2007.
Computacion Inteligente
Introducción Calculabilidad clásica Computación celular
TECNOLOGÍA UMB VIRTUAL
Redes Neuronales Monocapa
El Perceptrón Multicapa
Implementation of a Framework for Imitation Learning on a Humanoid Robot Using a Cognitive Architecture Robots Humanoides Centro de Automática y Robótica.
ADALINE — The Adaptive Linear Element
RECOMENDACIÓN, BÚSQUEDA, RANKING, APRENDIZAJE UNIVERSITAT OBERTA CATALUNYA CARLOTA VIÑA SIRGO.
Un ejemplo ilustrativo
Tipos de redes neuronales Perceptrón multicapa Redes de respuesta radial Competitivas Clasificación Mapa topológico.
Identificación de Sistemas
Integrantes: Daniel Peña Alfredo Zuñiga
PREVISIÓN DE SERIES TEMPORALES MEDIANTE REDES NEURONALES ARTIFICIALES
Aplicaciones de las Redes Neuronales Artificilaes Dr. Héctor Allende
Una estimación muy temprana de Tiempo y Esfuerzo requerido para el Desarrollo de Software mediante Redes Neuronales Pedro Salvetto (Universidad ORT, Montevideo)
Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Perceptrón Multicapa Aplicaciones. Perceptrón Multicapa MLP Latitud Longitud... Altitud Radiación solar Aproximación de funciones MLP Estado de un reactor.
Neuro-robótica: neurociencia, redes neuronales artificiales y robótica humanoide. ¿Ficción o futuro? Rosana Matuk.
Redes Competitivas.
REDES NEURONALES.
“ReTaskXML: Especificación de modelos de tareas a partir de especificaciones de interfaces de usuario Universidad de Castilla-La Mancha Escuela Politécnica.
Cúmulo de Partículas (Particle Swarm Optimization: PSO) Por: Antonio H. Escobar Zuluaga Universidad Tecnológica de Pereira - Colombia 2014 Optimización.
Redes Neuronales Artificiales 2 - Aprendizaje
Curso de Lógica Difusa Prof. José Edinson Aedo Cobo, Msc. Dr. Ing.
Redes Neuronales Artificiales 3 - Perceptrones Dr. Juan José Flores Romero División de Estudios de Posgrado Facultad de Ingeniería Eléctrica
Introducción Objetivos Desarrollo proyecto Resultados Publicaciones Trabajo futuro Publicaciones Revistas del Journal Citation Report (JCR): López, J.,
 Una supercomputadora o un superordenador es aquella con capacidades de cálculo muy superiores a las computadoras corrientes y de escritorio y que son.
Introduccion a las Redes de Funciones de Base Radial
Simulador de Atención de Accidentes Álvaro Sebastián Miranda Forero Diego Alberto Rincón Yáñez Maestría en Ingeniería de Sistema y Computación - MISyC.
Ing. Eduard Leonardo Sierra Ballén Seminario de Investigación I Semestre I de 2005 Maestría en Ingeniería - Ingeniería de Sistemas Facultad de Ingeniería.
SISTEMAS INTELIGENTES EN HARDWARE
Búsqueda P2P: Comunidades Semánticas
© Prof. Dr. François E. Cellier Principio de la presentación Modelado Matemático de Sistemas Físicos Febrero 5, 2008 Resolución Eficaz de Sistemas de Ecuaciones.
16/07/07Robótica Probabilista1 Un primer enfoque para solucionar el problema “Lost & Found” basada en PRM y localización local Josué Sánchez Texis.
Redes Neuronales BPN - Backpropagation Networks
Redes neuronales feed-forward
Optimización de Procesos.
Assessment en la sala de clases EDP COLLEGE OF PUERTO RICO, INC. Assessment Formativo Sumativo.
Identificacion con redes neuronales
Desde el principio de la humanidad se soñó con el desarrollo de máquinas que puedan imitar la capacidad de aprendizaje del hombre. Actualmente es un desafío.
Heurística. Los procesos que se llevan a cabo en el cerebro pueden ser analizados, a un nivel de abstacción dado, como procesos computacionales de algún.
Ángel Berihuete Francisco Álvarez
AUTORES: Miguel Angel Vera Antonio Bravo UNIVERSIDAD NACIONAL EXPERIMENTAL DEL TÁCHIRA DECANATO DE INVESTIGACIÓN I CONGRESO DE COMPUTACIÓN APLICADA San.
Redes Neuronales.
Por: Esteban Sepúlveda Orozco Estudiante MSc
Mecanismos de respuesta ante amenazas de seguridad en redes Department of Signal Theory, Telematics and Communications. University of Granada Granada,
OPTIMANDO FOIL: EXTRACCIÓN DE INFORMACIÓN. Índice  Introducción  Estrategias  FOIL  Optimizaciones  Resultados  Conclusiones.
Introducción a la Inteligencia Computacional y su Aplicación en la Ingeniería Dr.Youness El Hamzaoui Universidad Autónoma de Cd Juárez 1.
Unsupervised visual learning of three-dimensional objects using a modular network architecture Ando, Suzuki, Fujita Neural Networks 12 (1999)
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Transcripción de la presentación:

Tópicos en Inteligencia Artificial I Universidad Católica San Pablo

Abstract La interacción de humanos con robots hoy en día es un problema desafiante. Sin embargo es poco eficiente promover técnicas determinísticas en un mundo que no lo es. El presente trabajo aborda la combinación de técnicas para conseguir aprendizaje por refuerzo. La red Neuronal RBF será la plataforma. El algoritmo Sarsa(λ) basado en acciones y estados promoverá el criterio de selección. Finalmente el algoritmo de aprendizaje sobre la red será mediante Descenso de Gradiente.

Trabajos Relacionados Perceptron [8] de una sola capa; que solo puede separar linealmente dos grupos. Este ultimo ha sufrido variadas adaptaciones como la implementación de varias capas. MLP (multi layer perceptron) consta de muchas capas (neuronas) las cuales al ser ajustados sus pesos, pueden generar una división de clases no lineal. Rummery y Niranjan [11] proponen un algoritmo usando Q-Learning, y un algoritmo de Diferencia Temporal (TD). Los autores notan las limitaciones de los modelos de estados nitos de Markov. Prueban su estudio aplicándolo en la navegación de un robot en un ambiente con obstáculos.

El algoritmo SARSA (state-action-reward-state-action) es similar al Q-Learning, ya que se basa en estados y acciones. Sutton [12] usa el algoritmo SARSA en conjunto con CMAC para dar solucion a problemas con estados continuos. Las redes RBF (Radial Basis Functions) usadas por Huang et al. en [3] son ampliamente exploradas en varias aplicaciones. También los autores señalan un problema con estas redes, saber el numero ideal de funciones base. Si se escoge un numero muy pequeño, el resultado deseado será muy impreciso; por el contrario, un numero grande producirá mucha flexibilidad para los datos.

RBF Radial basis function

Sarsa State-action-reward-state-action Softmax

Descenso de Gradiente Optimización Matemática Mínimos Globales

Marco

Bibliografía [8] S. Dasgupta, A. Tauman, C. Monteleoni, Analysis of Perceptron-Based Active Learning, Journal of Machine Learning Research,vol 10, (2009), pp [11]G. Rummery, M. Niranjan, On-Line Q-Learning Using Connectionist Systems, Cambridge University Engineering Department, 1994, UK. [12] R. Sutton, Generalization in Reinforcement Learning: Successful Examples Using Sparse Coarse Coding, Advances in Neural Information Processing Systems, pp , [3] C. Huang, H. Wang, Data Construction Method for Basis Selection in RBF Networks, IEEE International Conference on Industrial Engineering and Engineering Management, pp , 2007, China.