1 Alumno: Javier Insa Cabrera Director: José Hernández Orallo 23 de septiembre de 2010.

Slides:



Advertisements
Presentaciones similares
¿PARA QUE ESTAMOS AQUÍ? LOS OBJETIVOS DE LA ENCARNACIÓN.
Advertisements

SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
el 1, el 4 y el 9 tres cuadrados perfectos autosuficientes
Resultado 2.2 con actividad 2.2.1
Porsche Latin America, Inc de junio de 2004 Porsche Latin America y GrupoUno Capacitación Porsche Acceleration IV Kit de Herramientas de Publicidad.
ESTIMACIÓN DE DENSIDAD
Página 1 Encuesta sobre conducción y seguridad viaria Diciembre 2004 Presentación.
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA la storia la historia lhistoire the history strada calle rue street.
Paso 1 Portada YO SOY EUROPEO Comisión Europea.
Complejidad Computacional
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
Aranda Fernández, Miguel Ángel García Redondo, Luis Miguel
4. ANÁLISIS FACTORIAL Introducción Modelo factorial ortogonal
Cuestiones y problemas
Los números.
ANALISIS DE IMÁGENES A PARTIR DE LA PRESENTACIÓN DE ALGUNAS IMÁGENES, PEDIR A LOS NIÑOS QUE OBSERVEN LAS ILUSTRACIONES Y QUE DESCRIBAN EN SU CUADERNO LAS.
Manantial de Vida CUENCA
Metodología de la Investigación Social
Introduccion a UML Wilson Peláez Hernández
MUESTREO (NAGA´s) BOLETÍN 5020
1-1 Capítulo dos Descripción de los datos: distribuciones de frecuencias y representaciones gráficas OBJETIVOS Al terminar este capítulo podrá: UNO Organizar.
Los Objetos de la Clase Escriban la palabra (the word) en español para los objetos de la clase (#1-20).
Conexión a Internet a través de un ISP
Unidad de competencia II Estadística descriptiva:
Objetivos: Al terminar este capítulo podrá:
Los números.
III Reunión Regional de la Biblioteca Virtual en Salud Puebla, México, 5 de mayo de 2003 Criterios de selección LATINDEX José Octavio Alonso Gamboa Dirección.
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities alimentazione.
-17 Expectativas sobre la situación económica (Europa) Septiembre 2013 Indicador > +20 Indicador 0 a +20 Indicador 0 a -20 Indicador < -20 Total Unión.
Cuenta Pública Ministerio de Agricultura 18 de diciembre de 2013.
USO Y MANEJO DEL VIDEOTELÉFONO.
Instrumentos de recolección de información Informe Final 2005 Cuestionario individual en español Cédula de vivienda en español Cédula de Vivienda en tseltal.
Sistema operativo Tema: Maquina virtual Alumnos: Eduar peña
ATeDis Tecnologías de Apoyo y Ayudas Técnicas
La Evaluación Psicológica en las Organizaciones
Proyecto ProMéxico Plasmas abril SECCIONES NOTICIAS PROYECTOS UNIDAD ACTÚA EVENTUALES secciones ProMéxico.
Proyecto ProMéxico Plasmas mayo SECCIONES NOTICIAS PROYECTOS UNIDAD ACTÚA EVENTUALES secciones ProMéxico.
Proyecto ProMéxico Plasmas marzo SECCIONES NOTICIAS PROYECTOS UNIDAD ACTÚA EVENTUALES secciones ProMéxico.
RETIRO DE COMALCALCO DIC. 2012
Proyecto para Centros que trabajan una vez por semana.
Expresiones Racionales
Grupo 8 Fernando Arias Porras Jorge Mozos Arias Walber González Sedeño
Proceso de Originación de Crédito: Banco de los Alpes
Investigación Algorítmica
Comité Nacional de Información Bogotá, Julio 21 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Comité Nacional de Información Bogotá, Julio 27 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Proyecto Fin de Carrera E.T.S. Ingeniería Informática 26 de Septiembre de 2006 DESARROLLO DE UN COMPONENTE TECLADO ALUMNO: Fco. Javier Sánchez Ramos TUTORES:
INFORME PIPADI HOSPITAL VALL DHEBRON JUNIO 2012 – JUNIO
Autor: Javier Insa Cabrera Director: José Hernández Orallo 26 de septiembre de 2011.
Plan de Desarrollo “TODOS SOMOS FACATATIVA 2012 – 2015”
Aqui está Señoras y Señores !!!!!
JORNADA 1 DEL 24 DE MARZO AL 30 DE MARZO EQUIPO 01 VS EQUIPO 02 EQUIPO 03 VS EQUIPO 06 EQUIPO 05 VS EQUIPO 10 EQUIPO 07 DESCANSA EQUIPO 08 VS EQUIPO 13.
CULENDARIO 2007 Para los Patanes.
Números enteros.
MAREAS NEGRAS The accidente of Prestige took place on the 13rd of November 2002 near Galicia. The oil tanker Prestige was 26 years old ship loaded with.
BEATRIZ LAFONT VILLODRE
SI QUIERES VERLO DALE AL CLICK
ESTADOS FINANCIEROS A DICIEMBRE DE 2013.
GUIÓN GRÁFICO VALORES EN LA USB
Ministerio de Educación Nacional República de Colombia 1 SABER 2003 Evaluación de competencias ciudadanas en 5o. y 9o. de educación básica Resultados en.
Agrupamiento de relaciones no lineales entre expresiones de genes
EL RETO DE UN GRANDE Y PROFUNDO LEGADO
Bloque 1: Sobre la satisfacción de los Alumnos/as del Centro Educativo. LOGROS IMPORTANCIA Sobre la tarea del profesorado Las enseñanzas recibidas.
MODELACIÓN MATEMÁTICA
1. Tipos de dibujos 2. Escalas 3. Sistemas de representación
ESCUELA PROFESIONAL DE INGENIERIA INDUSTRIAL CURSO: GESTION DE LA CALIDAD ING.ELIZABETH FERG 1.
Estadística Administrativa I
Transcripción de la presentación:

1 Alumno: Javier Insa Cabrera Director: José Hernández Orallo 23 de septiembre de 2010

2 1. Objetivo del proyecto 2. Marco conceptual 2.1. Requisitos 2.2. Agente 2.3. Interacción 2.4. Entorno 3. Clase de entornos Lambda 3.1. Espacio 3.2. Agentes recompensadores 3.3. Propiedades de los entornos en el entorno Lambda 3.4. Sesión de evaluación 3.5. Interfaz 3.6. Demo 4. Experimentos 4.1. Comprobar las propiedades de los entornos balanceados 4.2. Experimentar con el comportamiento de agentes 5. Conclusiones y trabajo futuro

Construir un sistema que permita evaluar y medir la inteligencia de distintos sistemas. Construir una arquitectura que permita la realización de tests de inteligencia para la evaluación de distintos sistemas inteligentes. Objetivos específicos. Codificación manual de los entornos. Generación automática de los entornos siguiendo alguna distribución. Entorno gráfico de evaluación de entornos que proporcione los resultados. Realización de pruebas y experimentos con entornos y agentes sencillos. 3

4 1. Objetivo del proyecto 2. Marco conceptual 2.1. Requisitos 2.2. Agente 2.3. Interacción 2.4. Entorno 3. Clase de entornos Lambda 3.1. Espacio 3.2. Agentes recompensadores 3.3. Propiedades de los entornos en el entorno Lambda 3.4. Sesión de evaluación 3.5. Interfaz 3.6. Demo 4. Experimentos 4.1. Comprobar las propiedades de los entornos balanceados 4.2. Experimentar con el comportamiento de agentes 5. Conclusiones y trabajo futuro

Debe permitir medir cualquier tipo de sistema inteligente (biológico o computacional) que exista actualmente o pueda ser construido en el futuro. El test debe adaptarse rápidamente al nivel de inteligencia y escala de tiempo del sistema. La calidad de la evaluación dependerá del tiempo que dejemos al test. 5

Agente Interacción Sistema inteligente que interactúa en el entorno. Entorno Agente 6 Personas AnimalesSistemas de IA

Agente Entorno Interacción Comunicación entre el agente que se está evaluando y el entorno. Observación: Estado del entorno. Acción: Movimiento que realiza el agente que se está evaluando. Recompensa: Recompensa proporcionada por la última acción realizada. Observación Recompensa Acción 7

Agente Entorno Interacción 8 Mundo en donde se evalúa al agente.

9 No cualquier entorno sirve para medir. Hay que seleccionar una muestra de entornos sin favoritismos. El entorno debe cumplir ciertas propiedades. Sensible a las recompensas: Dependiendo de las acciones que realice el agente se obtendrán recompensas distintas. Entorno balanceado: Las recompensas ofrecidas para un agente aleatorio sea 0. Las interacciones deben ser computables y prácticamente instantáneas desde el punto de vista del agente. IV (, U, m, n i ) := Donde la muestra "S" de entornos se extrae con la siguiente probabilidad.

10 1. Objetivo del proyecto 2. Marco conceptual 2.1. Requisitos 2.2. Agente 2.3. Interacción 2.4. Entorno 3. Clase de entornos Lambda 3.1. Espacio 3.2. Agentes recompensadores 3.3. Propiedades de los entornos en el entorno Lambda 3.4. Sesión de evaluación 3.5. Interfaz 3.6. Demo 4. Experimentos 4.1. Comprobar las propiedades de los entornos balanceados 4.2. Experimentar con el comportamiento de agentes 5. Conclusiones y trabajo futuro

Los espacios están formados por un conjunto de celdas y una serie de posibles conexiones/acciones que conectan las celdas entre sí. ? ? ? ? ? ? π Generación automática de espacios. o Celdas desconectadas. Espacio conectado. o Celdas inalcanzables. o Celdas sumideras. Espacio fuertemente conectado. 11

Los agentes Good () y Evil () se encargan de generar las recompensas (+1 y -1 respectivamente) a través del espacio

Entornos balanceados. Equidad entre los agentes generadores de recompensas. Comportamientos iguales. 13

π Recompensas 1ª Iteración: 2ª Iteración: 3ª Iteración: 4ª Iteración: Recompensa media:

π Recompensas 1ª Iteración: 2ª Iteración: 3ª Iteración: 4ª Iteración: Recompensa media: ¿Qué ocurre cuando varios agentes se mueven a la misma celda? +0.5/ 2 =

π A Cell 1 B Cell 3 C Cell 4 A Cell 2 B Cell 1 A Cell 3 B Cell 4 C Cell 2 A Cell 4 B Cell 2 ¿Cómo representamos el entorno? Evitar favoritismos. 16

17

18 1. Objetivo del proyecto 2. Marco conceptual 2.1. Requisitos 2.2. Agente 2.3. Interacción 2.4. Entorno 3. Clase de entornos Lambda 3.1. Espacio 3.2. Agentes recompensadores 3.3. Propiedades de los entornos en el entorno Lambda 3.4. Sesión de evaluación 3.5. Interfaz 3.6. Demo 4. Experimentos 4.1. Comprobar las propiedades de los entornos balanceados 4.2. Experimentar con el comportamiento de agentes 5. Conclusiones y trabajo futuro

Comprobar las propiedades de los entornos balanceados. Experimentar con un agente con comportamiento. Agente aleatorioAgente observador π π 19

Entornos manuales de distinto tamaño. 20 Recompensas medias

Entornos manuales de 8 celdas. 21 Recompensas medias

Entornos manuales de 4 celdas donde el agente Good no cambia de celda. 22 Recompensas medias

Entornos manuales de 8 celdas donde ambos agentes (Aleatorio y Observador) compiten por las recompensas. 23 Recompensas medias

24 Recompensas medias Entornos manuales de 8 celdas donde ambos agentes generadores (Good y Evil) mueven varias celdas al mismo tiempo.

25 1. Objetivo del proyecto 2. Marco conceptual 2.1. Requisitos 2.2. Agente 2.3. Interacción 2.4. Entorno 3. Clase de entornos Lambda 3.1. Espacio 3.2. Agentes recompensadores 3.3. Propiedades de los entornos en el entorno Lambda 3.4. Sesión de evaluación 3.5. Interfaz 3.6. Demo 4. Experimentos 4.1. Comprobar las propiedades de los entornos balanceados 4.2. Experimentar con el comportamiento de agentes 5. Conclusiones y trabajo futuro

Objetivos cumplidos. Tras la construcción de la arquitectura del sistema, ésta permite interacciones básicas entre los agentes y el entorno, generaciones básicas de espacios y permite su ampliación con el tiempo. Conocimiento adquirido. Con la arquitectura diseñada podemos evaluar distintos comportamientos de los agentes y ver cómo, al cambiar su comportamiento, se refleja en los resultados de su evaluación. La interrelación de varios agentes en el mismo entorno entorpece la evaluación del agente a evaluar. 26

Generar los entornos automáticamente. Generar los espacios siguiendo una distribución universal. Generar objetos. Generar otros agentes y su comportamiento. Construir la observación del entorno siguiendo un lenguaje de especificación. 27

Tests adaptativos y experimentación. Construir tests de evaluación a partir de sesiones. Autoajustar la complejidad del entorno para cada sesión en función de los resultados obtenidos por el agente que se está evaluando. Evaluar personas y animales. Evaluar sistemas de IA. 28

29 1. Objetivo del proyecto 2. Marco conceptual 2.1. Requisitos 2.2. Agente 2.3. Interacción 2.4. Entorno 3. Clase de entornos Lambda 3.1. Espacio 3.2. Agentes recompensadores 3.3. Propiedades de los entornos en el entorno Lambda 3.4. Sesión de evaluación 3.5. Interfaz 3.6. Demo 4. Experimentos 4.1. Comprobar las propiedades de los entornos balanceados 4.2. Experimentar con el comportamiento de agentes 5. Conclusiones y trabajo futuro