La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Sistemas Multiagente Sesión 2: Coordinación Negociación y Argumentación Curso 2009/2010 Ramón Hermoso 1.

Presentaciones similares


Presentación del tema: "Sistemas Multiagente Sesión 2: Coordinación Negociación y Argumentación Curso 2009/2010 Ramón Hermoso 1."— Transcripción de la presentación:

1 Sistemas Multiagente Sesión 2: Coordinación Negociación y Argumentación Curso 2009/2010 Ramón Hermoso 1

2 La Coordinación en los Sistemas Multiagente 1. Introducción 2. Negociación y Argumentación 3. Bibliografía 2

3 ¿Qué es la Coordinación? Concepto universal: Ciencias Sociales, Economía, Biología, … Robótica, Ingeniería del Software, Lenguajes de Programación, Inteligencia Artificial (Distribuida), … Semántica borrosa: Múltiples definiciones ¡Esto no es coordinación! Coordinación en los Sistemas Multiagente (SMA): la coordinación es un problema clave en la construcción de SMAs la capacidad para coordinarse es una característica esencial de un agente 3

4 ESTO ES COORDINACIÓN 4 ¿Qué es la Coordinación?

5 La coordinación en los SMA: perspectivas diferentes Diseño a nivel macro Diseño a nivel micro Varios diseñadores de agentesUn diseñador de agentes Interés del diseñador en la coordinación Un diseñador de agentes –agentes benévolos –diseñar todo un sistema de resolución de problemas La coordinación es la integración y el ajuste del trabajo individual con el fin de alcanzar una meta mayor (B. Singh) Diseño a nivel macro –construir sistemas de múltiples agentes con características deseadas 5

6 Coordinación a nivel macro: Resolución Dist. de Problemas Ejemplo: Gestión de tráfico rodado –red de autopistas urbanas –Construir un sistema que genere planes de señalización en función del estado del tráfico 6

7 Arquitectura TRYS (Cuena et al.): agentes de resolución de problemas cada agente es responsable de un área problema genera planes alternativos de señalización local y los comunica al agente coordinador agente coordinador resuelve las interdependencias entre los planes locales envía los planes locales adaptados a los agentes para su ejecución Coordinación a nivel macro: Resolución Dist. de Problemas

8 La coordinación en los SMA: perspectivas diferentes Diseño a nivel micro Varios diseñadores de agentes Interés del diseñador en la coordinación Un diseñador de agentes –agentes benévolos –diseñar todo un sistema de resolución de problemas Diseño a nivel macro –construir sistemas de múltiples agentes con características deseadas Diseño a nivel micro –en un entorno abierto con múltiples agentes –diseñar un agente adicional con características deseadas La coordinación es una forma de adaptarse al entorno (von Martial) 8

9 Coordinación a nivel micro Ejemplo: Agente R 1 ha de vigilar una zona existen dos puntos de observación (P 1 y P 2 ) suponen un valor (altura) y un coste (distancia) acciones: A 1 (ir a P 1 ), A 2 (ir a P 2 ) y N (nada) Mundo multiagente junto con R 2 : – Utilidad: U Ri (A i ) = valor ({P i, P j }) – coste(A i ) – R 1 conoce sus tres acciones alternativas y sus consecuencias – R 1 no sabe si R 2 es consciente de tener la alternativa A 2 referencia P.Gmytrasievicz y E.Durfee. A Rigorous, Operational Formalization of Recursive Modeling. Proceedings of the First International Conference on Multiagent Systems. pp: Copyright © 1995, AAAI Coste: 1 P1P2 R1 Valor: 2 Valor: 4 Coste:2 Coste: 1 R2 9

10 1 4 11/3 [1/3, 1/3, 1/3] A1 A2 N A1A2N R1 R2 [0.5, 0.5] 0–0 ––– 2–0 A1 A2 N A1A2N R1 R2 Modelo de R1 de su propia situación Modelo de R1 sobre las posibles acciones de R A1 A2 N A1A2N R1 R2 [0.25, 0.75] p=0.75 p=0.25 Método RMM (Gmytrasievicz y Durfee): 10 Coordinación a nivel micro R2 no conoce P2R2 conoce P2

11 La coordinación en los SMA: perspectivas diferentes Diseño a nivel micro Varios diseñadores de agentes Interés del diseñador en la coordinación Un diseñador de agentes –agentes benévolos –diseñar todo un sistema de resolución de problemas Diseño a nivel micro –en un entorno abierto con múltiples agentes –diseñar un agente adicional con características deseadas Diseño a nivel macro –construir sistemas de múltiples agentes con características deseadas Coordinar es gobernar la interacción (Wegener ) Varios diseñadores de agentes –no se puede ejercer un control directo sobre los agentes –diseñar el contexto del sistema 11

12 Coordinación a nivel macro: Sociedades de Agentes Mecanismo de subasta: –un agente usuario comunica las características de la llamada a los distintos agentes empresa –cada agente empresa contesta con una oferta (precio por minuto) –el agente usuario elige una oferta en base a una convención Ejemplo: Comercio Electrónico (Rosenschein y Zlotkin): –asignación de llamadas telefónicas a compañías de telecomunicación –objetivo: evitar comportamiento estratégico entre compañías 12

13 Convención 1: elegir la mejor compañía y pagar el precio de la oferta más baja problema: promociona el comportamiento estratégico 13 Coordinación a nivel macro: Sociedades de Agentes Convención 2: elegir la mejor compañía y pagar el precio de la segunda oferta más baja elimina incentivos para el comportamiento estratégico

14 La Coordinación en los Sistemas Multiagente 1. Introducción 2. Negociación y Argumentación 3. Bibliografía 14

15 Coordinación 15

16 Coordinar es Gestionar Dependencias Tareas de coordinación: definición del contexto de coordinación: agentes, metas, tareas, capacidades, etc. detección de dependencias: recursos compartidos, productor/consumidor etc. decisión de gestión: secuenciación temporal, selección de recursos etc. t1t1 t2t2 t3t3 t t 1, 1 t 1, 2 t 1, 3 t 3, 3 t 3, 2 t 3, 1 t' 1 t' 2 t' t' 1,1 t' 1,2 t' 1,3 t' 2,1 t' 2,2 t' 2,3 Agente 1 Agente 2 local tipo A tipo B Coordinación: gestión de dependencias (Malone y Crowston) 16

17 La coordinación en entornos abiertos Diseño de Sistemas de Agentes para Negociación Un diseñador de agentes –agentes benévolos –diseñar todo un sistema de resolución de problemas Diseño a nivel micro –en un entorno abierto con múltiples agentes –diseñar un agente adicional con características deseadas Diseño a nivel macro –construir sistemas de múltiples agentes con características deseadas Varios diseñadores de agentes –no se puede ejercer un control directo sobre los agentes –diseñar el contexto del sistema Diseño de protocolos Diseño de estrategias Un diseñador de agentes –agentes benévolos –diseñar todo un sistema de resolución de problemas 17

18 Situaciones con múltiples decisores: Juegos Modelos cuantitativos de coordinación Las dependencias se compilan en funciones de utilidad multi- atributo Un agente sólo controla un subconjunto de atributos (o sólo uno) Juegos: En su versión más simple, se considera un juego en forma normal una tripleta (I,S,U), tal que I es un conjunto de n agentes (jugadores) S es el espacio de acciones (estrategias) conjuntas, pudiendo elegir cada agente de un conjunto finito de acciones (estrategias) individuales U es un conjunto de funciones de utilidad U i para cada jugador, tal que 18

19 Escenarios antagónicos: Juegos de suma nula Un juego es de suma nula cuando en toda estrategia conjunta s se compensan exactamente las ganancias de unos jugadores con las pérdidas de otros, es decir: Si consideremos el caso particular de un juego bipersonal de suma nula, la fórmula anterior se reduce a la siguiente afirmación: 19

20 Escenarios parcialmente cooperativos: Juegos de suma no constante Juegos de suma no constante: representan entornos en los que los intereses de los jugadores no son totalmente antagónicos hay estrategias conjuntas de las que se pueden beneficiar ambos jugadores: Matriz de juego: representación de un juego de suma no constante con dos jugadores las filas representan las posibles acciones del agente 1, mientras que las columnas indican las posibilidades de elección del jugador 2 las celdas de la matriz contienen pares de números, que indican los valores de utilidad de cada uno de los jugadores 20

21 Ejemplo: Dilema de Prisionero Dos cautivos, de los que existe suficiente evidencia incriminatoria, son sometidos de forma separada a un interrogatorio. Estrategias alternativas de actuación: confesar el crimen del que se le acusa (defect, D ) callarse (cooperate,C ). Resultados de la actuación: ninguno confiesa: serán condenados a un año en la cárcel por una fechoría menor ambos confiesan: afrontarán 5 años de cárcel uno confiesa y el otro se calla: al primero se le perdonará la fechoría menor, y será liberado gracias a su colaboración, mientras que el último será recluido durante 10 años Nota: Muchas situaciones de la vida real tienen las características del Dilema de los Prisioneros (arms-race, free-rider, etc.) Escenarios parcialmente cooperativos: Juegos de suma no constante

22 Utilidades Interpretando los años en la cárcel como valores negativos de utilidad U 1 (D,D) = -5 U 1 (D,C) = 0 U 1 (C,D) = -10 U 1 (C,C) = -1 U 2 (D,D) = -5 U 2 (D,C) = -10 U 2 (C,D) = 0 U 2 (C,C) = -1 CD C(-1,-1)(-10,0) D(0,-10)(-5,-5) Matriz del juego : Preferencias Agente 1: (D,C) > 1 (C,C) > 1 (D,D) > 1 (C,D) Agente 2: (C,D) > 2 (C,C) > 2 (D,D) > 2 (D,C) Escenarios parcialmente cooperativos: Juegos de suma no constante

23 Evaluación del Dilema del Prisionero Contexto: los agentes no pueden comunicarse, y en particular no pueden llegar a acuerdos respecto a las acciones que tomar, o al reparto de las utilidades obtenidas. Estrategia racional: cada convicto prefiere confesar (D) en vez de callarse (C). Seguridad: Si elige C corre el riesgo de ser recluido por 10 años, mientras que al hacer D la penalización máxima es de 5 años. D domina a C: Si el compañero juega D, lo mejor que puede hacer el agente es jugar D también, puesto que en este caso sólo iría 5 y no 10 años a la cárcel. Si el otro convicto se calla (C), la mejor opción será confesar (D), puesto que así la potencial condena de un año se convierte en nada

24 Equilibrio de Nash Definición: Un conjunto de acciones está en equilibrio de Nash si ningún agente tiene incentivos para desviarse de él de forma individual Ningún agente puede incrementar su utilidad cambiando unilateralmente su acción. Formalmente, si s * es un equilibrio de Nash entonces Dependiendo del juego puede haber uno, varios, o ningún equilibrio de Nash

25 Soluciones al Dilema del Prisionero Dilema del Prisionero: El único equilibrio de Nash es (D,D), por lo que ambos acusados acabarán por 5 años en la cárcel Pero la opción (D,D) no es (Pareto-)eficiente … (C,C) domina a (D,D) Cada agente podría estar mejor sin que el otro estuviera peor Soluciones: Modificar el concepto de racionalidad: altruismo, generosidad, etc. Dilema del Prisionero Iterado (con futuro abierto): Torneo de Axelrod: gana la estrategia Tit-for-Tat Establecer condiciones para que se pueda llegar a acuerdos creíbles

26 Modelos de Negociación 1. Introducción 2. Modelos de Negociación 2.1. Subastas 2.2. Regateo 2.3. Argumentación 3.Bibliografía Indice: 26

27 Negociación Objetivo: determinar (las condiciones de) un acuerdo entre, al menos, dos agentes Tipos de negociación: Subastas Adjudicar productos y tareas a través de un mercado n participantes, transacción entre 2 Regateo Llegar a un acuerdo entre todos los participantes Argumentación Resolver (supuestos) conflictos a través del debate Rules of Encounter Rosenschein and Zlotkin,

28 Subastas Mecanismo estructurado para forjar acuerdos Protocolo: semi-distribuido, con diferentes roles 1 subastador N subasteros Estrategias: pujas de los subasteros Precio inicial, precio de reserva, etc., del subastador No muy frecuentes en la realidad, pero sí bastante populares en Comercio Electrónico (p.e. eBay) 28

29 Subasta inglesa Inicio: el subastador ofrece un producto a un precio inicial (usualmente por debajo de un precio mínimo privado) Apuestas: los subasteros van ofertando precios (ninguna, una, o varias veces) cada oferta tiene que superar todas las anteriores el ciclo de apuestas termina cuando no hay más ofertas Adjudicación: si la última oferta alcanza el precio mínimo (privado) del subastador, el producto es adjudicado al subastero de la oferta más alta de lo contrario no se vende el producto (el subastador tiene la última palabra!!!) 29

30 Subasta inglesa entre agentes: Protocolo FIPA En los subastas de agentes, los participantes no están físicamente presentes en una sala de subasta reject-proposal: pueden llegar pujas ilegales, p.ej. por retardos en la red cfp: anunciar cada nueva ronda de pujas con el precio actual inform: informar a todos los participantes sobre el resultado de la subasta request: requerir que el ganador realice la transacción 30

31 Subasta holandesa Se usa en mercados de flores holandesas para determinar el precio de una cantidad de flores Inicio: el subastador ofrece una cantidad de un producto a un precio inicial (usualmente por encima de un precio mínimo privado) Apuestas: cada tiempo (Dt) disminuye el precio en una cantidad (D$) cada oferta especifica la cantidad del producto a comprar al precio actual el subastador determina el final de la subasta (o bien porque toda la cantidad ha sido adjudicada, o bien porque se alcanza el precio mínimo privado) Adjudicación: la adjudicación de cada oferta a los subastaros es directa el subastador informa del final de la subasta 31

32 Subasta holandesa entre agentes: Protocolo FIPA En los subastas entre agentes, los participantes no están físicamente presentes en una sala de subasta reject-proposal: si llegan pujas ilegales o a la vez accept-proposal: ya que la adjudicación es directa, la aceptación de una puja implica la realización de la transacción inform: del final de la subasta 32

33 Subasta first-price sealed bid: elegir la mejor compañía y pagar el precio de la oferta más baja Ejemplos de subasta one-shot Subastas one-shot Sólo hay una oportunidad para hacer ofertas (i.e. el proceso no es iterativo) Ejemplo de la asignación de llamadas telefónicas (véase introducción) 33 Subasta Vickrey: elegir la mejor compañía y pagar el precio de la segunda oferta más baja

34 Subastas one-shot: Modelado con protocolos FIPA No existen protocolos específicos para subastas one-shot en FIPA IPL Sin embargo, dichas subastas se pueden simular sobre la base de la Red de Contratos El protocolo Red de Contratos (Contract Net) es un mecanismo clásico de la IA Distribuida para la asignación de tareas 34

35 Subastas de venta y de compra Subastas de venta: 1 vendedor, n compradores Ejemplos: subasta inglesa y holandesa tradicionales Subastas de compra 1 comprador, n vendedores variaciones de las subastas descritas: –subasta inglesa de precio descendente –subasta holandesa de precio ascendente 35

36 Tipos de Protocolos de Subasta Tipo de ofertas: abierto (open-cry): los subasteros conocen mutuamente sus ofertas privado/cerrado (sealed-bid): los subasteros sólo conocen sus propias ofertas Proceso de ofertas: una vuelta (one-shot): los subasteros sólo dan una oferta directa (forward): el precio de las ofertas va ascendiendo inversa (reverse): el precio de las ofertas va descendiendo Proceso de adjudicación: ¿Qué oferta se usa para determinar el precio que ha de pagar el ganador? (first-price, second-price, …) Ejemplos: Subasta inglesa (tradicional): first-price open-cry (forward) Subasta holandesa (tradicional): first-price open-cry (reverse) Subasta Vickrey: one-shot second-price sealed-bid 36

37 Tipos de Escenarios de Subasta valor público (común): el valor del producto sólo depende de las preferencias de los demás subasteros (valor consiste únicamente en la reventa) p.e.: una moneda de un euro valor privado: el valor del producto sólo depende de las propias preferencias del subastero (no hay posibilidad de reventa) p.e. una moneda de un euro gastada por Michael Jordan valor correlado: el valor del producto depende de las preferencias tanto del propio subasteros como de los demás p.e.: una obra de arte que sirve como decoración y como inversión mayoría de las escenarios reales (p.e. Comercio Electrónico) más propicios al análisis formal 37

38 Algunos resultados sobre las subastas Subastas Vickrey : la estrategia dominante de un agente subastero en subastas Vickrey de valor privado es apostar su valor real El subastador pierde algo de utilidad (diferencia entre primer y segundo precio) Subastas first-price (p.ej. inglesa) El subastero recibe el precio de la oferta más alta Hay incentivos para que los subasteros no revelen su precio real (sino uno más bajo) 38

39 Problemas Subastas Vickrey : subastador mentiroso: el subastador tiene incentivos para mentir respecto al precio de la segunda oferta más alta (ya que el subastero ganador la desconoce) revelación de información privada: los subasteros revelan su precio real, lo cual podrá ser utilizado por los demás subasteros en subastas futuras (de otro tipo) Todas las subastas : colusión entre subasteros: si los subasteros se conocen, hay incentivos para coordinar sus ofertas costes computacionales: costes de búsqueda en subastas interrelacionadas costes de recabar información en situaciones de incertidumbre 39

40 Plataformas para subastas Fishmarket: Trading Agent Competition (TAC): …

41 Negociación: Regateo Características: posibilidad de forjar acuerdos globales (creíbles) entre n agentes todos los agentes pueden beneficiarse de un acuerdo pero hay una diferencia de opinión con respecto a las características del acuerdo (qué acuerdo elegir) Elementos de un escenario de regateo Conjunto (espacio) de negociación: Todos los posibles acuerdos a los que se pueden llegar Ejemplo: todos los precios entre las expectativas iniciales de un comprador y un vendedor Protocolo de negociación: Reglas que determinan el proceso de negociación: ¿Cómo, cuándo, y qué ofertas se pueden hacer? ¿Cuándo termina la negociación y cuál es el resultado? Ejemplo: No se puede empeorar una oferta ya hecha Estrategia de negociación: Cómo elegir entre las diferentes acciones que permite el protocolo Ejemplo: Mejorar mi última oferta en 10% cada 5 minutos 41

42 Objetivos de Diseño Diseño de estrategias: Racionalidad: maximizar las ganancias esperadas Eficiencia: minimizar el coste computacional para determinar una acción … Diseño de protocolos: Distribución: evitar que haya un cuello de botella (punto de fallo) Convergencia: garantizar que se llega a un acuerdo (o desacuerdo) en tiempo finito Simplicidad: fomentar que se llegue rápido a un acuerdo (o desacuerdo) Eficiencia: si se llega a un acuerdo, este no desperdicia utilidad Estabilidad: motivar a los agentes para elegir estrategias con características deseadas (estrategias dominantes, equilibrios de Nash) … 42

43 Negocación: Regateo Regateo como proceso de oferta y contraoferta Regateo como proceso de concesiones mutuas Oferta Contraoferta Agente A i acepta Agente A i Agente A j Ofertas de A j Ofertas de A i Punto de acuerdo/ transacción 43

44 El protocolo de concesiones monótonas (PCM) Protocolo PCM: El regateo se realiza por rondas En la ronda 1, cada agente propone simultáneamente un trato del conjunto de negociación Se llega a un acuerdo, si un agente considera que el trato propuesto por el otro es, al menos, tan bueno (para él) como el suyo. Si no hay acuerdo, se realiza una nueva ronda de propuestas. En la ronda u+1, ningún agente puede realizar una propuesta peor que en la ronda u. Si ningún agente cede, el regateo termina en desacuerdo. Diseño de estrategias: ¿Con qué propuesta empezar? ¿Cuándo (en qué ronda) hay que ceder? ¿Cuánto hay que ceder? 44

45 La propuesta inicial Leo Baekeland sold the rights to his invention, Velox photographic printing paper, to Eastman Kodak in It was the first commercially successful photographic paper and he sold it to Eastman Kodak for $1 million. Baekeland had planned to ask $ and to go down to $ if necessary, but fortunately for him, Eastman spoke first. (Asimov, 1982) 45

46 El factor riesgo Idea de estrategia: Empezar con el trato más favorable para uno mismo Determinar cuándo (y cuánto) ceder dependiendo de cuánto se puede perder en caso de conflicto (riesgo) mejor trato para A i mejor trato para A j trato conflicto Cuánto estoy dispuesto a arriesgar un conflicto? pérdida máxima en caso de conflicto pérdida máxima en caso de concesión 46

47 La estrategia de Zeuthen Riesgo(A,t) = Pérdida máxima de A si cede (y acepta la oferta de B) Pérdida máxima de A (si no cede y se llega a un conflicto) Disposición para arriesgar el conflicto: Riesgo: pérdida relativa máxima si el agente A cede en la ronda t Idea: el agente con el menor riesgo (el que realizaría la menor perdida relativa máxima) debería ceder La estrategia de Zeuthen: Calcular el propio Riesgo(A,t) y el del contrario (Riesgo(B,t)) Si el propio riesgo es igual o más pequeño que el del contrario, entonces hacer la oferta mínima suficiente –suficiente: cambia la balanza de riesgos (después el contrario tiene el menor riesgo) –mínima: elegir la oferta que minimice la propia pérdida de utilidad De lo contrario, no ceder (repetir la misma oferta) 47

48 Dominios orientados a tareas: Ejemplos Repartición de correo: –Varios repartidores de correo han de entregar cartas en diferentes partes de la ciudad. Cada repartidor quiere minimizar el camino que tiene que recorrer, y una forma de hacerlo es intercambiar cartas con sus compañeros Consultas en Bases de Datos: –Varios agentes tienen acceso a una Base de Datos común, y cada uno ha de realizar una serie de consultas. Podrán coordinar sus (sub-)queries para maximizar la eficiencia de sus consultas (Join, Proyección, Unión, Intersección, …). Dominios orientados a tareas: –Un grupo de agentes puede redistribuir tareas entre sí (sin efectos secundarios) –Pueden beneficiarse si llegan a un acuerdo, pero cada uno prefiere un acuerdo diferente 48

49 Dominios Orientados a Tareas Definición: Un dominio orientado a tareas (DOT) es una tripleta (T, Ag, c) tal que: T es un conjunto finito tareas; Ag = {A 1, A 2,…, A n } es un conjunto finito de agentes; c: (T) R +, c( ) = 0, es una función mónotona creciente que define el coste para ejecutar cualquier subconjunto de tareas Nótese: Quedarse quieto no cuesta nada (c( ) = 0) Cuánto más tareas se ejecutan, más coste se genera (c es monótona creciente) El coste de ejecutar cada subconjunto de tareas no depende de quién las lleva a cabo (situación idealizada) 49

50 Utilidad de Tratos Definición: dado un DOT con dos agentes (T, {A 1,A 2 }, c), Un encuentro dentro del DOT es un vector (T 1, T 2 ) tal que para todo k, T k T. Un trato d = (D 1, D 2 ) en un encuentro (T 1, T 2 ) es una redistribución de tareas entre agentes, tal que D 1 D 2 = T 1 T 2 El trato = (T 1, T 2 ) se llama trato conflicto Nótese: El trato conflicto modela que no hay acuerdo entre agentes (autonomía) 50

51 Ejemplo: DOT inicio tarea atarea b 11 Ejemplo: dominio: ({a,b},{1,2},c) encuentro: ({a},{a,b}) función de coste c: c( )=0 c({a})=1 c({b})=1 c({a,b)}=3 Posibles tratos: ({a}, {b}) ({b}, {a}) ({a,b}, ) (, {a,b}) ({a}, {a,b}) ({b}, {a,b}) ({a,b}, {a}) ({a,b}, {b}) ({a,b}, {a,b}) trato conflicto 51 2

52 Utilidad de Tratos Definición: dado el DOT (T, {A 1,A 2 }, c) y un trato d = (D 1, D 2 ) el coste Cost k ( ) del trato d para el agente k es Cost k ( )=c(D k ) la utilidad Utility k ( ) del trato d para el agente k es Utility k ( )= c(T k ) - Cost k ( ) Nótese: el coste del trato conflicto es el de realizar sus tareas sin ayuda (stand alone cost) la utilidad del trato conflicto para todos los agentes k es Utility k ( )= 0 52

53 Ejemplo: Función de Utilidad de los agentes Agente 1: Utility 1 ({a}, {b}) = 0 Utility 1 ({b}, {a}) = 0 Utility 1 ({a,b}, ) = -2 Utility 1 (, {a,b}) = 1 Utility 1 ({a}, {a,b}) = 0 Utility 1 ({b}, {a,b}) = 0 Utility 1 ({a,b}, {a}) = -2 Utility 1 ({a,b}, {b}) = -2 Utility 1 ({a,b}, {a,b}) = -2 Agente 2: Utility 2 ({a}, {b}) =2 Utility 2 ({b}, {a}) = 2 Utility 2 ({a,b}, ) = 3 Utility 2 (, {a,b}) = 0 Utility 2 ({a}, {a,b}) = 0 Utility 2 ({b}, {a,b}) = 0 Utility 2 ({a,b}, {a}) = 2 Utility 2 ({a,b}, {b}) = 2 Utility 2 ({a,b}, {a,b}) = 0 53

54 Conjunto de Negociación Definición: Un trato domina el trato ' si es mejor para al menos uno de los agentes, y no es peor para el otro, es decir > ' si (1) k {1,2}, Utility k ( ) Utility k ( ') y (2) k {1,2}, Utility k ( )> Utility k ( ') Trato domina débilmente a ' ( ' ) si se cumple al menos la condición (1) Definición: Un trato es individualmente racional si domina débilmente al trato conflicto, es decir si Un trato es Pareto-óptimo si no existe otro trato ' que lo domine. ( ' ) El conjunto S de todos los tratos individualmente racionales y Pareto- óptimos se llama conjunto de negociación 54

55 Ejemplo: Función de Utilidad de los agentes Posibles tratos: ({a}, {b}) ({b}, {a}) ({a,b}, ) (, {a,b}) ({a}, {a,b}) ({b}, {a,b}) ({a,b}, {a}) ({a,b}, {b}) ({a,b}, {a,b}) Ind. racionales: ({a}, {b}) ({b}, {a}) (, {a,b}) ({a}, {a,b}) ({b}, {a,b}) Pareto-óptimos: ({a}, {b}) ({b}, {a}) (, {a,b}) ({a,b}, ) Cjto de Negociación ({a}, {b}) ({b}, {a}) (, {a,b}) Utilidad (0,2) (1,0) 55

56 Otros dominios La características de una negociación no sólo dependen del mecanismo (protocolo) empleado, sino también del dominio Dominios orientados a metas (goal-oriented domains): Efectos laterales cualitativos de las acciones Ejemplo: mundo (síncrono) de los bloques Dominios orientados al valor (worth-oriented domains): Efectos laterales cuantitativos de las acciones Ejemplo: escenarios económicos 56

57 Argumentación Argumentación: Muchas veces un conflicto de interés es sólo aparente porque a un agente le falta información porque a un agente no llegar a una conclusión cierta/ ha sacado una conclusión equivocada de su información La argumentación es el proceso de intentar convencer a los demás de la veracidad de un hecho Modos de argumentación (Gilbert,1994): 1. Modo lógico: Si aceptas A y que A implica B, entonces debes aceptar B 2. Modo emocional: Cómo te sentirías si eso te sucediera a ti? 3. Modo visceral : ¡Cretino! 4. Modo Kisceral: ¡Esto es un dogma cristiano! 57

58 Modelo Lógico de Argumentación Definición: un argumento BBDD |- (Sentencia, Razones) consta de tres partes: BBDD es un conjunto de formulas lógicas (probablemente inconsistente) Sentencia es una formula lógica conocida como conclusión Razones es un conjunto de formulas lógicas tal que: Razones BBDD; y Sentencia se puede derivar de Razones Definición: sean (f 1, G 1 ) y (f 2, G 2 ) argumentos apoyados en alguna BBDD D, entonces (f 2, G 2 ) puede ser rechazado (atacado) de dos formas: (f 1, G 1 ) refuta (rebuts) (f 2, G 2 ) si f 1 f 2 (f 1, G 1 ) mina (undercuts) (f 2, G 2 ) si f 1 y 2 para algún y 2 G 2 Los dos casos se resumen bajo el término ataque 58

59 Modelo Lógico de Argumentación Ejemplo: Los argumentos Arg 1 y Arg 2 se refutan mutuamente El argumento Arg 3 mina al argumento Arg 2 Se usa esencialmente en sistemas de diálogos para argumentación

60 Otros mecanismos para lograr acuerdos Votaciones (Voting systems): cada agente tiene una relación de preferencia sobre un conjunto de posibles acuerdos se elige una alternativa según un protocolo de votación Formación de coaliciones: agentes pueden formar coaliciones (subgrupos) cooperan con los miembros de su coalición, y compiten con los demás cuestiones: ¿Cuál es la estructura de coaliciones? ¿Cuál es el valor de cada coalición? ¿Cómo se reparte el valor de una coalición entre sus miembros? Mecanismos de mercado: búsqueda distribuida para el equilibrio general de un mercado ejemplo: Distributed price tâtonnement (Walrasian auction) 60

61 La Coordinación en los Sistemas Multiagente 1. Introducción 2. Negociación y Argumentación 3. Bibliografía 61 Indice: 61

62 Bibliografía General Ana Mas: Agentes software y sistemas multiagente. Conceptos, arquitecturas y aplicaciones; Pearson, 2004, Capítulo 4 Wooldridge, M.: An Introduction to Multiagent Systems, Wiley, Capítulos 6, 7, y 9. Rosenschein, J.; Zlotkin, G.: Rules of Encounter. MIT Press, Capítulos 3 y 4 62

63 Trabajo 8.1 D.Weyns, M.Schumacher, A. Ricci, M. Viroli, T. Holvoet. Environments in multiagent systems. The Knowledge Engineering Review (2005), 20:2: Cambridge University Press. S. Kraus. Negotiation and cooperation in multi-agent environments. Artificial Intelligence. Volume 94, Issues 1-2, July 1997, Pages – Economic Principles of Multi-Agent Systems 63 ¡¡¡Trabajo Resumen!!!

64 Trabajo 8.2 Rosenschein, J.; Zlotkin, G.: Rules of Encounter. MIT Press, Capítulos 5 y 6 Zlotkin, G. and Rosenschein, J.S.: Mechanisms for Automated Negotiation in State Oriented Domains. Journal of Artificial Intelligence Research, Volume 5, 1996, pp

65 Trabajo 8.3 Wooldridge, M.: An Introduction to Multiagent Systems, Wiley, 2002, págs Sycara, K.: Persuasive Argumentation in Negotiation, Theory and Decision, Vol.28, No. 3, May, 1990, págs Jennings, N. et al.: Automated Negotiation: Prospects, methods, challenges. Int. Journal of Group Decision and Negotiation 10(2). 2001, págs Reed, C.: Dialogue frames in agent communications. Proc. Inf. Conf on Multiagent Systems (ICMAS), 1998, págs Amgoud, L. et al.: Modelling dialogues using argumentation. Proc. Inf. Conf on Multiagent Systems (ICMAS), 2000, págs

66 Combinatorial Auctions Social Choice Coalition formation Voting Systems Mechanism Design 66 Trabajo 8.4


Descargar ppt "Sistemas Multiagente Sesión 2: Coordinación Negociación y Argumentación Curso 2009/2010 Ramón Hermoso 1."

Presentaciones similares


Anuncios Google