La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Toma de decisiones y máquinas Aníbal R. Figueiras Vidal AN, RAIng CU, UC3M.

Presentaciones similares


Presentación del tema: "Toma de decisiones y máquinas Aníbal R. Figueiras Vidal AN, RAIng CU, UC3M."— Transcripción de la presentación:

1 Toma de decisiones y máquinas Aníbal R. Figueiras Vidal AN, RAIng CU, UC3M

2 ÍNDICE - 2 - A. Decisión humana y máquina B. Teoría de la Racionalidad Limitada C. La Escuela Descriptiva D. La Escuela Normativa E. Errores sensoriales F. Errores de apreciación / interpretación G. Errores de memoria H. Errores de procesamiento: selección de info I.Errores de procesamiento : probabilísticos J.Errores de procesamiento en la vida real K.La visión armonizadora L.Los juegos estratégicos M.La Inteligencia Colectiva N.Conclusiones O.Aprendizaje Máquina P.Conjuntos Q.Comités R.Mezclas de Expertos S.Boosting T.Líneas “rutinarias” U.Líneas “incrementales” V.Líneas “radicales” W.Unos humildes consejos X.Reconocimientos

3 - 3 - A.Decisión humana y máquina p R ? H(p,m) DHDH r M(r,w) DMDM

4 - 4 - B.Teoría de la Racionalidad Limitada Herbert Simon Dos escuelas de sicología cognitiva: ─ descriptiva: decidimos del mejor modo posible (Gerd Gigerenzer) ─ normativa: cometemos numerosos errores (Amos Tversky, Daniel Kahneman)

5 - 5 -  Ejemplo Se pregunta a un grupo de estudiantes estadounidenses (U. Chicago) y a otro de alemanes (U. Munich): ¿Qué ciudad tiene más habitantes: San Diego o San Antonio? C.La Escuela Descriptiva (1) Acierto:estadounidenses, 62% alemanes, 100% ! “Menos es más”: permite que prevalezca la cadena intuitiva frecuencia → importancia → población (heurística de reconocimiento) (Somos buenos con información incompleta) →Ventaja:acierto sin información directa (s.t., colectivo) → Inconveniente:errores por rasgos singulares (capital, evento, etc.)

6 - 6 -  Ejemplo Descubrir vulneraciones de una regla asimilada es inmediato menores no alcohol C.La Escuela Descriptiva (2) => CERVEZA 35 GASEOSA 16

7 C.La Escuela Descriptiva (3) - 7 - Descubrir vulneraciones de regla inusual cuesta más: pares color primario (RGB) AZUL4VERDE7 ( reformular : par no secundario … y asociar) =>

8 - 8 -  Ejemplo (Experimento de Antoine Bachara et al.) Sujetos experimentales:extraer consecutivamente cartas de 4 mazos 2 daban pérdida 2 daban ganancia C.La Escuela Descriptiva (4) -para ser conscientes, tardaban una media de 25 extracciones -para adecuar la elección, ¡13! (y cambiaba la conductancia de la piel)

9 - 9 - Cometemos errores cognitivos  perceptivos: ─ sensoriales ─ de apreciación / interpretación  de memoria  de procesamiento: ─ selección de info ─ analíticos: lógicos, probabilísticos,… ─ valoración de resultados  de ejecución  de comprobación (s.t., falacias narrativas “a posteriori”) (además de otros de orígenes emocionales, culturales, sociales, etc.) D.La Escuela Normativa

10 - 10 - E.Errores sensoriales (1)  Visión

11 - 11 - E.Errores sensoriales (2) Ver = creer: luz

12 - 12 - E.Errores sensoriales (3)  Visión (objetos)

13 - 13 - E.Errores sensoriales (4) Hay que aprender a ver

14 - 14 -  Problema de Warren Weaver Hay en una bolsa tres cartas :roja – roja roja – negra negra – negra Se extrae una, y se observa una cara: es negra ¿Cuál es la probabilidad de que la otra cara sea negra?  ¿Es más fácil acertar 2 u 8 resultados de 10 lanzamientos de una moneda? F.Errores de apreciación/interpretación (1)

15 - 15 - F.Errores de apreciación/interpretación (2) Si la estructura es compleja resulta más difícil. (Versión de un elemento del test de percepción de la Univ. Michigan) ¿Cuál es la regla de formación del tablero? +──xx ::::x =─+x: =─xx: ===::

16 - 16 - G.Errores de memoria (1)  Error de disponibilidad ¿Hay más palabras que acaban en r (albur, señor, decidir, …) o que tienen r como antepenúltima letra? (oral, barco, seres, …) Las primeras vienen más fácilmente “a la memoria” Muchas son verbos: decidirdecidirás decidirán decidiría decidieras decidieran decidieres decidieren: x 7!

17 - 17 - En general, no sabemos explicar lo que hacemos Cambiar al carril derecho: ¿es girar el volante a la derecha y enderezar? (Limitó los Sistemas Expertos y limitará aproximaciones análogas) G.Errores de memoria (2)

18 - 18 -  Efecto enmarcado Secuencia de resultados de un experimento aleatorio (confirmamos lo que sugiere el entramado) Subestimamos la aleatoriedad corremos riesgos porque no queremos correrlos (necesidad sicológica de certeza, de seguridad) H.Errores de procesamiento: selección de info ABABB BABBB AABBA ABABB AAABB ?? =>

19 - 19 - I.Errores de procesamiento : probabilísticos Las tres puertas y el coche ¿Hay que cambiar o no?

20 estadísticas en la época: 4.000.000 mujeres maltratadas asesinadas por sus esposos o novios: una de cada 2.500 baja probabilidad: duda razonable Hecho: la mujer de Simpson había sido asesinada estadísticas criminalidad: asesinadas una de cada 2.250 de cada 22.500, 10: 22.500/2.500 = 9, por el marido o novio 1, por un extraño ¡Del 0,4‰ al 90%! Pr (culpable | maltrato) 1/2.500 ( Bayes: Pr (culpable|maltrato, asesinada) = = = 0’9) Pr (asesinada | maltrato) 1/2.250 J.Errores de procesamiento en la vida real - 20 - Abogado Alan Dershovitz en defensa de O.J. Simpson

21 - 21 - K.La visión armonizadora Keith Stanovich (en realidad, muchos elementos: vid. Gazzaniga, Eagleman, Mlodinow) Mente autónoma Mente algorítmica Mente reflexiva p Tipo 1 Tipo 2

22 - 22 - L.Los juegos estratégicos (1) * El dilema del prisionero 2 CD 1 C 3.30.5 E 5.01.1 –Si se pretende derrotar al otro: D,D (¡evolutivo!) – Si se pretende maximizar gananciasC,C Experimentos: ¡ Hay tendencia a cooperar! Simulaciones: Va muy bien TIT FOR TAT (“Donde las dan, las toman”) (Hay estrategias parasitarias)

23 - 23 -  El juego del ultimátum Árbitro 20 a Jugador 1 Jugador 1 N a Jugador 2 Vale Jugador 2 Devolver al árbitro L.Los juegos estratégicos (2) ─ Se manifiesta un rechazo si N es descaradamente bajo (contra “sujeto completamente racional” de los economistas, que son los que peor juegan) ─Vale con N 8 ─ Ariely: añade una opción para J2 3 para J1, 3 para J2 (enseña equidad) (mujeres; corteza insular) 0 para J1, 3 para J2 (venganza) (hombres, estriato)

24 -24 - L.Los juegos estratégicos (3)  No siempre hay que vencer  Son fundamentales los mecanismos de cooperación-competición  En la práctica, no hay jugadores completamente racionales  Hay que analizar antes de jugar  Hay que analizar mientras se juega  Las convenciones generan confianza: no hay que despreciarlas sin razón

25 diversidad (muestras:representativas grupos:no homogéneos …) - 25 - M.La Inteligencia Colectiva (1)  distribución acceso a diversas versiones de la info  independencia / inestabilidad cada uno procesa su info, y no siempre de idéntica forma Requisitos (adaptación de Surowiecki):

26 - 26 - M.La Inteligencia Colectiva (2)  Las urnas (Angela Hung y Charles Plott) U1:2/3 bolas rojas, 1/3 bolas blancas U2:2/3 bolas blancas, 1/3 bolas rojas ─ Versión 1ª:cada jugador según lo que extrae Acierto 2/3 ─ Versión 2ª:cada jugador según lo que extrae y las conjeturas de los anteriores Acierto: ? (“cascada”) ─ Versión 3ª:cada grupo según la decisión mayoritaria Acierto: (se usa info privada)

27 - 27 - N.Conclusiones (1) * Menores (algunas): -No hay que descartar por sistema las decisiones intuitivas -Hay que enriquecer la mente reflexiva -Hay que gestionar la intuición vs. el análisis -Hay que graduar la atención -Hay replantearse y reformular los problemas -Hay que aprender técnicas y adquirir hábitos -Hay que adoptar herramientas cognitivas -Hay que considerar otras opiniones -Hay que examinar la solidez de las convenciones -Hay que ser colaborativo y fiable -Hay que perder el miedo egoísta, pero no la precaución, la prudencia y mesura -Hay que saber defenderse

28 - 28 - N.Conclusiones (2) * Mayores: -las que produzca la reflexión personal

29 -29- f : familia de funciones arquitectura w : parámetros : búsqueda : inferencia ejemplos : Dificultades :  f ?  K vs. complejidad ?  convergencia de la búsqueda ? como inteligencia colectiva : conjuntos - independencia - distribución - criterio - algoritmo => > < O.Aprendizaje Máquina

30 - 30 - Forma habitual:aprendices (unidades) + agregación (Visión más general “(mecánica”): componentes + integración) P.Conjuntos (1) U1U1 U2U2 UMUM x o1o1 o2o2 oMoM A o - - -

31 - 31 -  Ventajas ─ alivia elección f, alivia búsqueda ─ mayor potencia expresiva ─ incluso mejor comprensión  Requisitos ─ diversidad (complementaria (aprendices) ─ adecuación (sencillez vs. potencia) (agregación) ─ (eventual poda)  Posibilidades ─ diseño separadocomités ─ diseño conjuntoconsorcios P.Conjuntos (2) principios “ad hoc”: ? )

32 - 32 -  Bagging (“bootstrap and aggregating”; L. Breiman) ─ aprendices iguales con remuestreos “booststrap” ─ agregación directa (son “grandes”): media, mayoría,… Wagging:muestras ponderadas según distribuciones (Poisson: (bootstrap) Bagging)  Selvas aleatorias ─ árboles en subespacios o/y con submuestreo o/y ramificación probabilística ─ agregación directa (se pierde la (falsa) “interpretabilidad”)  Stacking ─ procediendo por capas (¿”deep”?) Q.Comités

33 - 33 - ─ Las unidades (expertos) compiten por subregiones ─ La puerta o árbitro combina “blandamente” sus salidas (cooperación) R.Mezclas de Expertos

34 - 34 - Aprendices débiles: se añaden uno a uno para ayudar a los anteriores con las muestras difícilesmayor ponderación (enfásis) (cooperación-competición: grado) Agregación: lineal, para minimizar coste exponencial exp (-df) (“cerrado”) S.Boosting (1)

35 - 35 - Originales: AdaBoost, aprendices duros Real AdaBoost, aprendices blandos RAB: se minimiza una cota superior del error 1. 2. 2.1. 2.2. a. b. 2.3. 3. 4. Condición de parada: no 2 (- convencional pond.) S.Boosting (2)

36 - 36 - Caso (propio) de éxito (corrigiendo debilidades operativas): Énfasis mixto: (ind. prox. frontera) T.Líneas “rutinarias” abcoimkwphrispti RAB 19.38 ±0.15 29.00 ±1.45 2.46 ±0.31 11.71 ±0.05 14.04 ±0.52 9.73 ±0.09 5.94 ±0.61 0.75 ±0.55 MRAB 18.97 ±0.13 28.54 ±1.25 2.31 ±0.29 11.66 ±0.05 13.43 ±0.63 9.41 ±0.18 5.75 ±0.51 0.79 ±0.55

37 - 37 - generados por puerta con núcleos: U.Líneas “incrementales” (1) =>

38 - 38 - Con dado, se puede aplicar MM U.Líneas “incrementales” (2) ababreconcrahepimaionkwophoripspatic SVM 19.83.229.3 ±1.4 3.814.53.22.012.111.1 ±0.4 9.66.3 ±0.7 1.7 ±0.3 RAB 19.4 ±0.02 2.6 ±0.5 29.0 ±0.2 2.5 ±0 8.6 ±1.6 2.5 ±0.04 4.9 ±0.9 11.7 ±0.01 14.0 ±0.07 9.7 ±0.01 5.9 ±0.09 0.8 ±0.1 GGFW 18.9 (V3) 2.1 (V2) 28.5 ±0.9 (V1) 0 (V3) 6.4 (V2) 2.6 (V3) 2.0 (V2) 12.0 ±0.01 (V1) 11.8 ±0.5 (V3) 9.1 (V3) 6.2 ±0.7 (V3) 0.5 ±0.8 (V1) (F-score)

39 - 39 - Puertas en agregación “boosting” (añade local) U.Líneas “incrementales” (3) (t-test) abbrcocrheiokwri RAB 19.4 ±0.02 2.6 ±0.4 29.0 ±0.2 2.5 ±0.0 8.9 ±1.8 4.5 ±0.9 11.7 ±0.01 9.7 ±0.01 GRAB 19.1 ±0.3 2.2 ±0.3 27.4 ±0.8 2.5 ±0.0 8.1 ±1.9 4.0 ±1.0 11.7 ±0.2 8.5 ±0.2

40 - 40 - Boosting con SVM (mediante:submuestreo + L1 en dual) U.Líneas “incrementales” (4) abbrcodiduiokwmarithtwwa SVM 20.12.528.319.313.92.011.842.29.55.32.510.5 LPSVM 202.528.622.314.02.011.743.59.46.72.811.2 RAB- SLPSVM 19.1 ±0.1 2.2 ±0.2 27.9 ±0.1 18.2 ±0.3 12.0 ±1.2 2.0 ±0.7 11.5 ±0.0 40.8 ±0.6 8.8 ±0.2 4.5 ±0.8 2.5 ±0.1 10.5 ±0.1

41 V.Líneas “radicales” - 41 - (Obviamente, hay otras muchas posibilidades) Resultados sobre MNIST (dígitos manuscritos) BArq. (nodos en capa)CE (%) DBN(1)500-500-2000-101.26 B-DBN10500-500-2000-100.5 B-DBN10500-500-200-100.4 B-DBN40500-500-2000-10~0.3 B-DBN40500-500-200-10~0.3 Diversidad en aprendizaje profundo (En general: representación + clasificación) Tipo de diversidad: bagging Aplicación: sobre las “Deep Machines” (DM) completas DMs:Deep Belief Networks (DBM) (Hinton) (son “Reduced Boltzmann Machines” apiladas)

42 W.Unos humildes consejos - 42 -  Ser ambicioso  Entender la ventaja general de la diversidad y la cooperación-competición  Ser creativo (no sólo innovador): mirar desde arriba predecir beneficio  Olvidar la soberbia, la certeza, el tema prioritario/único,…, aprender de los errores  Reflexionar acerca de todo (intuitiva y analíticamente)  Reconocer que la realidad es un texto, y leerlo. Hay más oportunidades de las que se puede pensar en abordar …

43 X.Reconocimientos - 43 - En estas líneas de trabajo son co-investigadores internos: Dr. Emilio Ortiz García Dr. Miguel Lázaro Gredilla Dr. Efraín T. Mayhua López Adil Omari Luis Muñoz González Ricardo F. Alvear Sandoval Anas Ahachad Fernando Rabanal Presa Juan José Choquehuanca Zevallos Rafael Hernández Murcia y mis doctorandos y también hay colaboración externa con Prof. Dr. David Ríos Insua (RACEFN, URJC) Dr. Alberto Suárez (UAM) Dr. Lior Rokach (Ben Gurion Univ. Negev, Israel)


Descargar ppt "Toma de decisiones y máquinas Aníbal R. Figueiras Vidal AN, RAIng CU, UC3M."

Presentaciones similares


Anuncios Google