GENERACIÓN SEMIAUTOMÁTICA DE APLICACIONES DE DIÁLOGO MULTIMODALES: PROYECTO GEMINI R. Córdoba, L.F. D’Haro, J.M. Montero, J. Ferreiros, J. Macías-Guarasa,

Slides:



Advertisements
Presentaciones similares
SISTEMAS DE INFORMACIÓN I
Advertisements

U.M.L A/Gx. Diego Gutiérrez Application Analysis and Design.
CGI I La mayor parte de los elementos HTML de que disponemos permite al visitante visualizar los contenidos de un sitio, pero no interactuar con él. Dicho.
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
SERVIDORES VOCALES INTERACTIVOS: DESARROLLO DE UN SERVICIO DE PÁGINAS BLANCAS POR TELÉFONO CON RECONOCIMIENTO DE VOZ PROYECTO IDAS (Interactive telephone-based.
Servicios Web.
Desarrollo de un laboratorio para la enseñanza, diseño y desarrollo de servicios móviles abiertos Autor: D. Mario de Molina Gómez Tutor: D. Francisco Javier.
Evaluando Competencias Profesionales a Través de Rúbricas
Presentada por: Ma. Fernanda Molina M. Luis Sánchez L.
Presentado por: Lenin Isaías Escobar Mendoza
Framework Hexápodo PHP fácil, rápido y sin dolor
GENERACIONES DE LENGUAJES DE PROGRAMACIÓN
Gestión de viajes y gastos Resumen del escenario
Desarrollo de un laboratorio para la enseñanza, diseño y desarrollo de servicios móviles abiertos Autor: D. Mario de Molina Gómez Tutor: D. Francisco Javier.
Javier López García OBJETIVOS DEL PROYECTO Diseñar una nueva arquitectura para SERVIVOX que le proporcione mayor modularidad y flexibilidad. Reestructurar.
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERIA DIVISIÓN DE INGENIERÍA ELÉCTRICA COMPUTACIÓN PARA INGENIEROS NOTA IMPORTANTE: Para complementar.
INTRODUCCIÓN A UML Oscar Miguel Alonso Moreno.
LENGUAJES DE MARCAS Y SISTEMAS DE GESTIÓN DE INFORMACIÓN
Software La buena programación no se aprende de generalidades, sino viendo cómo los programas significativos pueden hacerse claros, “fáciles” de leer,
Diseño de la herramienta G.I.A. (Gestión Integral de Accesibilidad) Alumno: Javier Cañadillas Pardo Tutor: Juan Carlos Naranjo (ITACA) Consultor: Fatos.
ANÁLISIS Y DISEÑO DESDE UNA PERSPECTIVA ORIENTADA A OBJETOS Alan Vargas.
MAIRA LUCIA ORTIZ CAMILO ORTEGON DIAZ CRISTIAN CAMILO VARGAS
DEPARTAMENTO DE INGENIERÍA INFORMÁTICA
M.C. Meliza Contreras González
Weka.
Plataforma ECM de Servicios On-Line con Acceso Mediante Voz.
Viviana Poblete López Módulo: Modelo de Datos
ACIDE A C onfigurable I ntegrated D evelopment E nvironment (Un entorno integrado de desarrollo configurable)
InfoPath Ventajas y Uso.
REALIZACIÓN DE PRÁCTICAS COMBINANDO INTERNET Y EL LABORATORIO EN LAS TITULACIONES DE INGENIERÍA TÉCNICA Fernando Gómez Bravo, Marcos del Toro Peral, Diego.
ASP.NET es una nueva y potente tecnología para escribir páginas web dinámica. Es una importante evolución respecto a las antiguas páginas ASP de Microsoft.
 Fue en el año 1945 cuando el matemático Jhon Von Neumann, fascinado por las posibilidades del ENIAC, demostró que una computadora podía tener una estructura.
El monitor automático de sistemas y servicios Manuel Martínez Guerrero.
Ciclo de Vida del Software Paradigmas de Desarrollo
Diseño de algoritmos La computadora puede realizar procesos y darnos resultados, sin que tengamos la noción exacta de las operaciones que realiza. Con.
Colegio de Bachilleres Plantel 13 Xochimilco-Tepepan Integrantes: Karen Elizabeth González Monroy Elizabeth De Jesús Vergara Grupo:308.
Eloísa Orozco Bueno Alvaro Padilla Vilema
Estefanía Fernández Oviedo Laura Isabel Gómez Parra
A finales de la década de 1990 un grupo de la universidad de carolina del norte propuso siete principios generales de diseño universal.
Comunicación y Multimedia
Ing. Elkin José Carrillo Arias
CONCEPTOS BÁSICOS Diseño de Sistemas.
El análisis fonético y sus aplicaciones Aprendizaje de lenguas: corrección de la propia lengua y enseñanza de otras lenguas Aprendizaje de lenguas: corrección.
APLICACIÓN EN VISUAL BASIC
ADAPTACIÓN DEL SISTEMA TELEFÓNICO MULTILÍNEA AL ESTÁNDAR TAPI Y ACCESO A BASE DE DATOS REMOTA MEDIANTE LLAMADAS RPC.
Mensajería cliente-servidor en Flex y Java
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
LOGO e-Learning Desktop Integración de RIA’s a objetos de Aprendizaje Alvaro Rodríguez, Darvin Orozco, Rocael Hernández Universidad Galileo {alvrodriguez,
El modelo de análisis tiene como objetivo generar una arquitectura de objetos que sirva como base para el diseño posterior del sistema. Dependiendo del.
Facultad de Ingeniería
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
Introducción al Lenguaje. ¿ Qué es PHP ? O Hypertext Pre-processoes (PHP) es un lenguaje de "código abierto" interpretado, de alto nivel, embebido en.
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Métrica v2.1 Técnicas: Modelado de datos (Parte 1)
OPTIMIZACIÓN DE UN SERVICIO AUTOMÁTICO DE PÁGINAS BLANCAS POR TELÉFONO: PROYECTO IDAS R. Córdoba, R. San-Segundo, J. Colás, J.M. Montero, J. Ferreiros,
Modelo OSI Surgimiento del Modelo OSI ¿Que es el Modelo OSI?
UNIVERSIDAD LATINA III. MANTENIMIENTO Y GESTIÓN DE LA INFORMACIÓN DE UNA BASE DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
DIEGO ARMANDO GÓMEZ CUERVO Desarrollo de aplicaciones WEB con herramientas de software libre.
FACULTAD: CIENCIAS ECONÓMICAS Y EMPRESARIALES ASIGNATURA: GESTIÓN DE CONTENIDO ELECTRÓNICO TÍTULO: TINFOPATH - VENTAJAS Y USO. AUTORA: MARIA DANIELA TOMALÁ.
Facultad de Informática Departamento de Lenguajes y Sistemas Informáticos e Ingeniería de Software UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID 1 Proceso.
PROTOCOLOS DE COMUNICACIÓN
Hipertexto Transfer Protocol o HTTP: define la sintaxis y la semántica que utilizan los elementos de software de la arquitectura web (clientes, servidores,
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
 Panorama General Fundamentos de Programación M.I. Jaime Alfonso Reyes Cortés.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Integrantes Miguel Betancourt Alexis Tacuri.  Activiti es una plataforma para la formación de flujos de trabajo y procesos empresariales dentro del.
Planificación Curso UNIDAD 1. INTRODUCCIÓN A LOS SERVICIOS EN RED UNIDAD 2. SERVICIOS DHCP UNIDAD 3. SERVICIOS DNS UNIDAD 4. SERVICIOS DE ACCESO REMOTO.
Autores: Myriam Montes, Iván Viera, Carlos Caizaguano, José Sancho
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
INTEGRACIÓN DE SISTEMAS DE DIÁLOGO HABLADO EN LA NUEVA GENERACIÓN DE ENTORNOS COMPUTACIONALES DE ACCESO A LA INFORMACIÓN. PROYECTO JUNTA CYL.
Transcripción de la presentación:

GENERACIÓN SEMIAUTOMÁTICA DE APLICACIONES DE DIÁLOGO MULTIMODALES: PROYECTO GEMINI R. Córdoba, L.F. D’Haro, J.M. Montero, J. Ferreiros, J. Macías-Guarasa, J.D. Romeral, J.M. Pardo Grupo de Tecnología del Habla. Departamento de Ingeniería Electrónica. Universidad Politécnica de Madrid

Proyecto Gemini Telecom I+D -2- PROYECTO GEMINI (Generic Environment for Multilingual Interactive Natural Interfaces)  Proyecto europeo a dos años ( ) ( IST )  OBJETIVOS –Desarrollo de un sistema de generación de aplicaciones de diálogo  Se parte de una descripción de la base de datos  Semiautomático –El diseñador especifica totalmente el diálogo usando asistentes  Se acelera el proceso –Multimodal: acceso por voz y por web –Multilingualidad: español, inglés, alemán y griego.

Proyecto Gemini Telecom I+D -3- INTRODUCCIÓN  Nos dirigimos a dos tipos de usuarios: –Los proveedores de servicios  Utilizan la herramienta de generación de diálogos  Ahorran tiempo de diseño  El mismo diseño sirve para la aplicación de voz y la basada en web –Los usuarios finales de las aplicaciones  Ventaja de poder acceder a un servicio a través de voz y de web  Acceso 24/7  Demostración: –Se han generado dos aplicaciones utilizando la plataforma:  Una aplicación bancaria  Una aplicación de atención al ciudadano

Proyecto Gemini Telecom I+D -4- ANTECEDENTES: TADE  Entorno para el desarrollo de aplicaciones telefónicas  Servicios vocales desarrollados. –Sistema de atención al cliente en Hewlett Packard –Servidores de notas de los alumnos: IEL y Rectorado de la UPM –Buzón de voz con grabación de mensajes y envío de –Servicio de reservas para Renfe –Servicio de páginas blancas (proyecto europeo IDAS)  Lenguaje propio con primitivas de alto nivel. –Gestión de línea telefónica: colgar, descolgar, esperar llamada... –Sentencias de voz: reconocimiento, síntesis, reproducción –Acceso a bases de datos: abrir/cerrar DB, realizar consulta –Generales: gestión de archivos, manejo de cadenas, etc. –...

Proyecto Gemini Telecom I+D -5- LA HERRAMIENTA DE GENERACIÓN DE DIÁLOGOS (AGP)  Conjunto integrado de herramientas y asistentes con los que automatizar el diseño de aplicaciones  Objetivos fundamentales: –La participación del diseñador debe ser mínima –Utilización de estándares para que la herramienta sea “autónoma”  Guión en el estándar VoiceXML para voz  Guión en xHTML para Web –Desarrollo de bibliotecas o módulos con los que resolver situaciones cotidianas –Desarrollo de una sintaxis basada en XML que hemos llamado GDialogXML (Gemini Dialog XML)  Lenguaje de modelado abstracto orientado a objetos  Simplifica la interacción entre los módulos

Proyecto Gemini Telecom I+D -6- ARQUITECTURA DEL AGP (I)  A grandes rasgos, hay TRES niveles básicos e independientes: –Nivel superior: se definen los aspectos globales de la aplicación y de los datos –Nivel intermedio: se define el diálogo de una forma independiente del idioma y de la modalidad –Nivel inferior: se completa el diálogo introduciendo los aspectos dependientes del idioma y de la modalidad  A continuación, el sistema genera automáticamente los guiones de la aplicación en todas las modalidades

Proyecto Gemini Telecom I+D -7- ARQUITECTURA DEL AGP (II)  Nivel superior (Framework Layer). 3 módulos: –Asistente de descripción de la aplicación: idiomas, modalidades, bibliotecas a utilizar, etc. –Asistente del modelo de los datos: descripción de las clases y atributos de la base de datos –Asistente de conexión con el modelo de datos: se definen las funciones de acceso a la base de datos  Su objetivo es independizar la base de datos de la aplicación

Proyecto Gemini Telecom I+D -8- ARQUITECTURA DEL AGP (III) Asistente del modelo de los datos

Proyecto Gemini Telecom I+D -9- ARQUITECTURA DEL AGP (IV)  Nivel intermedio (Retrievals Layer). 2 módulos: –Asistente de modelado del diálogo (RMA) Se describen:  Los estados de diálogo que componen el servicio  Las interacciones con el usuario  Las transiciones entre los estados del diálogo, etc. –Asistente de modelado de usuario  Introducir alternativas en el diálogo básico para adaptarse a la experiencia del usuario con el sistema  N niveles. Para cada uno:  Se ofrece más o menos información  Se confirma o no todo lo introducido

Proyecto Gemini Telecom I+D -10- ARQUITECTURA DEL AGP (V)  Nivel inferior (Dialogues Layer): –Asistente de extensión de modalidad  Aspectos dependientes del idioma (mensajes que pronuncia el sistema, vocabularios y gramáticas de cada idioma, etc.)  Aspectos dependientes de la modalidad (modos de confirmación, manejo de errores, cuántos resultados se presentan simultáneamente al usuario, etc.)  Se completa el esquema del diálogo especificado en el RMA –Generación automática de los guiones de ejecución en VoiceXML para voz y xHTML para web –Herramienta de modelado de lenguaje –Herramienta de creación de vocabularios

Proyecto Gemini Telecom I+D -11- EL ASISTENTE DE MODELADO DEL DIÁLOGO (I)  Desarrollado íntegramente en nuestro grupo: –Objetivo: ser intuitivo y automatizar el diseño del servicio –Se generan diálogos automáticamente a partir del modelo de datos. Por cada atributo se genera:  Un diálogo en el que se pregunta al usuario dicho atributo (entrada)  Un diálogo en el que se reproduce dicho atributo (salida) –Se pueden añadir cinco tipos de diálogos:  Basados en un bucle  Basados en una secuencia de acciones (o subdiálogos)  Basados en información introducida por el usuario  Basados en el valor de una variable  En blanco (para permitir la llamada a un diálogo que se va a definir posteriormente)

Proyecto Gemini Telecom I+D -12- EL ASISTENTE DE MODELADO DEL DIÁLOGO (II)

Proyecto Gemini Telecom I+D -13- EL ASISTENTE DE MODELADO DEL DIÁLOGO (III)

Proyecto Gemini Telecom I+D -14- EL ASISTENTE DE MODELADO DEL DIÁLOGO (IV)  Ejemplo de automatización: –Para datos que pertenecen al modelo de datos, el diálogo típico se puede definir arrastrando y soltando tres diálogos automáticos:  Diálogo que pregunta al usuario el atributo  Ej: Preguntar el Número de cuenta al usuario  Función de acceso a la base de datos  Ej.: Obtener objeto Cuenta dado el Número de cuenta  Diálogo que reproduce un atributo  Ej.: Decir el Saldo del objeto Cuenta obtenido –Los tres diálogos encadenan automáticamente los parámetros de entrada y salida

Proyecto Gemini Telecom I+D -15- EL ASISTENTE DE MODELADO DEL DIÁLOGO (V)

Proyecto Gemini Telecom I+D -16- LA TECNOLOGÍA SUBYACENTE (I)  Módulo de reconocimiento: –HMM continuos entrenados con la base de datos SpeechDat (4.000 locutores y unas 46 horas de grabación de habla continua) –Modelos contextuales agrupados mediante un algoritmo de árboles de decisión (1807 estados diferentes de 6 gaussianas) –Tasa de error: 4.2% (habla continua por teléfono, vocabulario de de palabras) –También reconocedores de habla aislada, dígitos y fechas –Adaptación a un intérprete de VoiceXML llamado OpenVXI  Módulo de conversión texto-voz: –Para generar mensajes de contenido variable

Proyecto Gemini Telecom I+D -17- LA TECNOLOGÍA SUBYACENTE (II)  Modelado de diálogo: –Se modelan las interacciones hombre-máquina –Se deben identificar los objetivos que desea el usuario –Diálogos de iniciativa mixta: el sistema hace una primera pregunta abierta y el usuario puede introducir información adicional  Modelado del lenguaje: –Posibles combinaciones de palabras que se pueden producir –Objetivo: tener modelos específicos de cada etapa del diálogo  Técnicas de adaptación  Módulo de comprensión: –Analizador semántico que detecta y representa semánticamente lo introducido por el usuario (los conceptos)

Proyecto Gemini Telecom I+D -18- LA TECNOLOGÍA SUBYACENTE (III)  Generación de lenguaje natural –Generación de texto a partir de conceptos  Debe ser natural y variado  Módulo de reconocimiento de idioma: –PPRLM, que se basa en modelar las secuencias de fonemas que más se producen para cada uno de los idiomas  Módulo de reconocimiento de locutor: –Identificación del usuario mediante técnicas automáticas –Se pueden usar modelos específicos de dicho usuario

Proyecto Gemini Telecom I+D -19- LA APLICACIÓN BANCARIA  Proporciona todo tipo de información bancaria: –Información general de productos del banco:  Créditos personales, hipotecas; depósitos y sus tipos de interés; tarjetas de crédito / débito, etc. –Autenticación del usuario:  El usuario debe introducir su número de cuenta y un PIN –Consultas y transacciones para las cuentas del cliente:  Saldos y movimientos para las cuentas y tarjetas de crédito, realización de transferencias entre cuentas, etc.  El prototipo final se está desarrollando actualmente

Proyecto Gemini Telecom I+D -20- CONCLUSIONES  Se ha desarrollado un sistema de generación de diálogos –Muy potente –Capaz de generar diálogos válidos para múltiples idiomas y dos modalidades partiendo de una descripción de la base de datos –Interacción simplificada con el diseñador –Desarrollo de diálogos de forma rápida y amigable  Utilización de estándares: –VoiceXML para voz –xHTML para Web –Sintaxis basada en XML en todo el AGP