Grupo de Aplicaciones del Procesado de Señal

Slides:



Advertisements
Presentaciones similares
Libro Blanco XBRL Objetivos del grupo de Tecnología de XBRL España: Objetivo general: Facilitar a las entidades interesadas en implantar XBRL el acceso.
Advertisements

SISTEMAS DE GESTIÓN DE LA SEGURIDAD DE LA INFORMACIÓN
Lenguaje Lic. Carlos Marenales
7ª Jornada sobre la Biblioteca Digital Universitaria JBDU2009 "La biblioteca universitaria en la web" 5 y 6 de noviembre de 2009 Biblioteca Central de.
Decisiones de diseño de bajo nivel
Voice eXtensible Markup Language (VXML)
MÉTODOS Y ELEMENTOS DE PROGRAMACIÓN
Prof. Adelaide Bianchini. Dpto. de Computación y Tecnología de la Información. Universidad Simón Bolívar. Mayo Diseño centrado en el usuario Prof.
Desarrollo de un laboratorio para la enseñanza, diseño y desarrollo de servicios móviles abiertos Autor: D. Mario de Molina Gómez Tutor: D. Francisco Javier.
Tecnologías de soporte para e-learning UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA UNIVERSITARIA DE INFORMÁTICA Departamento de Organización y Estructura.
MI PROGRAMA DE FORMACION
Profra: Verónica Pérez Rosas Introducción a la Programación Universidad Politécnica de Altamira.
Tipos de Servicios Web.
Módulo 1: Primeros Pasos
Javier López García OBJETIVOS DEL PROYECTO Diseñar una nueva arquitectura para SERVIVOX que le proporcione mayor modularidad y flexibilidad. Reestructurar.
Java 2 Platform Enterprise Edition
Introducción XML y WebServices.
Lógica de Programación
Yeimi Constanza Patiño
WWW (World Wide Web) Pedro José López Javier Díaz
Principios de diseño de Interfaces Prof. Adelaide Bianchini
HERRAMIENTAS CASE.
SEMANA Introducción.
© 2009 IBM Corporation End User Programming (Naturalmente) Pablo Pedemonte – SW Engineer 16 Sep 2010.
Ma. Antonieta Rodríguez CED-CELE. Contenido  eXe - Learning  Recursos didácticos para ambientes web.
DISEÑO DE LA INTERFAZ DE USUARIO
Sistemas de Información IS95872 Clase 03. Toma de decisiones Categorías Toma Estratégica de decisiones: Determina los objetivos, recursos y políticas.
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
ESTRATEGIAS DE APRENDIZAJE SENA – Regional Risaralda
UPV - EHU Konputagailuen Arkitektura eta Teknologia Saila Departamento de Arquitectura y Tecnología de Computadores 1 Sistemas Ubicuos 3. Gestión del contexto.
Esteban Angulo Sandra Jaramillo Angela Moreno
FORMACIÓN BÁSICA – NIVEL I y II. Índice. Los Bloques y documentos adjuntos. Análisis de un bloque de contenidos. Partes y metodología. Los Ámbitos en.
TIPOS DE SOFTWARE Se denomina software a un programa, equipamiento lógico o soporte lógico necesario para hacer posible la realización de una tarea con.
1 … Concepciones del aprendizaje Aprender es … … un actividad bioquímica en el cerebro. … un cambio en el comportamiento relativamente permanente. … es.
(C) Universidad de Las Palmas de Gran Canaria
Eloísa Orozco Bueno Alvaro Padilla Vilema
Arquitectura Orientada a Servicios
Marco Conceptual para la Gestión de Conocimiento de entornos de colaboración: aplicación a la creación de un portal de revistas electrónicas EUITIO Daniel.
Servidores Conceptos Generales.
Bienvenidos al Curso de Álgebra, Trigonometría y Geometría Analítica Código:
El análisis fonético y sus aplicaciones Aprendizaje de lenguas: corrección de la propia lengua y enseñanza de otras lenguas Aprendizaje de lenguas: corrección.
Ingeniería en Sistemas de Información Diseño de Sistemas (3K1)
Sistemas de Diálogo Hablado Workshop-Brainstorming 30 abril 2013 Seminario de Lógica y Lenguaje. Universidad de Sevilla.
Universidad Central de Venezuela Facultad de Ciencias Postgrado en Ciencias de la Computación Sistemas Distribuidos Albany Márquez.
Integrantes: Daniel Briceño Luis Carrera..  CommonKADS es la metodología desarrollada para apoyar la ingeniería del conocimiento.
Introducción al Proceso de Desarrollo de Software Patricio Letelier Centro de Formación de Postgrado – Depto. Sistemas Informáticos y Computación Universidad.
FRAMEWORK VS Código fuente
1. Fundamentación  Quiénes y para qué: conocimiento del grupo meta.  Qué: concepto de lengua  Cómo: proceso de aprendizaje de las lenguas,  Dónde:
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
Arquitecturas de Sistemas Interactivos: Introducción
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
GENERACIÓN SEMIAUTOMÁTICA DE APLICACIONES DE DIÁLOGO MULTIMODALES: PROYECTO GEMINI R. Córdoba, L.F. D’Haro, J.M. Montero, J. Ferreiros, J. Macías-Guarasa,
ANÁLISIS Y DISEÑO DE SISTEMAS II
Introducción a UML Departamento de Informática Universidad de Rancagua
III. DESARROLLO DE SISTEMAS.. Podemos definir el desarrollo de sistemas informáticos como el proceso mediante el cual el conocimiento humano y el uso.
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Actividades en el Proceso de desarrollo de Software
Naime Cecilia del Toro Alvarez
EL MAESTRO DEL SIGLO XXI Programa de Foros y Diálogos Secretaría de Educación de Guanajuato Francisco López Díaz Suma por la Educación.
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Tecnologías del lenguaje
FACULTAD DE CIENCIAS COMPUTACIONALES Y TELECOMUNICACIONES ASIGNATURA:
Capas de ingeniería del Software. Rosendo Antonio Manuel Ingeniería en Sistemas Computacionales.
República Bolivariana de Venezuela Universidad Nacional Experimental Politécnica de la Fuerza Armada (UNEFA) Carrera: Ingeniería de Sistemas Cátedra: Análisis.
SISTEMA DE CÓMPUTO PARA LA COMUNICACIÓN HOMBRE -MÁQUINA
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
TÓPICOS SELECTOS DE TI WEB SEMÁNTICA GRUPO: ITIC- 411 UNIVERSIDAD TECNOLOGICA DE NEZAHUALC Ó YOTL ENERO 2012.
IMPORTANCIA DE LAS TIC Y SU APROVECHAMIENTO EN LA EDUCACIÓN.
Natural Language, VOCALCOM Company Aplicaciones de los sistemas de lenguaje natural automatizado a la Sanidad PRINCIPIOS, ENFOQUES Y RETOS.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Transcripción de la presentación:

Grupo de Aplicaciones del Procesado de Señal Problemática de Diseño de Sistemas de Diálogo Prof. Luis A. Hernández Gómez Grupo de Aplicaciones del Procesado de Señal

Tecnología del Habla Codificación de Voz Reconocimiento de Habla GSM (ACELP) Esquemas tipo CELP: UMTS (AMR) Voz IP (G729a, G723.1, ..) Codificación de Voz Reconocimiento de Habla Conversión Texto - Habla Modelado Acústico: Modelos Ocultos de Markov (HMM) Modelado del Lenguaje: N-gramas Modelado Prosódico: sonidos, pausado, entonación Sintetizadores de Voz: unidades pre-grabadas

Sistemas de Comunicaciones Zona H.323 GATEKEEPER GATEWAY RTC Intranet Internet RDSI Terminal IP ROUTER Portal de Voz Servicios propios de la red: Funcionalidad Bases de información Servicios de otras redes

Sistema de Diálogo Hablado RTC RTC GATEKEEPER GATEWAY Zona H.323 Portal de Voz DIÁLOGO Servicios propios de la red: Funcionalidad Bases de información Servicios de otras redes RDSI Intranet ROUTER Internet

Estructura Básica de un Sistema de Diálogo Grupo de Aplicaciones del Procesado de Señal UNIVERSIDAD POLITÉCNICA DE MADRID

Sistemas de Diálogo Generador Mensajes de Salida Conversor Texto - Habla GESTOR DE DIÁLOGO Codificación de Voz H.323 Reconocedor de Habla Analizador Semántico Servicios

Gestor de Diálogo Campo de investigación de la Lingüística Computacional Análisis del Discurso: metodología, principios y conceptos propios de la lingüística Análisis de la Conversación: metodología inductiva y empírica Actos de Habla Contexto (pragmática) Turnos de palabra Estructura de la conversación

Gestor de Diálogo Tesis Doctoral Universidad de Sevilla Facultad de Filología Departamento de Lengua Inglesa (Filología Inglesa) Un modelo para la especificación lingüística y la gestión computacional de diálogos hombre-máquina mediante instrucciones expresadas en lenguaje natural Mª Gabriela Fernández Díaz 2000 Directores: Jose Gabriel de Amores Carredano José Francisco Quesada Moreno

Problemática Actual Falta de madurez: Inmediatez de nuevos servicios: Reconocimiento (?) y Gestión de Diálogo Inmediatez de nuevos servicios: Servicios de “valor añadido”

¿Objetivo del Sistema de Diálogo? ¿Simular un diálogo entre personas ? Eficacia : (últil) para realizar tareas rutinarias. Libertad de expresión : (¿Lenguaje Natural?) evitando memorizar formas expresivas fijas. Ayuda: información y tutelaje para usuarios nuevos Perfiles de usuario Tareas

Perfiles de Usuario Nivel de experiencia: experto - novato Relación con el reconocimiento: “granja” Trato: coloquial - educado Edad / Relación con la tecnología: asiduo - casual Operaciones o funciones permitidas y no permitidas Dialecto / Idioma Detectar perfil Estrategia flexible: iniciativa mixta / iniciativa sistema Permitir paso a agentes de operación

Sistema de Diálogo Generador Mensajes de Salida GESTOR DE DIÁLOGO Subdiálogos AYUDA Estructuras de Conversación para Perfiles Diferentes AGENTE Generador Mensajes de Salida GESTOR DE DIÁLOGO Analizador Semántico

Tareas Niveles: (J. Allen, ACL 95 // Proyecto SIRIDUS) Sin restricción (?) Diálogos de lenguajes de comandos naturales (natural command language dialogues) Diálogos negociados (negotiate dialogues) Gestor de Aplicación Agentes de razonamiento y resolución de problemas

AGENTES DE RAZONAMIENTO Y RESOLUCIÓN DE PROBLEMAS Sistema de Diálogo Subdiálogos AYUDA Estructuras de Conversación para Perfiles Diferentes AGENTE Generador Mensajes de Salida GESTOR DE DIÁLOGO Funciones del Servicio B.D. Conocimiento del Dominio GESTOR DE APLICACIÓN AGENTES DE RAZONAMIENTO Y RESOLUCIÓN DE PROBLEMAS Analizador Semántico

Otros niveles de dificultad Competencia lingüística: capacidad para resolver estructuras y fenómenos supra oracionales (elipsis, anáforas) “Errores” en la entrada al sistema: propios del habla espontánea originados en el Reconocedor de Habla situaciones típicas: no reconocimiento, no respuesta, time-out, ...

AGENTES DE RAZONAMIENTO Y RESOLUCIÓN DE PROBLEMAS Sistema de Diálogo Subdiálogos AYUDA AGENTE Generador Mensajes de Salida Histórico Anáforas Elipsis Subdiálogos de recuperación de errores Estructuras de Conversación para Perfiles Diferentes GESTOR DE DIÁLOGO Funciones del Servicio B.D. Conocimiento del Dominio GESTOR DE APLICACIÓN AGENTES DE RAZONAMIENTO Y RESOLUCIÓN DE PROBLEMAS Analizador Semántico

El núcleo Estrategias de diálogo: Gramáticas de diálogo Enfoques declarativos Enfoques basados en marcos Arquitecturas distribuidas Enfoques basados en planes Enfoques colaborativos Enfoques basados en agentes racionales El problema: dependencia de la aplicación o de la tarea Generalmente se recurre a estrategias mixtas

Dependencia de la aplicación Objetivo de proyectos de investigación: DISC, TRINDI, SIRIDUS I3S: Intuitive Interfaces to Information Systems Microelectronic and Computer Terchnology Corporation (MCC) South Western Bell / TRI; Nortel, Texas Instruments y Telefónica I+D “Desarrollar una arquitectura de sistema de diálogo independiente de la aplicación y que permita un desarrollo rápido de aplicaciones de diálogo dentro de una banda de dominios razonablemente amplia”

I3S: Intuitive Interfaces to Information Systems Adaptación a nuevas aplicaciones I3S: Intuitive Interfaces to Information Systems (MCC) “El objetivo último es conseguir que la tarea de adaptar el sistema de diálogo a nuevas aplicaciones pudiese ser realizada de forma rápida y sencilla por personal sin unos conocimientos especialmente profundos del sistema de diálogo”

Adaptación de componentes de un Sistema de Diálogo Grupo de Aplicaciones del Procesado de Señal UNIVERSIDAD POLITÉCNICA DE MADRID

Analizador Semántico Tesis Doctoral Universidad de Sevilla Facultad de Filología Departamento de Lengua Inglesa (Filología Inglesa) Estrategias de análisis gramatical y semántico para un sistema dirigido por voz Mª Teresa López Soto 1999 Directores: Jose Gabriel de Amores Carredano José Francisco Quesada Moreno

Analizador Semántico Representación estructurada de los enunciados del usuario, generalmente requiere: Diseño de ontología adaptada a la tarea Representación basada en estructuras y formas expresivas características de la aplicación Desambiguación basado en información adaptada al dominio

Generador de Mensajes de Salida Definición de etiquetas correspondientes a actos de habla del sistema Ajuste de formas expresivas al dominio particular de la aplicación Elaboración de frases de ayuda y formas adaptadas a diferentes perfiles de usuario

Reconocedor de Habla Natural Modelado Acústico: independiente de la aplicación Modelo de Lenguaje: (Alexander Rudnicky, School of Computer Science, CMU) Speech data Acoustic models Transcribe* Train Text data Language models Train

Adaptación de Componentes Importante número de tareas manuales Procedimientos basados en la disponibilidad de un corpus suficientemente representativo de la aplicación diálogos persona-persona simulaciones Mago de Oz sucesivas versiones del sistema: usuarios reales !!! imaginación de los diseñadores Gran interdependencia entre componentes chicken and egg problem “Data Collection and Performance Evaluation of Spoken Dialogue Systems: The MIT experience” J. Glass, J. Polifroni, S. Seneff and V. Zue (ICSLP 2000)

Dependencia entre Componentes Generador Mensajes de Salida Conversor Texto - Habla GESTOR DE DIÁLOGO Codificación de Voz H.323 Reconocedor de Habla Analizador Semántico Servicios

Resumen de ámbitos problemáticos Funcionalidad del Sistema de Diálogo (perfiles de usuario y tareas) Estrategias de diálogo (dependencia con la aplicación) Desarrollo y adaptación a diferentes dominios (Otros: Evaluación de Sistemas de Diálogo)

UNIVERSIDAD POLITÉCNICA DE MADRID ¿Soluciones? Grupo de Aplicaciones del Procesado de Señal UNIVERSIDAD POLITÉCNICA DE MADRID

¿Diálogo genérico o diálogos comunes? Diálogo genérico: arquitectura independiente de la aplicación (I3S) Diálogos comunes: (Novic y Sutton, 1996) “postura contraria a la abstracción construyendo bibliotecas de diálogos comunes”

Sistemas de Diálogo Siridus (Disc, Trindi): SRI, Univ. Göteborg, Univ. Saarland de Saarbrücken, Univ. Sevilla y Telefónica I+D Universidad de Sevilla: DELFOS Universidad de Granada: (Ramón López-Cózar) Univ. Politécnica de Catalunya, Univ. Politécnica de Valencia, Univ. Zaragoza, Univ. del País Vasco, Univ. Jaume I: “Desarrollo de un Sistema de Diálogo para Habla Espontánea en un Dominio Semántico Restringido” (TIC98-0423-C06) AGORA: (J. Relaño y M.C. Rodríguez) Plataforma de diseño de Sistemas de Diálogo desarrollada por UPM y Telefónica I+D

Nuance: (http://www.nuance.com) Bibliotecas de diálogos comunes Nuance: (http://www.nuance.com) Voice Web Speech Objects: “SpeechObjects are a set of open, reusable components that encapsulate the best practices of voice interface design. Developers use SpeechObjects to considerably reduce the time it takes to build high quality speech recognition and voice authentication applications” VoiceXML

BeVocal: BeVocal Cafe + SpeechObjects (http://www.cafe.bevocal.com) Foro VoiceXML (I) Estándar tecnológico promovido por AT&T, IBM, Lucent y Motorola (en la actualidad cuenta con el apoyo de cerca de 300 empresas del sector. http://www.voicexml.org) IBM: IBM Voice Server SDK Beta herramienta basada en VoiceXML Version 1.0 (http://www.alphaworks.ibm.com) Nuance: Nuance V-Builder™, herramienta gráfica para el diseño de aplicaciones VoiceXML TellMe: TellMe Studio, entorno de desarrollo de aplicaciones VoiceXML (http://www.tellme.com) BeVocal: BeVocal Cafe + SpeechObjects (http://www.cafe.bevocal.com)

Foro VoiceXML (II) Crear contenidos Web y servicios que sean accesibles mediante voz VoiceXML V1.0 (marzo 2000) aprobada por el W3C World Wide Web Consortium “The W3C speech interface framework will include integrated markup languages for dialog, grammar, speech synthesis, natural language semantics and multimodal dialogs, as well as a standard list of reusable dialogs” Jim Larson (Intel Architecture Labs) Co-chair of the W3C Voice Browser Woprking Group

Foro VoiceXML (III) VoiceXML pretende hacer transparente a los desarrolladores de aplicaciones para Internet, la programación a bajo nivel relacionada con los Sistemas de Diálogo

(Contexto del Intérprete VoiceXML) SERVIDOR DE DOCUMENTOS Modelo de Arquitectura VoiceXML VoiceXML GATEWAY (Contexto del Intérprete VoiceXML) Intérprete VoiceXML Internet PLATAFORMA DE IMPLEMENTACIÓN : Reconocimiento Síntesis SERVIDOR DE DOCUMENTOS

Estructuras de Diálogo VoiceXML Estructura de diálogo: Máquina de Estados definida a través de una serie de documentos VoiceXML (sesión - aplicación) Gestión flexible de gramáticas (varios documentos), que permite iniciativa mixta Gestión de eventos genéricos (no respuesta, cuelgue, time-out, ...) Tipos de diálogo: Formulario Menú Sub-diálogos: Recuperación de errores Librería de sub-diálogos comunes a diferentes aplicaciones

Ejemplo Simple VoiceXML <?xml version="1.0"?> <vxml> <form> <field name = “bebida”> <prompt>¿Qué tipo de bebida quieres: café, leche o té?</prompt> <grammar src=”bebidas.gram"/> </field> <block> <goto next=”http:/www.bebidas.ejemplo/bebidas2.asp” submit=“bebida” method=“get”/> </block> </vxml>

Ejemplo Simple VoiceXML S1 (sistema): ¿Qué tipo de bebida quieres: café,leche o té? U1 (usuario): quiero un café con leche S2: Perdón no te he entendido, puedes repetir ¿Qué tipo de bebida quieres: café,leche o té? U2: sí, que quiero café S3: tenemos varios tipos de café... ...

Grupo de Aplicaciones del Procesado de Señal Problemática de Diseño de Sistemas de Diálogo Prof. Luis A. Hernández Gómez Grupo de Aplicaciones del Procesado de Señal