La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

¿Que es el reconocimiento de voz?

Presentaciones similares


Presentación del tema: "¿Que es el reconocimiento de voz?"— Transcripción de la presentación:

1 ¿Que es el reconocimiento de voz?
Locutor Lenguaje Natural actúa por frases y patrones mas que por cada palabra

2 ¿Como se programa un robot con lenguaje Natural?
Un robot Teleoperado: La idea es establecer un diálogo natural entre un humano y la máquina de tal forma que un operario no cualificado pueda manejar el robot a través de una semántica en la que está representado el entorno y su relación con el robot. Algunos ejemplos: 1992: Sistema SAM (Speech Activated Manipulator), descrito en [Brown 92] de los laboratorios Bell de AT&T 1994: Trabajos de C. Crangle y P. Suppes descritos en [Crangle 94]. 1996: Trabajos sobre unidades de montaje instruibles mediante lenguaje natural [Knoll 96]..

3 ¿Como se Procesa el lenguaje Natural?
· Reconocimiento de voz. Consiste en el análisis de la señal de voz continua para transformarla en una secuencia de palabras textuales que forman la frase. · Análisis sintáctico. Consiste en el análisis de la secuencia de palabras y produce una representación de su estructura (en forma de árbol, red, etc.). · Análisis semántico. A partir de la estructura generada por el proceso sintáctico genera otra estructura o forma lógica asociada que representa el significado de la frase. Este análisis puede realizarse simultáneamente al análisis sintáctico. · Análisis pragmático e integración del discurso. Utiliza la forma lógica o estructura semántica de la fase anterior para obtener la interpretación final de la frase, en función del estado actual del contexto.

4 Proceso seguido en el interfaz de voz para el robot.

5 Algunos Robots que reconocen la voz
Nombre Aplicación Más información KISMET Aprendizaje AIBO Ciberanimal DORAEMON Juguete DORAEMON

6 KISMET Sus entradas del sensorio primarias incluyen la visión,
audición, y rotación de la juntura de sus grados de libertad. Sus rendimientos incluyen vocalizaciones, la cabeza y orientación del ojo, y las expresiones faciales Se han diseñado hardware y arquitecturas de mando de soft para el desafío de tiempo-real que procesan los signos visuales (acercándose a 30 Hz) y el auditorio señala (8 kHz prueban la proporción y ventanas del marco de 10 ms) con latencias mínimas (menos de 500 ms). El sistema de percepción alto-nivelado, el sistema de la motivación, de conducta, de habilidad de motor, y del motor de la cara se ejecuta con cuatro microprocesadores Motorola 68332 y un Ceceo multi-enhebrado Volver

7 Detalles de Kismet Si una persona es visible, pero está
demasiado distante para su cara el robot crea una conducta para convocar a la persona y que se acerque. Si las personas se acercan demasiado, el robot presenta dificultad por causa del estrecho campo de vista de las cámaras. En esta circunstancia, una contestación de retiro se invoca, donde el robot se retira físicamente hacia atrás con respecto de la persona. Si objetos o las personas mueven a velocidades excesivas, el robot presenta limitaciones Si se las personas se mueven muy rápido o hablan muy velozmente el robot tiende a irritarse, manifestandolo con su expresión o su voz

8 Más detalles de Kismet El procesado de visión, atención visual y están realizados con nueve conectores. Usa computadoras de 400 MHz QNX (sistema operativo de Unix en tiempo-real). La síntesis del discurso expresiva y el reconocimiento del intento afectivo vocal corre en un 450 MHz PC dual NT El sistema de reconocimiento de discurso corre en un 500 MHz PC Linux.

9 AIBO ESPECIFICACIONES TECNICAS De la última generación: La unidad de procesamiento central es un procesador RISC de 64 bits de 576 MHz con 256 MB de RAM, con un sistema operativo OPEN-R v de Sony. Red Inalámbrica IEEE b Salida Midi de 64 Canales Sensores Táctiles Micrófonos en estero Panel de leds en la cara que indican su estado de ánimo. Sensor de Aceleración y angular Sensor de Vibración Sensor detector de Bordes Sensor de distancia Sensor de imágenes de 350K píxeles Mecánicamente Aibo tiene 18 coyunturas produciendo 250 tipos de movimientos. La mayoría de las ordenes que se le pueden dar, se le dan mediante un telemando pero ya responde a algunas ordenes dadas por la voz Volver

10 DORAEMON El fabricante de juguetes Bandai Co. ha traído al popular Doraemon a "la vida" produciendo un robot que puede conversar con los seres humanos. Mide 26.5 centímetros de alto y pesa 1.3 kilogramos Utiliza sensores de reconocimiento de voz para interactuar con los seres humanos. Puede utilizar cerca de 750 palabras habladas (con la voz de la versión animada de Doraemon), Puede reconocer nueve palabras humanas. El robot contiene 10 tipos de sensores, de luz, de inclinación, y de "tacto" (puede decir cuándo alguien le toca en la cabeza).

11 Aspecto Netamente Técnico
KIT-SP03 Text to Speech Synthesizer ...US$82.00 El SP03 módulo incluye un amplificador del audio, un regulador de 3volt y conversión nivelada a 5volts, un procesador PIC para proporcionar fácil comunicación e incluso un portavoz pequeño de 40mm, junto con el Winbond WTS701. Las interfaces incluyen una interface RS232 serie, una de bus I2C y una interface paralela. La interface paralela se usa por seleccionar uno de 30 frases predefinidas El texto arbitrario puede enviarse al módulo vía la RS232 y I2C. Esta interface permite el generar la comunicación del lenguaje natural del robot basado en el sensor variante y los datos del algoritmo.


Descargar ppt "¿Que es el reconocimiento de voz?"

Presentaciones similares


Anuncios Google