¿Que es el reconocimiento de voz?

Slides:



Advertisements
Presentaciones similares
Org. y Arquitectura del Computador
Advertisements

LICENCIATURA EN SISTEMAS COMPUTACIONALES EN ADMINISTRACION Inteligencia Artificial Octavo Cuatrimestre CENTRO DE ESTUDIOS SUPERIORES DE MARTINEZ DE LA.
Tipos de software y su desarrollo
Robótica Aplicada: Construyendo un Robot MC. Juan Fco. Robles Camacho Instituto de Investigación y Desarrollo Tecnológico de la Armada de México. (INIDETAM)
Introducción a las Redes neuronales
SERVOMOTORES.
INGENIERÍA DE SOFTWARE Introducción Arquitectura de Software
¿Qué es Sofware? Son el conjunto de instrucciones que dirigen las actividades del Hardware Consiste en programas, módulos de soporte y archivos de datos,
Fundamentos de Diseño de Software INFT.1
Ing. Zamudio Mendoza Mario Said
Intoduccion a la Arquitectura y Organizaciòn del Computador
Escuela Santo Hermano Miguel
2.- EL SISTEMA DE COMUNICACIONES DE DATOS. El sistema de comunicaciones de datos, es un sistema de proceso de datos, en el que los periféricos, pueden.
Virtual PC.
Visión de máquina: un reto para hacer I.A.
¿Cómo hacer para que una máquina comprenda el LN?
Prof. Adelaide Bianchini. Dpto. de Computación y Tecnología de la Información. Universidad Simón Bolívar. Mayo Diseño centrado en el usuario Prof.
RESUMEN: Softmicro de 8 bits Xilinx
Altavoces/Auriculares
¿Qué es un modelo conceptual?
PROYECTO DE GRADO CARLOS STALIN ALVARADO SANCHEZ
ARP Y RARP.
La CPU Unidad Central de Proceso.
Programas Son una serie o secuencia de instrucciones entendibles por los ordenadores que permiten la realización de las acciones o tareas para las que.
Seminario programación microcontroladores ARM LPC 1769
Inteligencia artificial
Síndrome de Asperger.
Sistemas Evolutivos Introduccion.
Elemento Lógico (Software)
Tipos de Computadoras Deacuerdo a lo o que Procesan y su velocidad. Herramientas Computacionales 1 Instituto de Ciencias y Estudios Superiores de Tamaulipas.
Programas informáticos. Software Se denomina software al conjunto de programas y procedimientos necesarios para hacer posible la realización de una tarea.
Zócalo o conexión de la placa base que se utiliza para instalar el procesador. es un método para la comunicación.
Procesador Introducción - Funcionamiento - Memoria caché

Aplicaciones de Técnicas de IA Ana Lilia Laureano-Cruces UAM-A.
Raúl Heiras Andazola Edgar A. Robles Reyes Luis Alonso Ramos Fdez Diseño de Robots Dr. Carlos F. Pfeiffer Octubre 22, 2003.
BUS DE DATOS.
LENGUAJE DE PROGRAMACIÓN
P ROYECTO DE G RADUACIÓN I MPLEMENTACIÓN DE UN S ISTEMA DE C OMUNICACIÓN POR MEDIO DE LA RED GSM EN UN P ROCESADOR E MBEBIDO C ONFIGURABLE NIOS II Integrantes:
ISF5501 Ingeniería de Software
Fundamentos de Programación Resolución de Problemas con Computadoras y Herramientas de Programación.
EL SISTEMA OPERATIVO.
Cómo adquirir programas
Los Sistemas Operativos
Practica 4 supercomputadoras.
FUNDAMENTOS DE PROGRAMACION
HARDWARE Asier Indurain.
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
Componentes Físicos y Lógicos de un Computador
Sistemas Operativos.
TIPOS DE INTELIGENCIA Esta plantilla se puede usar como archivo de inicio para proporcionar actualizaciones de los hitos del proyecto. Secciones Para agregar.
Metodología de la programación
Comunicación interpersonal en las organizaciones
LINGÜÍSTICA UNIDAD 2. Unidad 2: “PROCESAMIENTO DE ORACIONES” INTENCIONALIDADES FORMATIVAS FASE RECONOCIMIENTO COMPETENCIAS COGNITIVACOMUNICATIVAVALORATIVACONTEXTUAL.
Sistemas Operativos.
LENGUAJES DE PROGRAMACIÓN 8.1 BREVE HISTORIA. Traducción-Ejecución Bajo nivel o 1º Nivel Se dice que el código binario es de "bajo nivel" o "primer nivel"
Juan camilo obando gaviria 11c
Nico Puch. Los ordenadores analógicos comenzaron a construirse a principios del siglo XX. Los primeros modelos realizaban los cálculos mediante ejes y.
Tipos de computadores Personales.
Software.
RESUMEN: Softmicro de 8 bits Xilinx
INTELIGENCIA ARTIFICIAL APLICADA A LA ROBOTICA
 Panorama General Fundamentos de Programación M.I. Jaime Alfonso Reyes Cortés.
 Arquitectura de microordenadores  Sistemas operativos  Entornos gráficos  Procesadores de texto  Hojas de cálculo  Programas de gráficos  Bases.
PROCESADOR.- El procesador es el cerebro del sistema, encargado de procesar toda la información. Básicamente, es el "cerebro" de la computadora. Prácticamente,
Por: Javier Gutiérrez. La primera generación abarca desde el año 1938 hasta el año Estaban construidos con electrónica de válvulas y se programaban.
CICLO DE VIDA DE UN SOFTWARE. Es el conjunto de los programas de cómputo, procedimientos, reglas, documentación y datos asociados, que forman parte de.
Objetivos de la prueba Los objetivos principales de realizar una prueba son: Detectar un error. Tener un buen caso de prueba, es decir que tenga más probabilidad.
Programación I Prof. Carolina Cols. Algoritmo es una lista bien definida, ordenada y finita de operaciones que permite hallar la solución a un problema.
INFORMATICA Y ROBOTICA Inteligencia artificial. La informática  La computadora es un dispositivo mediante el cual se procesa una serie extensa de datos,
Transcripción de la presentación:

¿Que es el reconocimiento de voz? Locutor Lenguaje Natural actúa por frases y patrones mas que por cada palabra

¿Como se programa un robot con lenguaje Natural? Un robot Teleoperado: La idea es establecer un diálogo natural entre un humano y la máquina de tal forma que un operario no cualificado pueda manejar el robot a través de una semántica en la que está representado el entorno y su relación con el robot. Algunos ejemplos: 1992: Sistema SAM (Speech Activated Manipulator), descrito en [Brown 92] de los laboratorios Bell de AT&T 1994: Trabajos de C. Crangle y P. Suppes descritos en [Crangle 94]. 1996: Trabajos sobre unidades de montaje instruibles mediante lenguaje natural [Knoll 96]..

¿Como se Procesa el lenguaje Natural? · Reconocimiento de voz. Consiste en el análisis de la señal de voz continua para transformarla en una secuencia de palabras textuales que forman la frase. · Análisis sintáctico. Consiste en el análisis de la secuencia de palabras y produce una representación de su estructura (en forma de árbol, red, etc.). · Análisis semántico. A partir de la estructura generada por el proceso sintáctico genera otra estructura o forma lógica asociada que representa el significado de la frase. Este análisis puede realizarse simultáneamente al análisis sintáctico. · Análisis pragmático e integración del discurso. Utiliza la forma lógica o estructura semántica de la fase anterior para obtener la interpretación final de la frase, en función del estado actual del contexto.

Proceso seguido en el interfaz de voz para el robot.

Algunos Robots que reconocen la voz Nombre Aplicación Más información KISMET Aprendizaje www.kismet.com AIBO Ciberanimal Www.aibo.com DORAEMON Juguete http://mdn.mainichi.co.jp/news/20040115p2a00m0bu007000c.html DORAEMON http://www.akibalive.com/archives/000511.html

KISMET Sus entradas del sensorio primarias incluyen la visión, audición, y rotación de la juntura de sus grados de libertad. Sus rendimientos incluyen vocalizaciones, la cabeza y orientación del ojo, y las expresiones faciales. Se han diseñado hardware y arquitecturas de mando de soft para el desafío de tiempo-real que procesan los signos visuales (acercándose a 30 Hz) y el auditorio señala (8 kHz prueban la proporción y ventanas del marco de 10 ms) con latencias mínimas (menos de 500 ms). El sistema de percepción alto-nivelado, el sistema de la motivación, de conducta, de habilidad de motor, y del motor de la cara se ejecuta con cuatro microprocesadores Motorola 68332 y un Ceceo multi-enhebrado Volver

Detalles de Kismet Si una persona es visible, pero está demasiado distante para su cara el robot crea una conducta para convocar a la persona y que se acerque. Si las personas se acercan demasiado, el robot presenta dificultad por causa del estrecho campo de vista de las cámaras. En esta circunstancia, una contestación de retiro se invoca, donde el robot se retira físicamente hacia atrás con respecto de la persona. Si objetos o las personas mueven a velocidades excesivas, el robot presenta limitaciones Si se las personas se mueven muy rápido o hablan muy velozmente el robot tiende a irritarse, manifestandolo con su expresión o su voz

Más detalles de Kismet El procesado de visión, atención visual y están realizados con nueve conectores. Usa computadoras de 400 MHz QNX (sistema operativo de Unix en tiempo-real). La síntesis del discurso expresiva y el reconocimiento del intento afectivo vocal corre en un 450 MHz PC dual NT El sistema de reconocimiento de discurso corre en un 500 MHz PC Linux.

AIBO ESPECIFICACIONES TECNICAS De la última generación: La unidad de procesamiento central es un procesador RISC de 64 bits de 576 MHz con 256 MB de RAM, con un sistema operativo OPEN-R v.1.1.2 de Sony. Red Inalámbrica IEEE 802.11b Salida Midi de 64 Canales Sensores Táctiles Micrófonos en estero Panel de leds en la cara que indican su estado de ánimo. Sensor de Aceleración y angular Sensor de Vibración Sensor detector de Bordes Sensor de distancia Sensor de imágenes de 350K píxeles Mecánicamente Aibo tiene 18 coyunturas produciendo 250 tipos de movimientos. La mayoría de las ordenes que se le pueden dar, se le dan mediante un telemando pero ya responde a algunas ordenes dadas por la voz Volver

DORAEMON El fabricante de juguetes Bandai Co. ha traído al popular Doraemon a "la vida" produciendo un robot que puede conversar con los seres humanos. Mide 26.5 centímetros de alto y pesa 1.3 kilogramos Utiliza sensores de reconocimiento de voz para interactuar con los seres humanos. Puede utilizar cerca de 750 palabras habladas (con la voz de la versión animada de Doraemon), Puede reconocer nueve palabras humanas. El robot contiene 10 tipos de sensores, de luz, de inclinación, y de "tacto" (puede decir cuándo alguien le toca en la cabeza).

Aspecto Netamente Técnico KIT-SP03 Text to Speech Synthesizer ...US$82.00 El SP03 módulo incluye un amplificador del audio, un regulador de 3volt y conversión nivelada a 5volts, un procesador PIC para proporcionar fácil comunicación e incluso un portavoz pequeño de 40mm, junto con el Winbond WTS701. Las interfaces incluyen una interface RS232 serie, una de bus I2C y una interface paralela. La interface paralela se usa por seleccionar uno de 30 frases predefinidas El texto arbitrario puede enviarse al módulo vía la RS232 y I2C. Esta interface permite el generar la comunicación del lenguaje natural del robot basado en el sensor variante y los datos del algoritmo.