La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo.

Presentaciones similares


Presentación del tema: "Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo."— Transcripción de la presentación:

1 Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo M. en C. Fuentes Covarrubias Andrés Gerardo

2 Índice Introducción. Antecedentes. Estado del arte. Procesamiento del lenguaje natural. o Aparato fonador Entorno de desarrollo Arduino. Robot Mitsubishi rv-m1 Circuito del control Veear. Conclusiones. Bibliografía.

3 Introducción En la actualidad se busca la automatización de todos los procesos de la vida diaria, mejorando de esta manera la calidad de vida de las personas. La finalidad de este proyecto es controlar dispositivos por comandos de voz, de tal manera que cualquiera pueda comunicarse con estos. El proyecto consistió en el diseño y la implementación del controlador encargado de manejar el posicionamiento del brazo del robot Mitsubishi rv-m1 aplicando técnicas del lenguaje natural por medio del speech recognition kit SR-06/sr-07, así como la utilización del entorno Arduino para programar la interfaz entre la tarjeta de voz y el brazo de robot. Nuestros objetivos planteados al inicio de la investigación fueron: Diseñar la interfaz entre el speech recognition kit y el brazo de robot Mitsubishi rv-m1 con la ayuda del entorno Arduino. Desarrollar la tabla de posiciones del brazo del robot. Adaptar el hardware del brazo robótico con la tarjeta de voz.

4 Antecedentes En el año 1870 Alexander Graham Bell quería construir un sistema/dispositivo que hiciera el habla visible a las personas con problemas auditivos donde el resultado fue el teléfono. En el año 1880 Tihamir Nemes solicita permiso para desarrollar un sistema de transcripción automática que identificara secuencias de sonidos y los imprimiera (texto), pero fue rechazado como "Proyecto no Realista". Treinta años después AT&T Bell Laboratories construye la primera máquina capaz de reconocer voz. Requería extenso reajuste a la voz de una persona, pero una vez logrado tenía un 99% de certeza. Por lo tanto surge la esperanza de que el reconocimiento de voz sea simple y directo. A mediados de los 60's la mayoría de los investigadores reconoce que era un proceso mucho más intrincado y sutil de lo que habían anticipado. Por lo tanto empiezan a reducir los alcances y se enfocan a sistemas más específicos como: Dependientes del Locutor. Flujo discreto de habla (con espacios / pausa entre palabras). Vocabulario pequeño (menor o igual a 50 palabras).

5 Después, IBM y CMV trabajan en reconocimiento de voz continuo pero no se ven resultados hasta los 70's. A principios de ellos se produce el 1er Producto de reconocimiento de voz, el VIP100 de Threshold Technology Inc. (utilizaba un vocabulario pequeño, dependiente del locutor, y reconocía palabras discretas). Gana el U.S. National Award en Más tarde nace el interés de ARPA del U.S. Department of Defense, y gracias al lanzamiento de grandes proyectos de investigación y financiamiento por parte del gobierno, se precipita la época de la inteligencia artificial. El proyecto financiado por ARPA busca el reconocimiento de habla continua de un vocabulario extenso, impulsando a los investigadores a que se enfoquen en el entendimiento del habla. Los sistemas empiezan a incorporar módulos de: Análisis léxico (conocimiento léxico). Análisis sintáctico (Estructura de Palabras). Análisis semántico (Significado). Análisis pragmático (Intención). Estos proyectos terminan en 1976 con el resultado de que CMU, SRI y MIT crearon sistemas para el proyecto ARPA SUR (Speech Understanding Research). De los 80's a los 90's surgen los sistemas de vocabulario amplio, que ahora son la norma (más de 1000 palabras). Adicionalmente bajan los precios de estos sistemas.

6 Estado del arte El uso del lenguaje natural utilizado como medio de comunicación entre humano-máquina ha tenido un impacto muy importante en los últimos años, ya que la tecnología busca facilitar su uso y aplicación, de tal manera que una persona no necesite ser un experto en el área para interactuar con algún dispositivo inteligente, que es el objetivo de la quinta generación de computadoras.

7 Procesamiento del lenguaje natural Gracias a la inteligencia artificial se han simulado diferentes funciones del cuerpo humano como la voz, brazos, piernas, vista, oídos, etc. Es por medio de esta misma ciencia que estudiamos el sistema de la comunicación por señales de voz, el cual es la emisión y recepción de señales fonéticas de forma oral, para de esta manera comprenderlo y traducirlo al lenguaje máquina, con el propósito de que un conjunto de circuitos pueda comprender el lenguaje natural y realizar una reacción conforme al mensaje emitido.

8 Aparato fonador La complejidad del cuerpo humano nos permite producir una gran variedad de sonidos que modulamos para formar las palabras con las que nos comunicamos, dentro de los componentes que intervienen en el proceso de la producción del habla se encuentran: la glotis que constituye el verdadero órgano de fonación humano y está ubicada dentro de la laringe, pulmones, dos pares de cuerdas vocales, las cavidades de la cabeza relacionadas con el sistema respiratorio y nasofaríngeo, entre otros. El mecanismo brevemente resumido de dicho proceso es el siguiente: El diafragma empuja los pulmones, haciendo que se expulse el aire. El aire circula por la tráquea y laringe, pasando por las cuerdas vocales y haciendo que vibren con un tono fundamental. El tono fundamental producido por las cuerdas vocales pasa, a través de la laringe, a la caja de resonancia que forman las cavidades nasales y orales. Algunas frecuencias entran en resonancia en las cavidades nasales y orales, saliendo hacia el exterior como la información más importante del habla.

9 Aparato fonador

10 Entorno de desarrollo Arduino Para poder comunicar la tarjeta de reconocimiento de voz con la computadora que controla el robot Mitsubishi es necesario tener un dispositivo que nos facilite el trabajo por eso decidimos trabajar con Arduino. Arduino es una plataforma de electrónica abierta (open source) para la creación de prototipos basada en software y hardware flexibles y fáciles de usar. Se creó para artistas, diseñadores, aficionados y cualquiera interesado en crear entornos u objetos interactivos

11 Tarjeta Arduino

12 Arduino permite capturar información por medio de sensores gracias a sus pines y puede manifestarse por medio de motores, luces o actuadores, en nuestro caso por medio del robot Mitsubishi. El entorno cuenta con su propio lenguaje de programación llamado lenguaje de programación Arduino, basado en wiring y un entorno de desarrollo, basado en processing, con la gran ventaja de ser código abierto esto quiere decir que pudimos desarrollar sin comprar licencia y modificar los archivos sin problemas. Lo primero que hicimos después de tener la placa Arduino fue la instalación de los drivers de este a nuestra computadora para eso conectamos la placa al puerto USB y Windows instalo automáticamente, después cargamos el software, es muy importante saber la versión del Arduino, nosotros ocupamos el IDE 0022 de acuerdo con nuestro microcontrolador atmega328. Para comprobar que funcionó correctamente abrimos un ejemplo de los que ya vienen incluidos, conectamos el Arduino, seleccionamos el modelo de la placa, el puerto serie COM1 o COM2 dependiendo de nuestra configuración preferente y finalmente cargamos el archivo, mediante motores o luces (diodos) se observa el comportamiento del programa.

13 Antecedentes del Robot Robot viene de la República Checa usada por primera vez por el escrito Karel Capek en su obra R.U.R. (Rossums Universal Robots) en 1917, la utilizó para referirse en sus libros, a máquinas con forma humanoide. Después en 1940, Isaac Asimov la uso para referirse a lo mismo. Robot significa labor forzada o bien esclavo. Robot Mitsubishi rv-m1

14 Hoy en nuestros días el significado no es tomado por las tendencias del pasado, surge de nuestras necesidades, agricultura, la industria, etc. Después de la revolución industrial el término robot cubría ya la faz de la tierra. En nuestro caso llamamos robot a un brazo mecánico capaz de realizar trabajos precisos y del área de la industria. El robot Mitsubishi RV-M1 posee 5 grados de movimiento se representan en la siguiente imagen de J1 hasta J5. Los movimientos son permitidos por el cable de señal que recibe los datos y un cable potencia.

15 Anatomía del robot

16 La unidad motora que se encarga del control del robot y de alimentarlo. Se muestra a continuación con sus componentes.

17 Vista trasera

18 Caja de enseñanza La caja de enseñanza es un control manual para el robot, se conecta a la unidad motora en el puerto teaching box. Sirve para programar las rutinas, realizar los movimientos, guardarlos y borrarlos con sus respectivos comandos.

19

20 Circuito del control Veear La línea de productos Veear incluye una serie de productos hardware y software diseñados para ayudarle en el desarrollo e implementación de capacidades de reconocimiento de voz para muchas aplicaciones donde la capacidad de comando de voz es deseada y conveniente. El circuito utilizado para el proyecto es el EasyVR Arduino Shield por ser una tarjeta multipropósito diseñada para fácilmente añadir capacidades de reconocimiento de voz en varios lenguajes de programación, de una manera eficaz, versátil, robusta y rentable para cualquier aplicación desarrollada en la plataforma Arduino.

21 Easy Veear

22 Sensory quickSynthesis 5

23 EasyVR GUI v2.1.8

24 conclusiones A partir de la revolución industrial los robots han tomado un gran papel en muchas áreas de trabajo y en la industria. Son utilizados desde juguetes hasta máquinas de trabajo forzado ciertamente sin recibir un sueldo. De aquí partió nuestra visión de crear soluciones a problemas diarios y facilitar las labores humanas. La industria, el comercio, la agricultura, etc. Son áreas indispensable e inmediatamente obligatorias para el desarrollo económico del país. Nuestro trabajo de investigación viene a facilitar y reforzar lo antes ya establecido, aportando una solución viable, utilizar el brazo de robot Mitsubishi rv-m1 controlado mediante comandos voz, para realizar labores pesadas o peligrosas sin la intervención directa con un ser humano. Al finalizar nuestra investigación y llevarlo a la práctica hemos obtenido los resultados esperados de nuestro análisis, logrando así aportar una visión más clara y concreta de los que la inteligencia artificial con la ayuda de algo elemental como lo es el lenguaje natural, pueden hacer por nuestra vida diaria.

25 bibliografía Ingrid Kirschning Tlatoa [2005], Reconocimiento de Voz. Documento electrónico consultado el 02/03/2013 en la página de la Universidad de las Américas Puebla: Bernal Bermúdez Jesús; Bobadilla Sancho Jesús; Gómez Vilda Pedro. Reconocimiento de voz y fonética acústica. Primera edición. México, D.F.: Alfaomega, ISBN Arduino [2010], Arduino. Documento electrónico consultado el 24/04/2013 en: Robot [19 de enero de 2006], Robot. Página web consultada 20/05/2013 en: de-la-palabra-robot


Descargar ppt "Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo."

Presentaciones similares


Anuncios Google