LABORATORIO DE PROCESAMIENTO DIGITAL DE SEÑALES

Slides:



Advertisements
Presentaciones similares
Laboratorio de Fonética Universidad de Deusto (2001)
Advertisements

LICENCIATURA EN SISTEMAS COMPUTACIONALES EN ADMINISTRACION Inteligencia Artificial Octavo Cuatrimestre CENTRO DE ESTUDIOS SUPERIORES DE MARTINEZ DE LA.
Tecnología Multimedia Fundamentos y Aplicaciones
Introducción a Moodle.
Módulo Profesional: Idioma Extranjero. Inglés
INTELIGENCIA ARTIFICIAL
Tesista: Jesús Rubén Hernández Carrillo
SOLUCIONES PARA BÚSQUEDA DE TEXTO EN AUDIO Y TRANSCRIPCIÓN DE VOZ A TEXTO Octubre de
UNIVERSIDAD TECNOLÓGICA ISRAEL CARRERA DE SISTEMAS INFORMÁTICOS
¿Cómo hacer para que una máquina comprenda el LN?
Analizadores Sintácticos Descendentes Predictivos
Introducción al software
PROYECTO DE GRADO CARLOS STALIN ALVARADO SANCHEZ
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
Procesamiento Digital de Voz
RECONOCIMIENTO DE OBJETOS
Inteligencia Artificial K 1 - Grupo 7 RECONOCIMIENTO DE VOZ Bonilla, Eduardo Lobera, Laura Marin, Ignacio Scándolo, C. Iván.
”SISTEMA PARA EL ANÁLISIS DE SEÑALES DE VOZ APLICANDO EL ALGORITMO DE LA TRANSFORMADA RÁPIDA DE FOURIER (FFT POR SUS SIGLAS EN INGLÉS)” Materia: Programación.
Principios de diseño de Interfaces Prof. Adelaide Bianchini
Plataforma ECM de Servicios On-Line con Acceso Mediante Voz.
Introducción a los Recursos y Sistemas de Recuperación de Información (SRI) de Biblioteca Por Biblioteca [Vínculo Académico e Investigación/Referencia.
Sistemas de Información IS95872 Clase 03. Toma de decisiones Categorías Toma Estratégica de decisiones: Determina los objetivos, recursos y políticas.
Importancia y Futuro de los Sistemas Expertos
OMAR SANCHEZ ROBLES HECTOR PEREZ GARCIA. “Sistemas de cómputo compuesto por un gran número de CPU´s conectados mediante una red de alta velocidad”, Tanenbaum.
Grupo de investigación Applied Signal Processing Departamento de Teoría de la Señal y Comunicaciones Escuela Politécnica Superior Universidad de Alcalá.
Arquitectura de una aplicación
“Sistema de predicción y recomendación personalizada basada en ranking de ítems homogéneos usando filtrado colaborativo” Luis Alejandro Díaz Viejó Fausto.
Integrantes: Daniel Peña Alfredo Zuñiga
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
LENGUAJE DE PROGRAMACIÓN
ISF5501 Ingeniería de Software
1 Diseño Orientado a Objetos Agustín J. González ELO-329: Diseño y Programación Orientados a Objetos 1er. Sem
Eloísa Orozco Bueno Alvaro Padilla Vilema
Procesadores de Lenguajes
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
UNIDAD 2. ALGORITMOS Y ESTRUCTURAS DE DATOS.
El análisis fonético y sus aplicaciones Aprendizaje de lenguas: corrección de la propia lengua y enseñanza de otras lenguas Aprendizaje de lenguas: corrección.
5, 6 y 7 de diciembre de 2012, Campus Monterrey. Laboratorio móvil de lenguas Dr. José Martín Molina Espinosa, Dr. Rafael Lozano Espinosa, Dr. David Escarcega.
Yo soy responsable de mi bienestar
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD NACIONAL EXPERIMENTAL SIMÓN RODRÍGUEZ COORDINACIÓN DE DESARROLLO PROFESORAL NÚCLEO BOLÍVAR FACILITADOR:
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
Arquitecturas de Sistemas Interactivos: Introducción
Universidad Metropolitana Introducción a la Computación
SENA REGIONAL HUILA REGIONAL HUILA CENTRO DE LA INDUSTRIA LA EMPRESA Y LOS SERVICIOS Huila Elementos de sistemas de información.
Sistemas Expertos Integrantes Javier Farfán Katherine Jara Héctor Gatica.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) TRADUCTORES Y ANALIZADOR LEXICOGRÁFICO.
Metodología de la programación
Dispositivos Móviles John Alexander Cruz Arévalo.
Introducción a la informática
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Posgrado en Sistemas Computacionales Heurísticas de usabilidad MC Luz María Moreno Aguilar Noviembre 2009.
Software.
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Universidad de Carabobo Facultad Ciencias de la Educación Escuela de Educación Departamento de Matemática Trabajo Colaborativo Wikipedia Integrantes:
Bibliotecas Digitales Dr. Juan Carlos Lavariega Jarquín Ing. Martha Sordia Salinas, MC.
Sistemas de Información Administrativa Ttramestre MAY - AGO 2008 Catedrático: MC. Pedro Martínez Lucio MC. Pedro Martínez.
Web 2.0 y Educación Maestría en Informática Educativa Sistemas de Gestión de Contenidos LECCION 2 : Dr. Ivonne Sadith Musayón Oblitas.
Estrategias efectivas para buscar y encontrar información Dr. Valentino Morales López Investigador INFOTEC Centro de Investigación.
Inteligencia Artificial- Aplicaciones 1. Contenido  Conceptos  Introducción  Esquema general  Ejemplos de Aplicaciones 2.
Por: Patricio Pérez de Caso 2°A La Robótica en México.
SISTEMAS DE INFORMACION ORGANIZACIONAL
Presentado Por:Lina Gissel López Michel Daniela Gonzalez Adriana Gutierrez Hurtado 10/10/2015 Presentado A: Instructora Blanca Nubia Chitiva.
Sistemas Operativos Universidad Politécnica Territorial de Mérida
Partes de la ventana Access
SISTEMA DE CÓMPUTO PARA LA COMUNICACIÓN HOMBRE -MÁQUINA
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Fundamentos de Programación Unidad I Conceptos Básicos.
UNIVERSIDAD DE MEXICO JHONATAN DE JESUS MONZON LOPEZ
Transcripción de la presentación:

LABORATORIO DE PROCESAMIENTO DIGITAL DE SEÑALES Dr. Sergio Suárez Guerra ssuarez@cic.ipn.mx Dr. José Luis Oropeza Rodríguez joropeza@cic.ipn.mx Dr. Oleksiy Pogrebnyak olek@cic.ipn.mx Dr. Alfonso Gutiérrez Aldana agutierr@cic.ipn.mx M. en. C. Pablo Manrique Ramirez pmanriq@cic.ipn.mx Carlos Daniel Hernández Mena (invitado UNAM) ca_hernandez@uxmcc2.iimas.unam.mx Laboratorio de Procesamiento digital de señales

Líneas de investigación del laboratorio (LPDS) Sistemas para la recolección, análisis y procesamiento de todo tipo de señales en el tiempo: acústicas (voz, especies, médicas, ruido, subacuáticas), biológicas (ECG,EEG, EMG), mecánicas (vibraciones, sismos, etc.), imágenes (señales bidimensionales). Clasificación y reconocimiento (clasificación) de todos los tipos de señales posibles. Sistemas para la aplicación y uso de la clasificación y reconocimiento de señales e imágenes. Procesamiento y reconocimiento de voz (habla, lenguaje, locutores). Procesamiento de señales biológicas, aplicaciones médicas. Captura, restauración y procesamiento de imágenes digitales. Laboratorio de Procesamiento digital de señales

La señal voz, expectativas de uso Cada día nos encontramos más, con infinidad de aplicaciones de los sistemas de cómputo, con capacidad de interactuar con los usuarios mediante el reconocimiento y síntesis de voz. Estos van desde aplicaciones simples en el reconocimiento de comandos (palabras) aislados, traducción automática, hasta el reconocimiento de frases para ejecutar acciones a manos libres: teléfonos celulares, control por voz en la instrumental, de ayuda en la cirugía, acceso a servicios de compra por teléfonos, llenado de solicitudes, reservaciones de pasaje, entre otros; la búsqueda en Internet es una de las muestras más impactantes de estas aplicaciones. Laboratorio de Procesamiento digital de señales

Líneas de trabajo en procesamiento de voz Procesamiento, reconocimiento y síntesis de voz. Llenado de solicitudes de servicios por voz: transporte, citas, formas. Voz y texto emotivo: reconocimiento y síntesis. Diseño de interfaces y sistemas para acción a distancia mediante reconocimiento de voz: Teléfonos, Internet, Hogar, industria, etc. Reconocimiento de voz multi plataformas: PCs, DSPs, Celulares (Sistema Operativo Androide) Reconocimiento y certificación de locutores, su separación en conversaciones y seguimiento. Doblaje de locutor. Control de acceso multi-biométrico: voz, rostro, huellas. Traducción automática de voz. Servicios para atención personalizada a hablantes de diferentes idiomas. Sistema de ayuda a discapacitados auditivos. Implantes cocleares. Aplicaciones de reconocimiento de voz para control de manipuladores en condiciones no apropiadas para el hombre. Estudio de idiomas, corrección del lenguaje hablado. Laboratorio de Procesamiento digital de señales

Procesamiento de voz. La señal de voz La voz es una señal que lleva información consciente, inteligente, producida por los humanos para que las personas que la escuchan obtengan información directa, sin la necesidad de otra fuente adicional como imágenes o texto. Es la forma universal de comunicación entre las personas. El lenguaje es la frontera que limita el captar la información que se emite de una persona a otra. Laboratorio de Procesamiento digital de señales

Ventajas del habla como interfaz Natural: no requiere capacitación Rápido: 160 palabras por minuto Flexible: ojos y manos quedan libres Accesible: a distancia por vía telefónica (Internet) Laboratorio de Procesamiento digital de señales

Complejidad en las aplicaciones de procesamiento de voz “Comandos y Control” “Llenado de formas” “Dictado automático” “Recuperación de información” “Realización de tareas en colaboración” “Traducción automática y servicios de información” Reconocimiento Entendimiento Laboratorio de Procesamiento digital de señales

Laboratorio de Procesamiento digital de señales Proyectos Reconocimiento de voz para frases acotadas en español. Uso en traducción de lenguas autóctonas de México y el español. Reconocimiento de voz para frases acotadas en español utilizando la red telefónica. Uso de la gramática del lenguaje. Separación y seguimiento de locutores en una conversación. Voz forense, identificación y certificación de locutores. Acceso a Internet por voz. Búsqueda de información interactiva. Reconocimiento del idioma hablado. Reglas de producción de voz. Síntesis de voz emotiva. Doblaje. Sistema para generación de aplicaciones de reconocimiento de voz. Módulos del sistema. Sistema automático de respuesta a solicitudes y control por voz. ESCUCHA, ayuda a personas con discapacidad. Reconocimiento de lo que se habla. ¿bien o incorrecto? Enseñanza de idiomas. Modelos de la fisiología de la cóclea, extracción de características. Análisis de música y creación de partituras a partir de un registro de audio musical, reconocimiento de melodías, plagio, etc. Análisis y reconocimiento de clases de ruido, usando técnicas de procesamiento de voz. Laboratorio de Procesamiento digital de señales

¿Cómo es el procedimiento para reconocer voz? La voz es una señal que posee información temporal dinámica, es una señal isocrónica. La perdida de sincronía es perdida de información. El mensaje está contenido en la dinámica de concatenación de los fonemas. Que a su vez forman las palabras y éstas conforman frases. La voz tiene información redundante y porta ruido. Hay que eliminar el ruido, extraer la información importante. La información importante está contenida en características paramétricas, patrones bien definidos. Hay que extraer esas características o patrones. Los patrones característicos se usan para reconocer, clasificar, la información contenida. Hay que utilizar modelos para reconocer, clasificar los patrones. Hay que entrenar los modelos de reconocimiento, clasificación. Laboratorio de Procesamiento digital de señales

Laboratorio de Procesamiento digital de señales Procesamiento de voz PREPROCE- SAMIENTO EXTRACCIÓN DE CARACTE- RÍSTICAS. PATRONES ENTRENAMIENTO DEL SISTEMA COMPARACIÓN DE PATRONES DECISIÓN. SALIDA ESPERADA SEÑAL DE ENTRADA RESPUESTA Front – End -Adecuación, -Filtrado, -Extracción de parámetros en el dominio del tiempo y la frecuencia Back – End -Selección de parámetros. -Modelos. -Reconocimiento -Clasificación Laboratorio de Procesamiento digital de señales

Modelo de Reconocimiento de voz y traducción acotada Señal Voz Procesamiento y extracción de parámetros Modelo de fonemas, difonemas, trifonemas, sílabas, palabras y oración Texto en idioma nativo Del locutor que habla Resultado del reconocimiento Traducción acotada Texto traducido Locutor que habla Corrección léxica Laboratorio de Procesamiento digital de señales

Sistema para el desarrollo de ampliaciones del reconocimiento automático de voz. MÓDULOS Extracción de parámetros característicos por segmentos Captura de datos de voz Reconocimiento de voz (locutores) usando el modelo escogido y entrenado Etiquetado automático por segmento, según parámetros escogidos Elección, diseño y entrenamiento del modelo Síntesis de voz APLICACIÓN Es un módulo que se diseña a solicitud del usuario y su única entrada es el resultado del reconocimiento de voz (locutor): palabra o frase. Puede interactuar con el módulo de síntesis de voz Laboratorio de Procesamiento digital de señales

Un sistema para la implantación del lenguaje ‘EXPARAM’ Laboratorio de Procesamiento digital de señales

Laboratorio de Procesamiento digital de señales Alumnos en A15 Alumnos activos 2015 Maestría: alumnos Cesar Edgard Montano (B13). Doblaje, conversión de voz y separación de locutores. Avelino Hernández Hugo Alberto (B13). Sistema mecatrónico para la fabricación de modelos CAD 3D por medio de manufactura aditiva. Erik Daniel Ornelas Ledesma (B13). Mejoramiento en la administración de la red eléctrica de distribución con uso de computo no convencional. LPDS y LRNCNC Pablo Tovar Castañón (A14). Análisis y creación de partituras musicales a partir de la música interpretada. Fernando Rubén González Hernández (A14). Modelo computacional para el análisis de patrones acústicos subacuáticos. Omar Velázquez López (B14). Implementación de técnicas de procesamiento para un transcriptor de música en tiempo real. Alejandro Ivan Callejas Ramos (B14). Algoritmos de reconstrucción de imágenes de escala de grises mediante GPU. Doctorado: alumnos Luis Alejandro Sánchez Pérez (A12) Modelo computacional para clasificación de aeronaves y su trayectoria, a partir del ruido en el despegue. LPDS y LSIA. Servicio Social: NO SE TIENEN Laboratorio de Procesamiento digital de señales

Laboratorio de Procesamiento digital de señales Gracias por su atención ssuarez@cic.ipn.mx Laboratorio de Procesamiento digital de señales