Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL.

Slides:



Advertisements
Presentaciones similares
LAS PALABRAS INTEROGATIVAS
Advertisements

Me llamo ________ Clase 702 La fecha es el 7 de enero del 2014
Autora: Carmen Rincón Llorente Tutor: Roberto Barra Chicote
Bla bla from keyboard Talk client Talk Server Programemos algo bien simple Bla bla.
Hoy es el martes 2 de septiembre de Trabajo de entrada
Me llamo ________ Clase 6NH (602) La fecha es el 22 de octubre del 2012 Propósito # 13: ¿Qué compras en la papelería? Actividad Inicial: TEXTO; Leer En.
Objetivo: ¿Qué acabas de hacer? Y, ¿De dónde vienes? Hagan Ahora: Copien los apuntes culturales.
Indicadores de Sustentabilidad Ambiental. ¿QUÉ ES UN INDICADOR?  Es una medida que nos permite ir observando el parámetro de avance en el cumplimiento.
ORGANIZACIÓN BACHILLERATO INTERNACIONAL. INTRODUCCIÓN: Aplicación de habilidades y conocimientos a situaciones reales de toma de decisiones Recabar investigación.
Verificación y Validación de Software
«Estructura productiva en España a través de las Tablas Input-Output y particularización en el sector energético» Proyecto Fin de carrera Aitana Díez Alcolado.
Título del Proyecto Times New Roman, tamaño 66. Nombres de los autores Datos de la Institución de adscripción de los autores. Marcar con números superíndices.
* Parte del punto 3 está basado en las presentaciones del Curso de Enfoques Metodológicos de Fernando Cartes M.
INDICADORES BIOQUIMICOS CLASE 6. En el laboratorio es un proceso estadístico usado para monitorear y evaluar el proceso analítico que produce resultados.
Los adjetivos posesivos
Tabla de Correlación entre la Tarifa de la Ley de los Impuestos Generales de Importación y de Exportación (TIGIE) y el Sistema de Clasificación Industrial.
Identificación de tráfico de red basado en Aprendizaje Automático
Norma para la Generación de Estadística Básica
Lorenzo Bruzzone IEEE Geoscience and remote sensing 38,1pp429
MI63C- Dinámica y Control de Procesos
Modelos estadísticos de los procesos II
ADMINISTRACIÓN DE RECURSOS HUMANOS
Análisis de la Competitividad Costos de Calidad
El docente frente a su sistema de creencias:
I.Q. Ever García Martínez
Facultad de Ciencias Sociales
CATEGORÍAS TAXONÓMICAS DE LA INVESTIGACIÓN
EL32D- Análisis y Modelación de Sistemas Dinámicos
Los enfoques cuantitativo y cualitativo en la investigación científica
Tema IV: Unidad Lectiva 4: Contenido:
Clase Pasada…. ¿Como es la tierra? Geodesia Geoide
PBS 16: Gestion de riesgo empresarial para efectos de solvencia
Introducción a la Investigación de Mercados
Escogiendo los mejores atributos: Ganancia de Información
El sistema de Calidad de GFI/AST
Entrenador para el control de prótesis mioeléctricas
DISEÑO Y GESTIÓN DE MICROEMPRENDIMIENTOS. “A4 VIRTUAL”
Los adjetivos posesivos
El desarrollo de un plan personal para operadores de empresas agricolas
Actividades en Big Data
MODELOS Modelos físicos Información y valor Modelos matemáticos
Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS.
i=2I.
Modelo de la cascada (cont.)
INSTITUTO UNIVERSITARIO DE CIENCIAS DE LA SALUD FUNDACIÓN HÉCTOR A
SIG para la Agricultura de Precisión
VALIDEZ Y CONFIABILIDAD DEL INSTRUMENTO
DISEÑO Y GESTIÓN DE MICROEMPRENDIMIENTOS. “A4 VIRTUAL”
Examen parcial el próximo lunes 9 de marzo Próximo tutorial 4-5
Computer Data Systems CDS Profa. Wendy Toledo.
COLEGIO INGLES MICHAEL FARADAY, A.C.
Lingüística computacional
ANÁLISIS CLÍNICOS II: ETAPA ANALÍTICA Clase 12: Control de calidad (I)
Pasos a seguir para desarrollar un proceso investigativo.
Institución a la que pertenece
Ejercitación de análisis sintáctico de oraciones simples
Lingüística computacional
DEPARTAMENTO DE ELECTRICA Y ELECTRÓNICA
Inteligencia Artificial
Regresión Logística App4stats © Todos los derechos reservados.
EXPERIMENTACIÓN AGRÍCOLA Investigación Agrícola
Analítica de Datos en Medidores Inteligentes para Determinar Patrones de Consumo/Producción para Mejorar la Eficiencia Energética y Evitar Robo de Energía.
DETECTOR PREDICTIVO DE CONEXIONES FRAUDULENTAS
Fortalecimiento de capacidades institucionales para transversalizar el enfoque de género Próximos pasos Cronograma de actividades Formulación de la Política.
Antecedentes, estado actual del conocimiento y marco teórico
Nombre de la empresa Nombre del proyecto Nombre del participante
TexPoint fonts used in EMF.
Comprensión de Textos ESTRATEGIAS MÈTODO ABECEDARIO
Las Preguntas (the questions) Tengo una pregunta… Sí, Juan habla mucho con el profesor en clase. No, Juan no habla mucho en clase. s vo s vo Forming.
Transcripción de la presentación:

Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL FERNÁNDEZ VICENTE TUTOR: ROBERTO BARRA CHICOTE 1

Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 2

Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 3

Objetivos  Detección automática de género de texto.  Resultados útiles para la conversión de texto a habla expresiva (TTS).  Flexibilidad.  Cálculo de parámetros que optimicen los resultados.  Precisión en la detección de géneros. 4

Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 5

Estadísticas de los documentos 6

Descripción del sistema Generación del modelo Clasificación y ponderación Textos de entrenamiento Textos de prueba Textos de prueba Modelos de síntesis Voz expresiva 7

Generación del modelo 8

Clasificación de los texto de prueba GradosDistancia Coseno 0º0 90º1 180º2 270º1 360º0 9

Ponderación de la clasificación 1. Interpolación simple  Considerando solo el género mas parecido. 2. Interpolación atendiendo a dos géneros  Tiene en cuenta los dos mejores géneros. 3. Interpolación atendiendo a todos los géneros  Contempla todos los géneros. 4. Interpolación atendiendo a las fronteras  Calculando la frontera de decisión entre las dos mejores clases. 10

Normalización de los factores de interpolación 11

Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 12

Experimentación (I) abcd  Clasificado como a = NEWS b = SPEECH c = SPORT d = INTERVIEW  Dividimos los fichero en dos grupos:  Entrenamiento  789 frases  Prueba  84 frases  Weka (clasificador Simple Logistic)  Tasa de error sin stopwords: 13,1%  Tasa de error con stopwords: 8,4%  Tasa de error de nuestro sistema del 3%. 13

 Validación cruzada de los documentos analizados. Experimentación (II) 14

Experimentación (III)  Selección de stopwords en función de las palabras menos relevantes que aparecen en los textos. 15

Ejemplos de síntesis  TTS (text-to-speech) 16

Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 17

 SVD vs Weka  mejora del 64,2%  Tasas de error inferiores al 10%  Validación cruzada  Flexibilidad de análisis.  Rapidez de procesado  Tiempos de entrenamiento: 3 -10min  Tiempo de clasificación: documentos/seg.  Clasificaciones útiles en TTS. Conclusiones 18

Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 19

Líneas futuras  Comparar con el sistema plenamente expresivo (100%)  Evaluación subjetiva de la síntesis de voz en función del coeficiente de interpolación (sistema semicontinuo)  Utilización de la proyección SVD para sintetizar un texto sin detectar explícitamente un genero (sistema continuo)  Evaluar la respuesta del sistema frente a distintos conjuntos de textos.  Más amplios.  Mayor número de géneros.  Revisión del conjunto de stopwords utilizadas.  Plantear conjuntos de stopwords en función de los géneros. 20

Muchas gracias ¿Preguntas? 21

From Discrete to Continuous  Discrete system only relies in genre prediction:  Semi-continuous sytem also controls expressive strength according to the text:  Continuous system directly synthesizes from the text: 22 CVSM Projection + Genre Prediction Model Selection + Speech Generation Synthesis Text Output Speech Predicted genre Synthesis Text CVSM Projection + Genre Prediction Adaptation based Control + Speech Generation Synthesis Text Output Speech Genre, Synthesis Text CVSM Projection MR-HMM Speech Generation Synthesis Text Output Speech Synthesis Text Introduction / Control / Transplantation / SSS / System / Conclusions

AdequacyNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports Speech Interview News Average Systems Comparison: Adequacy  Significant increases in adequacy when comparing to traditional neutral speech.  Sports broadcasting improves even natural speech. Political speech is comparable. 23 Introduction / Control / Transplantation / SSS / System / Conclusions

IntensityNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports Speech Interview News Average Systems Comparison: Intensity  Generally improves the neutral system.  Semi-continuous systems improves traditional synthesis.  Continuous system is competitive. 24 Introduction / Control / Transplantation / SSS / System / Conclusions

QualityNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports Speech Interview News Average Systems Comparison: Quality  Natural speech ~0.5 points better in average.  Live sports comparable to natural speech!  Continuous system suffers from the semi-continuous nature of the evaluated data. 25 Introduction / Control / Transplantation / SSS / System / Conclusions