Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porGabriel Ferreyra Lozano Modificado hace 8 años
2
Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL FERNÁNDEZ VICENTE TUTOR: ROBERTO BARRA CHICOTE 1
3
Índice Objetivos Descripción del sistema Experimentación Conclusiones Líneas futuras 2
4
Índice Objetivos Descripción del sistema Experimentación Conclusiones Líneas futuras 3
5
Objetivos Detección automática de género de texto. Resultados útiles para la conversión de texto a habla expresiva (TTS). Flexibilidad. Cálculo de parámetros que optimicen los resultados. Precisión en la detección de géneros. 4
6
Índice Objetivos Descripción del sistema Experimentación Conclusiones Líneas futuras 5
7
Estadísticas de los documentos 6
8
Descripción del sistema Generación del modelo Clasificación y ponderación Textos de entrenamiento Textos de prueba Textos de prueba Modelos de síntesis Voz expresiva 7
9
Generación del modelo 8
10
Clasificación de los texto de prueba GradosDistancia Coseno 0º0 90º1 180º2 270º1 360º0 9
11
Ponderación de la clasificación 1. Interpolación simple Considerando solo el género mas parecido. 2. Interpolación atendiendo a dos géneros Tiene en cuenta los dos mejores géneros. 3. Interpolación atendiendo a todos los géneros Contempla todos los géneros. 4. Interpolación atendiendo a las fronteras Calculando la frontera de decisión entre las dos mejores clases. 10
12
Normalización de los factores de interpolación 11
13
Índice Objetivos Descripción del sistema Experimentación Conclusiones Líneas futuras 12
14
Experimentación (I) abcd Clasificado como 21000 a = NEWS 21801 b = SPEECH 01182 c = SPORT 11019 d = INTERVIEW Dividimos los fichero en dos grupos: Entrenamiento 789 frases Prueba 84 frases Weka (clasificador Simple Logistic) Tasa de error sin stopwords: 13,1% Tasa de error con stopwords: 8,4% Tasa de error de nuestro sistema del 3%. 13
15
Validación cruzada de los documentos analizados. Experimentación (II) 14
16
Experimentación (III) Selección de stopwords en función de las palabras menos relevantes que aparecen en los textos. 15
17
Ejemplos de síntesis TTS (text-to-speech) 16
18
Índice Objetivos Descripción del sistema Experimentación Conclusiones Líneas futuras 17
19
SVD vs Weka mejora del 64,2% Tasas de error inferiores al 10% Validación cruzada Flexibilidad de análisis. Rapidez de procesado Tiempos de entrenamiento: 3 -10min Tiempo de clasificación: 3 - 6 documentos/seg. Clasificaciones útiles en TTS. Conclusiones 18
20
Índice Objetivos Descripción del sistema Experimentación Conclusiones Líneas futuras 19
21
Líneas futuras Comparar con el sistema plenamente expresivo (100%) Evaluación subjetiva de la síntesis de voz en función del coeficiente de interpolación (sistema semicontinuo) Utilización de la proyección SVD para sintetizar un texto sin detectar explícitamente un genero (sistema continuo) Evaluar la respuesta del sistema frente a distintos conjuntos de textos. Más amplios. Mayor número de géneros. Revisión del conjunto de stopwords utilizadas. Plantear conjuntos de stopwords en función de los géneros. 20
22
Muchas gracias ¿Preguntas? 21
23
From Discrete to Continuous Discrete system only relies in genre prediction: Semi-continuous sytem also controls expressive strength according to the text: Continuous system directly synthesizes from the text: 22 CVSM Projection + Genre Prediction Model Selection + Speech Generation Synthesis Text Output Speech Predicted genre Synthesis Text CVSM Projection + Genre Prediction Adaptation based Control + Speech Generation Synthesis Text Output Speech Genre, Synthesis Text CVSM Projection MR-HMM Speech Generation Synthesis Text Output Speech Synthesis Text Introduction / Control / Transplantation / SSS / System / Conclusions
24
AdequacyNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports 2.074.274.503.564.154.26 Speech 2.573.83 3.593.783.93 Interview 2.872.973.003.473.334.20 News 3.333.903.873.763.854.19 Average 2.714.003.803.603.784.15 Systems Comparison: Adequacy Significant increases in adequacy when comparing to traditional neutral speech. Sports broadcasting improves even natural speech. Political speech is comparable. 23 Introduction / Control / Transplantation / SSS / System / Conclusions
25
IntensityNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports 1.974.234.433.564.114.31 Speech 2.573.633.803.443.563.82 Interview 2.573.002.973.443.224.19 News 2.933.633.833.593.703.97 Average 2.513.833.763.513.654.07 Systems Comparison: Intensity Generally improves the neutral system. Semi-continuous systems improves traditional synthesis. Continuous system is competitive. 24 Introduction / Control / Transplantation / SSS / System / Conclusions
26
QualityNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports 3.704.334.272.824.334.45 Speech 4.003.773.833.094.104.45 Interview 3.703.533.432.653.774.52 News 3.933.734.003.183.904.50 Average 3.833.843.882.934.034.48 Systems Comparison: Quality Natural speech ~0.5 points better in average. Live sports comparable to natural speech! Continuous system suffers from the semi-continuous nature of the evaluated data. 25 Introduction / Control / Transplantation / SSS / System / Conclusions
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.