La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL.

Presentaciones similares


Presentación del tema: "Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL."— Transcripción de la presentación:

1

2 Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL FERNÁNDEZ VICENTE TUTOR: ROBERTO BARRA CHICOTE 1

3 Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 2

4 Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 3

5 Objetivos  Detección automática de género de texto.  Resultados útiles para la conversión de texto a habla expresiva (TTS).  Flexibilidad.  Cálculo de parámetros que optimicen los resultados.  Precisión en la detección de géneros. 4

6 Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 5

7 Estadísticas de los documentos 6

8 Descripción del sistema Generación del modelo Clasificación y ponderación Textos de entrenamiento Textos de prueba Textos de prueba Modelos de síntesis Voz expresiva 7

9 Generación del modelo 8

10 Clasificación de los texto de prueba GradosDistancia Coseno 0º0 90º1 180º2 270º1 360º0 9

11 Ponderación de la clasificación 1. Interpolación simple  Considerando solo el género mas parecido. 2. Interpolación atendiendo a dos géneros  Tiene en cuenta los dos mejores géneros. 3. Interpolación atendiendo a todos los géneros  Contempla todos los géneros. 4. Interpolación atendiendo a las fronteras  Calculando la frontera de decisión entre las dos mejores clases. 10

12 Normalización de los factores de interpolación 11

13 Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 12

14 Experimentación (I) abcd  Clasificado como 21000 a = NEWS 21801 b = SPEECH 01182 c = SPORT 11019 d = INTERVIEW  Dividimos los fichero en dos grupos:  Entrenamiento  789 frases  Prueba  84 frases  Weka (clasificador Simple Logistic)  Tasa de error sin stopwords: 13,1%  Tasa de error con stopwords: 8,4%  Tasa de error de nuestro sistema del 3%. 13

15  Validación cruzada de los documentos analizados. Experimentación (II) 14

16 Experimentación (III)  Selección de stopwords en función de las palabras menos relevantes que aparecen en los textos. 15

17 Ejemplos de síntesis  TTS (text-to-speech) 16

18 Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 17

19  SVD vs Weka  mejora del 64,2%  Tasas de error inferiores al 10%  Validación cruzada  Flexibilidad de análisis.  Rapidez de procesado  Tiempos de entrenamiento: 3 -10min  Tiempo de clasificación: 3 - 6 documentos/seg.  Clasificaciones útiles en TTS. Conclusiones 18

20 Índice  Objetivos  Descripción del sistema  Experimentación  Conclusiones  Líneas futuras 19

21 Líneas futuras  Comparar con el sistema plenamente expresivo (100%)  Evaluación subjetiva de la síntesis de voz en función del coeficiente de interpolación (sistema semicontinuo)  Utilización de la proyección SVD para sintetizar un texto sin detectar explícitamente un genero (sistema continuo)  Evaluar la respuesta del sistema frente a distintos conjuntos de textos.  Más amplios.  Mayor número de géneros.  Revisión del conjunto de stopwords utilizadas.  Plantear conjuntos de stopwords en función de los géneros. 20

22 Muchas gracias ¿Preguntas? 21

23 From Discrete to Continuous  Discrete system only relies in genre prediction:  Semi-continuous sytem also controls expressive strength according to the text:  Continuous system directly synthesizes from the text: 22 CVSM Projection + Genre Prediction Model Selection + Speech Generation Synthesis Text Output Speech Predicted genre Synthesis Text CVSM Projection + Genre Prediction Adaptation based Control + Speech Generation Synthesis Text Output Speech Genre, Synthesis Text CVSM Projection MR-HMM Speech Generation Synthesis Text Output Speech Synthesis Text Introduction / Control / Transplantation / SSS / System / Conclusions

24 AdequacyNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports 2.074.274.503.564.154.26 Speech 2.573.83 3.593.783.93 Interview 2.872.973.003.473.334.20 News 3.333.903.873.763.854.19 Average 2.714.003.803.603.784.15 Systems Comparison: Adequacy  Significant increases in adequacy when comparing to traditional neutral speech.  Sports broadcasting improves even natural speech. Political speech is comparable. 23 Introduction / Control / Transplantation / SSS / System / Conclusions

25 IntensityNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports 1.974.234.433.564.114.31 Speech 2.573.633.803.443.563.82 Interview 2.573.002.973.443.224.19 News 2.933.633.833.593.703.97 Average 2.513.833.763.513.654.07 Systems Comparison: Intensity  Generally improves the neutral system.  Semi-continuous systems improves traditional synthesis.  Continuous system is competitive. 24 Introduction / Control / Transplantation / SSS / System / Conclusions

26 QualityNeutralDiscreteSemi-continuousContinuousSyntheticNatural Sports 3.704.334.272.824.334.45 Speech 4.003.773.833.094.104.45 Interview 3.703.533.432.653.774.52 News 3.933.734.003.183.904.50 Average 3.833.843.882.934.034.48 Systems Comparison: Quality  Natural speech ~0.5 points better in average.  Live sports comparable to natural speech!  Continuous system suffers from the semi-continuous nature of the evaluated data. 25 Introduction / Control / Transplantation / SSS / System / Conclusions


Descargar ppt "Desarrollo Y Evaluación De Un Sistema De Predicción Automática De Género De Texto Para Conversión Automática De Texto A Habla Expresiva ALUMNO: MIGUEL."

Presentaciones similares


Anuncios Google