VILE: Estudio acústico de la variación inter e intralocutor en español III Congreso de Fonética Experimental Universidade de Santiago de Compostela 24-26 de octubre de 2005 VILE: Estudio acústico de la variación inter e intralocutor en español Elena Battaner Departamento de Comunicación II, Universidad Rey Juan Carlos Juana Gil y Victoria Marrero Departamento de Lengua Española y Lingüística General, Universidad Nacional de Educación a Distancia Carme Carbó, Joaquim Llisterri, María Jesús Machuca, Natalia Madrigal, Carme de la Mota, Montserrat Riera y Antonio Ríos Departamento de Filología Española, Universidad Autónoma de Barcelona
VILE: Estudio acústico de la variación inter e intralocutor en español El proyecto VILE Determinación de los fenómenos fonéticos analizados Selección del corpus de análisis Resultados Conclusiones
VILE: Estudio acústico de la variación inter e intralocutor en español El proyecto VILE Determinación de los fenómenos fonéticos analizados Selección del corpus de análisis Resultados Conclusiones
El proyecto VILE Financiado por el Ministerio de Ciencia y Tecnología (BFF2001-2551, 2001-2004) Departamento de Filología Española, Universidad Autónoma de Barcelona Departamento de Lengua Española y Lingüística General, Universidad Nacional de Educación a Distancia Departamento de Comunicación II, Universidad Rey Juan Carlos http://liceu.uab.es/~joaquim/VILE.html
Objetivos del proyecto VILE Caracterización acústica de los elementos segmentales y suprasegmentales que contribuyen a establecer la individualidad de un hablante Conocimiento fonético para la mejora de los sistemas de reconocimiento, identificación o verificación automáticas del locutor Nuevos datos acústicos para la práctica de la fonética judicial
Etapas del proyecto VILE Delimitación de los fenómenos fonéticos objeto de interés Análisis acústico de los fenómenos fonéticos seleccionados en una muestra de materiales extraída de corpus disponibles Estudio de los resultados desde la perspectiva de la variación interlocutor e intralocutor Conclusiones para el reconocimiento automático de locutor y la fonética forense
VILE: Estudio acústico de la variación inter e intralocutor en español El proyecto VILE Determinación de los fenómenos fonéticos analizados Selección del corpus de análisis Resultados Conclusiones
Determinación de los fenómenos fonéticos analizados Parámetros relevantes para el estudio de la individualidad de la voz Importancia relativa de los distintos parámetros Selección final de los parámetros analizados
Determinación de los fenómenos fonéticos analizados Parámetros relevantes para el estudio de la individualidad de la voz Importancia relativa de los distintos parámetros Selección final de los parámetros analizados
Parámetros relevantes para el estudio de la individualidad de la voz Revisión bibliográfica centrada en tres tipos de aproximación: Reconocimiento visual de espectrogramas (voiceprints) Reconocimiento perceptivo del hablante Reconocimiento automático del locutor
Parámetros relevantes para el estudio de la individualidad de la voz Parámetros de bajo nivel de información (Doddington 1985) o dimensiones fisiológicas (Kuwabara y Sagisaki 1995) Stevens (1971): parámetros referidos a la fuente y a los resonadores
Parámetros relevantes para el estudio de la individualidad de la voz Parámetros referidos a la fuente Valor medio de la F0 Contorno tonal Forma de la onda glotal Fluctuación de la F0
Parámetros relevantes para el estudio de la individualidad de la voz Parámetros referidos a los resonadores Frecuencias formánticas; anchura de banda de los formantes; trayectorias de los formantes; distancias y ratios entre formantes LTAS (Long Term Averaged Spectrum) Sonidos turbulentos y consonantes nasales Efectos coarticulatorios (vocales, nasales y líquidas)
Parámetros relevantes para el estudio de la individualidad de la voz Otros autores añaden otros rasgos: Variables temporales Tiempo total de habla Proporción de habla y de silencios Velocidad del habla
Parámetros relevantes para el estudio de la individualidad de la voz Algunas reflexiones sobre los criterios de decisión válidos (Wolf 1972)
Determinación de los fenómenos fonéticos analizados Parámetros relevantes para el estudio de la individualidad de la voz Importancia relativa de los distintos parámetros Selección final de los parámetros analizados
Importancia relativa de los distintos parámetros Prioridad del F0 Prioridad del LTAS Prioridad de la estructura espectral: frecuencias formánticas absolutas o trayectorias formánticas F1, F2 y F3, y distancias entre F1-F2 y F2- F3. Información localizada entre los 2.5 kHz y los 3.5 kHz
Importancia relativa de los distintos parámetros Misma prioridad para la F0 y la estructura formántica Variables temporales Contorno tonal La importancia de cada parámetro puede diferir de hablante a hablante y depende también de la naturaleza de las muestras
Determinación de los fenómenos fonéticos analizados Parámetros relevantes para el estudio de la individualidad de la voz Importancia relativa de los distintos parámetros Selección final de los parámetros analizados
Selección final de los parámetros analizados Parámetros referidos a la fuente Valor medio de la F0 en el grupo fónico Fluctuación de la F0 en el grupo fónico (desviación típica)
pero yo me creía muy mayor
Selección final de los parámetros analizados Parámetros referidos a los resonadores Estructura espectral de las consonantes fricativas sordas Pico espectral de mayor intensidad en la banda 0-8 kHz Contexto fonético: [ese] y [asa]
Selección final de los parámetros analizados Parámetros referidos a los resonadores Formantes vocálicos Valor frecuencial (F0, F1-F4) Ancho de banda (F1-F4) Distancia entre formantes (F0-F4) Contexto fonético: oclusivas sordas y [s], en estructura silábica CV.C
ese viento suave vuela
Selección final de los parámetros analizados Parámetros temporales Tiempo total de habla Proporción de habla Proporción de silencios Velocidad de elocución Velocidad de articulación
Selección final de los parámetros analizados Proporción de habla Duración de todos los grupos fónicos de una determinada sesión dividida entre la duración total de dicha sesión Proporción de silencios Duración total de los silencios de una determinada sesión dividida entre la duración total de dicha sesión
Selección final de los parámetros analizados Velocidad de elocución Tiempo total de habla dividido entre el número de segmentos de cada una de las sesiones analizadas Velocidad de articulación Tiempo total de habla, exceptuando la duración de los silencios, dividido entre el número de segmentos de cada una de las sesiones analizadas
VILE: Estudio acústico de la variación inter e intralocutor en español El proyecto VILE Determinación de los fenómenos fonéticos analizados Selección del corpus de análisis Resultados Conclusiones
Selección del corpus de análisis Corpus disponibles en español La variación intralocutor La variación interlocutor Selección final del corpus
Selección del corpus de análisis Corpus disponibles en español La variación intralocutor La variación interlocutor Selección final del corpus
Corpus disponibles en español Selección del corpus Corpus disponibles en español Descartados Privados Específicos De acceso limitado Seleccionados ALBAYZÍN EUROM1 MULTEXT AHUMADA-GAUDÍ SpeechDat
Selección del corpus de análisis Corpus disponibles en español La variación intralocutor La variación interlocutor Selección final del corpus
Selección del corpus La variación intralocutor Locutores Estímulos Repeticiones EUROM1 12 pseudo-palabras 5 ALBAYZÍN 20 frases 2 GAUDÍ 455 Frases/texto/ Habla espontánea 3 sesiones 3 ritmos
Selección del corpus de análisis Corpus disponibles en español La variación intralocutor La variación interlocutor Selección final del corpus
Selección del corpus La variación interlocutor 700 frases equilibradas 999 frases f. ricas 10 frases equilibradas texto equilibrado Habla espontánea 50 frases equilibradas 40 párrafos m.oracional
Selección del corpus de análisis Corpus disponibles en español La variación intralocutor La variación interlocutor Selección final del corpus
Selección final: Ahumada-Gaudí Selección del corpus En el nivel segmental contamos con suficientes datos y distintas condiciones de naturalidad Los elementos suprasegmentales y el ritmo de habla se encuentran mucho menos representados Sería necesario un buen corpus oral de diálogos espontáneos Selección final: Ahumada-Gaudí 30 locutores masculinos Tres sesiones de grabación de habla espontánea y tres sesiones de lectura por cada locutor
VILE: Estudio acústico de la variación inter e intralocutor en español El proyecto VILE Determinación de los fenómenos fonéticos analizados Selección del corpus de análisis Resultados Conclusiones
Parámetros referidos a la fuente Resultados Parámetros referidos a la fuente Parámetros referidos a los resonadores Parámetros temporales
Parámetros referidos a la fuente Resultados Parámetros referidos a la fuente Parámetros referidos a los resonadores Parámetros temporales
Parámetros referidos a la fuente Valores medios de F0 Variaciones muy significativas en los valores medios de F0 en función del estilo de habla (habla espontánea y lectura) La tendencia de los valores medios de F0 en cada estilo de habla no es la misma a lo largo de las sesiones
Parámetros referidos a la fuente Valores medios de F0 Habla espontánea: No se producen variaciones lineales (pero sí cuadráticas) en el valor medio de F0 a medida que aumenta el número de sesiones 7 locutores (23,33%del total) no presentan diferencias significativas en el valor medio de F0 a lo largo de las sesiones
Parámetros referidos a la fuente Valores medios de F0 Lectura: No se producen variaciones de ningún tipo del valor medio de F0 a medida que aumentan las sesiones En 8 locutores (26,66% del total) no se dan diferencias significativas en el valor medio de la frecuencia de F0 en función del estilo de habla
Parámetros referidos a la fuente Fluctuación de los valores medios de F0 Ausencia de variaciones significativas en la fluctuación de F0 en función del estilo de habla (espontánea y lectura) La duración del grupo fónico y el número de segmentos del grupo fónico predicen de manera significativa la desviación típica de F0
Parámetros referidos a la fuente Resultados Parámetros referidos a la fuente Parámetros referidos a los resonadores Parámetros temporales
Parámetros referidos a los resonadores Los valores de frecuencia de F0, F1, F2, F3, F4 sirven para identificar al sujeto. Se puede observar que la frecuencia de F0, F3 y F4 distingue en todos los segmentos vocálicos un mayor número de locutores, mientras que la frecuencia de los dos primeros formantes distingue un número más reducido
Parámetros referidos a la fuente Resultados Parámetros referidos a la fuente Parámetros referidos a los resonadores Parámetros temporales
Parámetros temporales Duración del grupo fónico Diferencias significativas en la duración del grupo fónico en función del estilo de habla (habla espontánea y lectura) Ausencia de diferencias significativas en la duración del grupo fónico en relación con las sesiones
Parámetros temporales Duración del grupo fónico Habla espontánea: 5 locutores (16,66% del total) presentan diferencias significativas en la duración del grupo fónico respecto a la sesión Lectura: 2 locutores (6,66% del total) presentan diferencias significativas en la duración del grupo fónico respecto a la sesión
Parámetros temporales Velocidad de elocución y de articulación No se encuentran diferencias significativas en función de las distintas sesiones analizadas
VILE: Estudio acústico de la variación inter e intralocutor en español El proyecto VILE Determinación de los fenómenos fonéticos analizados Selección del corpus de análisis Resultados Conclusiones
Conclusiones Existen elementos que permiten la caracterización de los dos tipos de variación abordados en el proyecto El estilo de habla es una variable que debe tomarse en consideración a la hora de comparar muestras de habla Algunos parámetros temporales y frecuenciales mantienen una cierta constancia en el mismo locutor a lo largo de las sesiones de grabación
Conclusiones Segunda fase de VILE Estudio perceptivo de la variación inter e intralocutor en español (HUM2005- 06980/FILO) Validación perceptiva de los resultados del análisis acústico, siguiendo la línea iniciada en Marrero et al. (2003) Manipulación del habla natural y estímulos sintetizados
VILE: Estudio acústico de la variación inter e intralocutor en español http://liceu.uab.es/~joaquim/ VILE.html