La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Análisis y modelado de sistemas. Predicción lineal.

Presentaciones similares


Presentación del tema: "Análisis y modelado de sistemas. Predicción lineal."— Transcripción de la presentación:

1 Análisis y modelado de sistemas. Predicción lineal.
Mecanismos de producción de la voz Análisis LPC Hizketaren inguruko oinarrizko kontzeptuak

2 Teoría de producción de la voz
Estudio científico Modelo ingenieril Análisis LPC Predecir una muestra a partir de las anteriores Calcular la mejor Combinación Lineal Predictora Invertir=Síntesis desde señal error sin información Parámetros equivalentes

3 2. GAIA: Ahots Parametrizazioa
Producción de voz Voz Es la onda acustica radiada cuando una constricción del tracto vocal perturba el flujo de aire expulsado por los pulmones Ahots sintesia honako ahots ekoizpenaren ereduan oinarritzen da: - Energi iturria birikiak, bronkioak eta trakea dira. - Gero bereisten dugu ahots traktua, glotisa, faringea eta aho barrunbeak osatuta - eta sudur traktua, ahosabai errezela eta sudurra osatuta Soinu sudurkari bat ahoskatzeko, ahosabai errezela jaisten da eta ahots eta sudur traktuak akoplatzen dira. Birikiak haizea kanporatzen dute eta orduan sortzen den fluxua ahots kordak, ahots traktua eta soinu nasala bada sudur traktua ere zeharkatzen ditu eta bide honetatik zenbait oztopo aurkitzen du. Azkenean ezpainetaraino heltzen denean uhin bat erradiatzen da, eta uhin hori da ahotsa hain zuzen ere. "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

4 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Sonidos sonoros: El flujo de aire procedente de los pulmones es periódicamente interrumpido por la apertura y cierre de las cuerdas vocales. Flujo periódico, frecuencia fundamental F0 -> pitch Sonidos sordos: No vibran las cuerdas vocales El flujo de aire encuentra un Estrechamiento  toma gran velocidad  forma turbulencias Tracto vocal + Tracto nasal: Actúan como cavidades resonantes Frecuencias de resonancia  Formantes Los formantes dependen de la forma y dimensiones del TV  El espectro de la voz varía con el tiempo al varíar el TV "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

5 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Excitación Cavidad resonante Radiación en los labios g(t) Pulso de Rosenberg G(f) Ezpainetan erradiazioa sortzen da. Burua esfera bat balitz bezala modelatzen da. Ezpainak zulo biribil txikia dira. Esferak frekuentzia handiak txikiak baino hobeto islatzen ditu. Horregatik frekuentzia handiak handitzen dira, 6 dB zortziko bakoitzarengatik. "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

6 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Modelo de Fuente y Tracto vocal: Separa las características de la fuente y del tracto vocal. Funciona mejor con parametros que varían lentamente. Filtro V(z) todo polos: solo tiene resonancias no, modela las nasales. Separa fuente sonora y sorda no vale para todos los sonidos Cambio repentino de tipo de fuente: no es realista "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

7 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Tracto vocal  tubo de sección variante y no uniforme A(x) Glotis Labios A(x) Glotis Labios Ak(x) x=0 x=l A(x) x=0 x=l Aproximación: concatenación de tubos de secciones Ak constantes "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

8 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Longitud de onda mayor que la longitud del tubo: f≤5000Hz l≥340m/s/5000Hz=6’8cm Aproximación de onda plana aceptable Además se supone: No hay pérdidas por rozamiento ni por conducción de calor Las secciones Ak no cambión con el tiempo "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

9 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Con estas suposiciones, las ondas en el tubo cumplen estas ecuaciones: Puesto que el área en una sección es constante: p=p(x,t) Variación de la presion u=u(x,t) Variación del flujo de aire r: Densidad del aire c: Velocidad del sonido A=A(x,t) Función de área "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

10 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Analogía electrica: línea de transmisión uniforme y sin pérdidas v: tensión p: presión i: corriente u: velocidad L: inductancia r/A: inductancia acústica C: capacidad A/rc2: capacidad acústica "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

11 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Solución de las ecuaciones diferenciales: An A1 A2 A3 An+1 An-1 Onda que avanza Onda que retrocede x=0 x=lk "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

12 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Tiempo de recorrido de una sección Condiciones de continuidad: lk lk+1 Se obtienen las ecuaciones: Coeficiente de reflexión |rk|<1 Diagrama de flujo que corresponde a estas ecuaciones: Retardo tk + tk+1 tubo késimo tubo (k+1)ésimo 1+rk 1-rk rk -rk "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

13 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Condiciones de contorno: En los labios En la glotis Para modelar los labios: Pantalla acústica esférica Difícil de modelar Pantalla acústica plana "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

14 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Condiciones de contorno en los labios: Velocidad de partícula, en los labios: Diagrama de flujo que corresponde a esta ecuación: rL coeficiente de reflexión en los labios ZL impedancia de radiación en los labios Retardo tN + tubo Nsimo 1+rL -rL "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

15 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Condiciones de contorno en la glotis: Diagrama de flujo que corresponde a esta ecuación : rG coeficiente de reflexión en la glotis ZG impedancia de la glotis + Retardo t1 1er tubo rG "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

16 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Modelo de tubo sin pérdidas completo: Retardo t1 1er tubo rG 1+r1 1-r1 t3 + 3er tubo 1+rL -rL t2 2º tubo 1+r2 1-r2 r2 -r2 r1 -r1 "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

17 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Modelo de tubo sin pérdidas completo: Retardo t1 1er tubo rG 1+r1 1-r1 t3 + 3er tubo 1+rL -rL t2 2º tubo 1+r2 1-r2 r2 -r2 r1 -r1 Orokorrean N galera gabeko hodien kateamenduak N polo dauzkan sistema sortzen du. N galera gabeko hodien kateamenduak N/2 polo konplexu konjokatu sortuko du gehienez. Horiek izango dira erresonantzia frekuentziak edo formanteak. Sistemak ez dauka zerorik, z=0 daudenak ez badira. Hau gertatzen da hodi bat bakarrik erabili delako, ez dago Adarrarik. Ai koefizienteak ri koefizienteen menpean daude. "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

18 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Modelo de tubo sin pérdidas completo: Todos los tubos de igual longitud: Retardo t1 1er tubo rG 1+r1 1-r1 t3 + 3er tubo 1+rL -rL t2 2º tubo 1+r2 1-r2 r2 -r2 r1 -r1 Ereduak Retardok, biderketak eta batuketak bakarrik dauzkanez, posible da sistema diskretu baliokidea bihurtu. Murrizketa bakarra Retardok hodi guztietan T multiploak izan behar direla da, T hau sistema diskretuaren erloju zikloa dela. Normalean egiten dena da hodi guztiek luzera bera daukatela suposatzea. Honela, lagintzeko periodoa T 2tau izango da, hodi bat zeharkatzeko behar den denbora. T=2tau=2l/cN->N=2l/cT=2lFs/c Suposaketa hau, hodien kopurua nahikoa handia bada, ahots traktu konplexuentzako ere badabil. Adibidez, Fs=8000 Hz, c=3499cm/s L=17cm - N=8 edo 4 formante. Esperimentalki ahots traktuaren transferentzia funtzioak formante bat kilohertzio bakoitzarentzako dauka. Dx Longitud de los tubos N Número de tubos l Longitud del tracto vocal t Retardo en un tubo A5 A1 A2 A3 A6 A4 A7 A8 Dx l "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

19 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Sistema discreto equivalente: Sistema discreto equivalente con retardos enteros: rG 1+r1 1-r1 + 1+rL -rL 1+r2 1-r2 r2 -r2 r1 -r1 z-1/2 rG 1+r1 1-r1 + (1+rL) -rL 1+r2 1-r2 r2 -r2 r1 -r1 z-1 z3/2 Bi erdi-Retardok sekzio bakoitzean elkartu daitezke atzerapen osokoak erabiltzeko. "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

20 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Lehen grafika: 10 galera gabeko sekziodun hodiaren area funtzioa. Amaitzeko 30 cm2-ko islapen gabeko sekzioa dago. Bigarren grafika: Islapen koefizienteak 10 sekziodun hodiarentzako. Azken koefizientea rN=.714 da. Hirugarren grafika: 10 sekziodun hodiaren maiztasun erantzuna. Lerro jarraia: rN=1, lerro ez jarraia: rN=.714 Línea continua: terminación en cortocircuito "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

21 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Modelo de tubo sin pérdidas uG(n) uL(n) Función de área (coeficientes de reflexión) Sistema lineal V(z) uG(n) uL(n) parámetros Ahotsaren sormena modela daiteke sistema lineal batekin. Sistema honen parametroak ekoizpen prozesuarekin erlazionatuta daude. Ahots seinalea sortzeko kitzikapen modua eta sistemaren islapen ezaugarriak denborarekin aldatu behar dute. Ahots soinu askorentzako kitzikapena eta islapen ezaugarriak ms-ero finkoak direla suposa daiteke. Sistema diskretu honi “terminal analogue” deitzen zaio: muturretan seinaleak antzekoak dira, baina sistema barruko estrukturak ez du ahotsa sortzeko prozesu fisikoak imitatzen. "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

22 Teoría de la producción de voz
2. GAIA: Ahots Parametrizazioa Teoría de la producción de voz Modelo de tubo sin pérdidas uG(n) uL(n) Función de área (coeficientes de reflexión) Sistema lineal V(z) uG(n) uL(n) parámetros x Jk |z|k plano Z + a1 a2 uL(n) uG(n) aN-1 aN z-1 G + 2|z1|cosJ1 -|z1|2 uL(n) uG(n) z-1 G1 G2 GM 2|z2|cosJ2 2|zM|cosJM -|z2|2 -|zM|2 Sarrera eta irteeraren arteko erlazioa V(z) transferentzia funtzioa batentzat irudika daiteke. Hor G eta alfak area funtzioaren arabera aldatzen dira. Poloak bakarrik daukan sistema baten inplementazioa forma zuzena erabiliz. Poloak bakarrik daukan sistema baten inplementazioa kaskada forma erabiliz. The vocal tract is not built of cylinders The vocal tract is not lossless The vocal tract has a side passage (the nasal cavity) fricatives (e.g. /s/ and /sh/) are generated near the lips "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

23 Análisis LPC Análisis por Predicción Lineal (Linear Predictive Analysis) Técnica eficaz para analizar la voz Estima el espectro de la voz de forma Precisa Eficiente Idea básica: una combinación lineal de muestras de voz pasadas es buena aproximación de la muestra siguiente

24 Análisis LPC El análisis LPC (Linear Predictive Coding):
Predice los polos que modelan el tracto vocal Mediante pocos párametros Obtenidos por cálculos sencillos

25 Análisis LPC Formamos una combinación lineal de P muestras:
Sean {s(n)} las muestras de voz tomadas cada Ts seg. Ts<1/2m, m: frecuencia máxima de la señal s(n) s(n-p) P+1 Formamos una combinación lineal de P muestras: a1·s(n-1)+a2·s(n-2)+…+ap·s(n-p)= ŝ(n) e(n) = s(n) - ŝ(n)

26 Análisis LPC Si {e(n)} es una variable estadística incorrelada (media 0 y varianza s2)

27 Análisis LPC Si {e(n)} es una variable estadística incorrelada (media 0 y varianza s2) ŝ(n) es una buena aproximación de s(n)

28 Análisis LPC Si {e(n)} es una variable estadística incorrelada (media 0 y varianza s2) Error cometido en la predicción, residuo: ŝ(n) es una buena aproximación de s(n)

29 Análisis LPC P(z) filtro predictor Transformada Z ) ( ˆ z S P = P(z)

30 2. GAIA: Ahots Parametrizazioa
Análisis LPC A(z) + + _ Error de predicción P(z) transformada Z A(z) "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

31 2. GAIA: Ahots Parametrizazioa
Análisis LPC Sintesis LPC H(z)=1/A(z) + P(z) H(z): modela la respuesta del tracto vocal e(n): es la excitación, la fuente de sonido "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

32 Análisis LPC: ejemplos E
2. GAIA: Ahots Parametrizazioa Análisis LPC: ejemplos E Segmento de una e, enventanado hamming FFT de la señal y espectro LPC de orden 14 Error de predicción Espectro del error "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

33 Análisis LPC: ejemplos S
2. GAIA: Ahots Parametrizazioa Análisis LPC: ejemplos S Segmento de una s, enventanado hamming FFT de la señal y espectro LPC de orden 14 Error de predicción Espectro del error "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

34 Cálculo de los coeficientes LPC
2. GAIA: Ahots Parametrizazioa Cálculo de los coeficientes LPC Criterio para calcular los coeficientes del filtro predictor P(z) : Minimizar el error cuadrático medio mínimo Atención, estas ecuaciones sólo se cumplen si alfa0 es uno. Es que están todas agrupadas en un único sumatorio!! "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

35 Cálculo de los coeficientes LPC
Para calcular la solución en el intervalo [n0 n1] son necesarias la muestras de la señal del intervalo [n0-p n1] Basandose en un conjunto de N muestras se han investigado dos métodos de resolución: Método de las autocorrelaciones Método de las covarianzas Sistema de ecuaciones lineales p ecuaciones p incógnitas

36 Cálculo de los coeficientes LPC
Método de las autocorrelaciones: El error se minimiza en el intervalo [-∞ ∞] Se supone señal nula en n<0 y n>N-1 i-j s(m+i-j) s(m) Muestras usadas E minimo en [n0 n1]

37 Cálculo de los coeficientes LPC
Método de las autocorrelaciones: El error se minimiza en el intervalo [-∞ ∞] Se supone señal nula en n<0 y n>N-1 n-i=m Autocorrelación de s(n) Muestras usadas s(m+i-j) s(m) i-j E minimo en [n0 n1]

38 Cálculo de los coeficientes LPC
Método de las autocorrelaciones: R(k) es par Las ecuaciones a resolver son Ecuaciones de Yule-Walker [R]

39 Cálculo de los coeficientes LPC
2. GAIA: Ahots Parametrizazioa Cálculo de los coeficientes LPC La matriz [R] es Toepliz: Simétrica Los elementos en las diagonales paralelas a la diagonal principal son iguales El método de Durbin aprovecha estas propiedades de la matriz [R] Como s(n)=0 para n<0 y n>N-1, e(n) será grande en 0<n<p pues la predicción se basa en muestras que han sido puestas a cero. Ocurre lo mismo en el intervalo final N<n<N+p-1 Para reducir este efecto se enventana la señal "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

40 LPC koefizienteak Para obtener la solución: algoritmo de Levison-Durbin ki

41 Cálculo de los coeficientes LPC
Método de las covarianzas: Se minimiza el error en el intervalo [p, N-1] Se utilizan todas las muestras de la señal i-j s(m+i-j) s(m) Muestras usadas E minimo en [n0 n1]

42 Cálculo de los coeficientes LPC
Método de las covarianzas: Se minimiza el error en el intervalo [p, N-1] Se utilizan todas las muestras de la señal n-i=m i-j s(m+i-j) s(m) Muestras usadas E minimo en [n0 n1]

43 Cálculo de los coeficientes LPC
Método de las covarianzas: La matriz f : Es definida positiva Se puede resolver por métodos eficientes (descomposición de Cholesky) Las ecuaciones a resolver

44 2. GAIA: Ahots Parametrizazioa
Análisis LPC Sonido del residuo A(z) + + _ P(z) Se efectua prediccion lineal cada 2.5ms, con LPC-12, y ventana de 30ms (hamming). "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

45 Análisis LPC Residuo de un segmento sonoro

46 Análisis LPC Residuo de un segmento sordo

47 2. GAIA: Ahots Parametrizazioa
Análisis LPC Señal original "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

48 Análisis LPC

49 2. GAIA: Ahots Parametrizazioa
Análisis LPC Residuo "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

50 Análisis LPC: ejemplos
2. GAIA: Ahots Parametrizazioa Análisis LPC: ejemplos Análisis LPC …{ak,Gi}i {ak,Gi}i +1… Ruido blanco, G=100% Ruido blanco, G=50% x + Tren de deltas G=100% Gi P(z) Tren de deltas G=50% "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

51 Parametrización de la voz
Análisis de la señal de voz Análisis LPC Análisis PARCOR Análisis CEPSTRUM Vocoder LPC Análisis por síntesis

52 2. GAIA: Ahots Parametrizazioa
Análisis PARCOR PARtial CORrelation coefficients ei(n) es el error de predicción del método Levinson-Durbin en el paso i forward prediction error bi(n) se define de forma similar backward prediction error s(n) se predice como combinación lineal de i muestras anteriores s(n-i), se predice como combinación lineal de i muestras posteriores "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

53 2. GAIA: Ahots Parametrizazioa
Análisis PARCOR Sistema predictor de orden i: Relación entre coeficientes de sistemas predictores de distinto orden Si la entrada al sistema predictor es s(n), la salida es ei(n) i muestras usadas en una predicción de orden i s(n) s(n-i) "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

54 2. GAIA: Ahots Parametrizazioa
Análisis PARCOR Sistema predictor de orden i: Relación entre coeficientes de sistemas predictores de distinto orden Si la entrada al sistema predictor es s(n), la salida es ei(n) i muestras usadas en una predicción de orden i s(n) s(n-i) "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

55 2. GAIA: Ahots Parametrizazioa
Análisis PARCOR Sistema predictor de orden i: Relación entre coeficientes de sistemas predictores de distinto orden Si la entrada al sistema predictor es s(n), la salida es ei(n) i muestras usadas en una predicción de orden i s(n) s(n-i) "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05

56 Estas ecuaciones recursivas corresponden a un filtro lattice
Análisis PARCOR Transformada inversa Transformada inversa b1(n) z-1 s(n) -k1 e0(n) b0(n) + -k2 e1(n) bp-1(n) -kp ep-1(n) ep(n) Estas ecuaciones recursivas corresponden a un filtro lattice

57 Análisis PARCOR Cálculo de los coeficientes ki:
Estos coeficientes se pueden usar para generar voz e(n) eta b(n) seinaleen arteko korrelazio normalizatua b1(n) z-1 s(n) -k1 e0(n) b0(n) + -k2 e1(n) bp-1(n) -kp ep-1(n) ep(n) puesto que s(n)=e0(n), se puede generar la señal de voz usando ep(n)

58 Análisis PARCOR Usando la configuración Lattice se han desarrollado otros métodos de síntesis: Método de Burg: minimiza la suma de los errores forward y backward Se llega a esta ecuación para los coef. PARCOR Con esta expresión se cumple siempre |k’i|<1. Se garantiza la estabilidad del filtro

59 Comparación de métodos
Covarianzas Cholesky Autocorrelaciones Durbin Lattice Burg Memoria Datos Matriz correl. Ventana N1 N2 3N3 µ p2/2 µ p -- Productos Enventanado Correlación Solución µ N1p µ N2p µ p3 µ p2 5N3p Estabilidad Puede ser inestable Estable si R(i) se calcula con suficiente precisión Estable

60 2. GAIA: Ahots Parametrizazioa
Bibliografía Huang, X., Acero, A., Hon, H. Spoken Language Processing Prentice Hall, 2001 Rabiner, L.R., Schafer, R.W. Digital Processing of Speech Signals Prentice Hall, 1978 O’Shaughnessy, D. Speech Communications Human and Machine IEEE Press, 2000 Dutoit, T. An introduction to Text-to-Speech Synthesis Kluwer Academic Publishers, 1997 J. Makhoul Linear Prediction: A tutorial review Proc. of the IEEE, 1975 "Hizkuntzaren azterketa eta prozesamendua" doktorego programa 04-05


Descargar ppt "Análisis y modelado de sistemas. Predicción lineal."

Presentaciones similares


Anuncios Google