Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porPatricia Saavedra Alvarado Modificado hace 8 años
1
PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley
2
PLN parsing charts2 Extensiones a partir de Charts Desarrollo de las técnicas básicas de Charts (Kay) y de sus implementaciones tabulares (CKY, Earley) Problemas: El tamaño del Chart aumenta con el tamaño de la gramática (número de reglas, longitud) Se crean arcos activos e inactivos inútiles. Se dice que la técnica de los Charts aporta mayor flexibilidad a la estrategia de análisis pero realmente se utiliza casi siempre una estrategia ascendente, eventualmente corregida con predicciones descendentes
3
PLN parsing charts3 Posibles soluciones Propagación de Restricciones CSP (Quesada) Análisis bidireccionales Dirigidos por el núcleo (Head driven) Dirigidos por functores Dirigidos por islas (Island driven) Uso de Charts para formalismos de unificación Utilización de restrictores Backbone grammars para predecir
4
PLN parsing charts4 CSP 1 Ambigüedad de la gramática (externa) vs ambigüedad del analizador (interna) 2 estrategias: Mecanismo básico bidireccional ascendente Predicciones descendentes derivaciones parciales adyacencias Mecanismo horizontal de propagación de las restricciones
5
PLN parsing charts5 CSP 2 S A 1 b S A 2 c A 1 a A 1 a A 1 A 2 a A 2 a A 2 gramática a a a b oración a analizar 02341 aa ab A2A2 A1A1 A2A2 A1A1 A2A2 A1A1 A 2 a A 2 A 1 a A 1 A 2 a A 2 A 1 a A 1 A 2 a A 2 A 1 a A 1 S A 1 b
6
PLN parsing charts6 CSP 3 02341 aa ab A2A2 A1A1 A2A2 A1A1 A1A1 A 2 a A 2 A 1 a A 1 A 2 a A 2 A 1 a A 1 S A 1 b Restricciones en la posición 3
7
PLN parsing charts7 CSP 4 02341 aa ab A1A1 A 1 a A 1 S A 1 b propagación de restricciones a las posiciones 2 y 1
8
PLN parsing charts8 Head-driven Chart parsing Comenzar la aplicación de la regla por el constituyente más informativo/restrictivo Motivación lingüística: HG, HPSG Adquisición automática Generalización de parsing LC Generalización de estrategias izquierda/derecha Extended Head Grammar
9
PLN parsing charts9 Island-driven parsing Se comienza el análisis por algunas posiciones de la oración determinadas dinámicamente (islas) Cómo seleccionarlas palabras no ambiguas base NPs Segmentos detectados con alta precisión (speech) Cómo extenderlas aproximación local aproximación neighbouring
10
PLN parsing charts10 Métodos tabulares Programación dinámica Aplicables a Gramáticas independientes del contexto (sin limitaciones) CKI (Cocke, Kasami, Younger,1967) Earley 1969 Extensibles a unificación, probabilísticas, etc...
11
PLN parsing charts11 Esquemas de análisis Mecanismo unificado de descripción de analizadores proceso constructivo Parser (esquema): dada una oración, se construye un conjunto inicial de items. dada una gramática, existe un conjunto de reglas que permite construir nuevos items a partir de los antiguos. Parser (algoritmo): Esquema de parsing + estructuras de datos + estructuras de control (+ estructuras de comunicación) Sikkel, 1997
12
PLN parsing charts12 Esquema CKY G =, G CNF, w = a 1... a n X = {[A, i, j] | 0 i < j A N G } H = {[A, j-1, j] | A a j P G 1 j n } D = {[B, i, j], [C, j, k] [A, i, k] | A BC P G 0 i < k < j} V (D) = {[A, i, j] | A * a i+1... a j } dominio, conjunto de items conjunto de hipótesis conjunto de pasos deductivos conjunto entidades válidas
13
PLN parsing charts13 CKY 1 Complejidad espacial n 2 temporal n 3 Exigencia de Forma Normal de Chomsky Construcción de la tabla de análisis t ij 1 i w 1 j w i + 1 donde w = a 1,... a n es la frase a analizar
14
PLN parsing charts14 CKY 2 a 1 a 2... a i... a n A t i,j j BC
15
PLN parsing charts15 CKY 3 Que el símbolo A esté en la posición t ij de la tabla significa que desde el símbolo A se puede derivar el fragmento del texto a i,... a i+j-1 (cadena de longitud j que comienza en la posición i-ésima) La condición de gramaticalidad es obviamente que el símbolo inicial de la gramática (F) cumpla que f t 1|w|
16
PLN parsing charts16 CKY 4 La forma de construcción es ascendente Se construye la fila 1 utilizando las reglas unarias de la gramática: fila j=1 t i1 = {A| [A --> a i ] P} A continuación se construyen las filas j=2,... La base del algoritmo es que al construir la fila j ya han sido construidas las anteriores: fila jt ij = {A| k, 1 k j, [A --> BC] P, B t ik,C t i+k,j-k }
17
PLN parsing charts17 CKY 5 1.Add the lexical edges 2.for w = 2 to N: for i = 0 to N-w: for k = 1 to w-1: if: A BC and B chart[i,i+k] and C chart[i+k,i+w] then: add A BC to chart[i,i+w] 3.If S chart[0,N], return the corresponding parse tomada de Loper
18
PLN parsing charts18 Gramática en CNF G 2
19
PLN parsing charts19 CKY 6 el gato come pescado oracion el gato come oracion el gato GN el (det) A gato come pescado oracion gato come oracion gato (n) B, GN come pescado GV come (vt, vi) C, GV pescado (n) B, GN
20
PLN parsing charts20 Esquema Earley scanning P earley = I = {[A , i, j] | A P G 0 i j} D = D init D scan D compl D pred H = { [a 1, 0, 1],..., [a n, n-1, n]} D init = { [S , 0, 0]} D scan = {[A a , i, j], [a, j, j+1] [A a , i, j+1]} D compl = {[A B , i, j], [B , j, k] [A B , i, k]} D pred = {[A B , i, j] [B , j, j]} V = {[A , i, j] | * a i+1... a j S * a 1... a i A } F = {[S , 0, n]} C = {[S , 0, n] | * a 1... a n } inicialización compleción predicción
21
PLN parsing charts21 Earley 1 Complejidad espacial n 2 temporal n 3, n 2 si la gramática no es ambigua No es preciso CNF La estrategia de análisis es descendente F SN, FV. SN *N. SN *DET, *N. FV *V, SN.
22
PLN parsing charts22 Earley 2 Cada estado corresponde al consumo de una palabra de la cadena de entrada: I 0, I 1,... I i,... I |w| Los estados son conjuntos de “parse list” que indican grados de aplicación de las reglas para llegar a dicho estado. [A --> , i] I j quiere decir que S --> A donde --> a 1 a 2... a i --> a i+1 a i+2... a j La condición de gramaticalidad será [S --> , 0] I |w|
23
PLN parsing charts23 Earley 3 a 1 a 2... a i... a j a n S S --> A [A --> , i] I j
24
PLN parsing charts24 Earley 4 proceso iterativo: construcción del estado I 0 construcción del resto de estados (extensión) operaciones: predicción descendente scanning (absorción de una palabra) compleción (final de una regla)
25
PLN parsing charts25 Earley 5 A wAwAw Scanner ABEABE E CD Predictor DEADEAD EA A BC Completer S AB Initialization tomada de Loper
26
PLN parsing charts26 Earley 6 Construcción de I 0 : 1) si [S--> ] P entonces [S--> ] I 0 2) si [B--> ] I 0 (lo cual sólo es posible si [B--> ] I 0 ) y [A--> ] I 0 entonces [A--> ] I 0 3) si [A--> ] I 0 y [B--> ] P entonces [B--> ] I 0
27
PLN parsing charts27 Earley 7 Extensión: 4) si [B--> a , i] I j-1 y a = a j entonces [B--> a , i] I j (scanning) 5) si [A--> , i] I j y [B--> , k] I i entonces [B--> , k] I j (compleción) 6) si [A--> , i] I j y [B--> ] P entonces [B--> , j] I j (predicción)
28
PLN parsing charts28 Earley 8 For each rule S in the grammar: Add S to chart[0,0] For i = 0 to N: for edge in queue[i]: if edge is incomplete and edge.next is a part of speech: scanner(edge) if edge is incomplete and edge.next is not a POS: predictor(edge) if edge is complete: completer(edge) tomada de Loper
29
PLN parsing charts29 Earley 9 [F SN FV ] I 0 [SN *N ] I 0 [SN *DET *N ] I 0 ejemplo: elgatocomepescado F *DET *N SN FV inicialización predicción
30
PLN parsing charts30 Earley 10 [F--> SN FV ] [SN--> *N ] [SN--> *DET *N ] I0I0 [SN--> *DET *N ] I1I1 (4) el [SN--> *DET *N ] I2I2 (4) gato
31
PLN parsing charts31 Earley 11 [SN--> *DET *N ] [F--> SN FV ] [FV--> *V SN ] I2I2 aplico (4) aplico (5), miro en I 3 aplico (5), miro en I 2 [FV--> *V SN ] [SN--> *DET *N ] [SN--> *N ] I3I3 aplico (4) aplico (6) dos veces (4) come [SN--> *N ] [FV--> *V SN ] [F--> SN FV ] (4) pescado aplico (5), miro en I 0 añado el 2º item aplico (6) añado el 3º
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.