La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley.

Presentaciones similares


Presentación del tema: "PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley."— Transcripción de la presentación:

1 PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley

2 PLN parsing charts2 Extensiones a partir de Charts Desarrollo de las técnicas básicas de Charts (Kay) y de sus implementaciones tabulares (CKY, Earley) Problemas: El tamaño del Chart aumenta con el tamaño de la gramática (número de reglas, longitud) Se crean arcos activos e inactivos inútiles. Se dice que la técnica de los Charts aporta mayor flexibilidad a la estrategia de análisis pero realmente se utiliza casi siempre una estrategia ascendente, eventualmente corregida con predicciones descendentes

3 PLN parsing charts3 Posibles soluciones Propagación de Restricciones CSP (Quesada) Análisis bidireccionales Dirigidos por el núcleo (Head driven) Dirigidos por functores Dirigidos por islas (Island driven) Uso de Charts para formalismos de unificación Utilización de restrictores Backbone grammars para predecir

4 PLN parsing charts4 CSP 1 Ambigüedad de la gramática (externa) vs ambigüedad del analizador (interna) 2 estrategias: Mecanismo básico bidireccional ascendente Predicciones descendentes derivaciones parciales adyacencias Mecanismo horizontal de propagación de las restricciones

5 PLN parsing charts5 CSP 2 S  A 1 b S  A 2 c A 1  a A 1  a A 1 A 2  a A 2  a A 2 gramática a a a b oración a analizar 02341 aa ab A2A2 A1A1 A2A2 A1A1 A2A2 A1A1 A 2  a  A 2  A 1  a  A 1  A 2  a  A 2  A 1  a  A 1  A 2  a  A 2  A 1  a  A 1  S   A 1  b

6 PLN parsing charts6 CSP 3 02341 aa ab A2A2 A1A1 A2A2 A1A1 A1A1 A 2  a  A 2  A 1  a  A 1  A 2  a  A 2  A 1  a  A 1  S   A 1  b Restricciones en la posición 3

7 PLN parsing charts7 CSP 4 02341 aa ab A1A1 A 1  a  A 1  S   A 1  b propagación de restricciones a las posiciones 2 y 1

8 PLN parsing charts8 Head-driven Chart parsing Comenzar la aplicación de la regla por el constituyente más informativo/restrictivo Motivación lingüística: HG, HPSG Adquisición automática Generalización de parsing LC Generalización de estrategias izquierda/derecha Extended Head Grammar

9 PLN parsing charts9 Island-driven parsing Se comienza el análisis por algunas posiciones de la oración determinadas dinámicamente (islas) Cómo seleccionarlas palabras no ambiguas base NPs Segmentos detectados con alta precisión (speech) Cómo extenderlas aproximación local aproximación neighbouring

10 PLN parsing charts10 Métodos tabulares Programación dinámica Aplicables a Gramáticas independientes del contexto (sin limitaciones) CKI (Cocke, Kasami, Younger,1967) Earley 1969 Extensibles a unificación, probabilísticas, etc...

11 PLN parsing charts11 Esquemas de análisis Mecanismo unificado de descripción de analizadores proceso constructivo Parser (esquema): dada una oración, se construye un conjunto inicial de items. dada una gramática, existe un conjunto de reglas que permite construir nuevos items a partir de los antiguos. Parser (algoritmo): Esquema de parsing + estructuras de datos + estructuras de control (+ estructuras de comunicación) Sikkel, 1997

12 PLN parsing charts12 Esquema CKY G =, G  CNF, w = a 1... a n X = {[A, i, j] | 0  i < j  A  N G } H = {[A, j-1, j] | A  a j  P G  1  j  n } D = {[B, i, j], [C, j, k]  [A, i, k] | A  BC  P G  0  i < k < j} V (D) = {[A, i, j] | A  * a i+1... a j } dominio, conjunto de items conjunto de hipótesis conjunto de pasos deductivos conjunto entidades válidas

13 PLN parsing charts13 CKY 1 Complejidad espacial n 2 temporal n 3 Exigencia de Forma Normal de Chomsky Construcción de la tabla de análisis t ij 1  i  w  1  j  w  i + 1 donde w = a 1,... a n es la frase a analizar

14 PLN parsing charts14 CKY 2 a 1 a 2... a i... a n A  t i,j j BC

15 PLN parsing charts15 CKY 3 Que el símbolo A esté en la posición t ij de la tabla significa que desde el símbolo A se puede derivar el fragmento del texto a i,... a i+j-1 (cadena de longitud j que comienza en la posición i-ésima) La condición de gramaticalidad es obviamente que el símbolo inicial de la gramática (F) cumpla que f  t 1|w|

16 PLN parsing charts16 CKY 4 La forma de construcción es ascendente Se construye la fila 1 utilizando las reglas unarias de la gramática: fila j=1 t i1 = {A| [A --> a i ]  P} A continuación se construyen las filas j=2,... La base del algoritmo es que al construir la fila j ya han sido construidas las anteriores: fila jt ij = {A|  k, 1  k  j, [A --> BC]  P, B  t ik,C  t i+k,j-k }

17 PLN parsing charts17 CKY 5 1.Add the lexical edges 2.for w = 2 to N: for i = 0 to N-w: for k = 1 to w-1: if: A  BC and B   chart[i,i+k] and C   chart[i+k,i+w] then: add A  BC to chart[i,i+w] 3.If S  chart[0,N], return the corresponding parse tomada de Loper

18 PLN parsing charts18 Gramática en CNF G 2

19 PLN parsing charts19 CKY 6 el gato come pescado oracion el gato come oracion el gato GN el (det) A gato come pescado oracion gato come oracion gato (n) B, GN come pescado GV come (vt, vi) C, GV pescado (n) B, GN

20 PLN parsing charts20 Esquema Earley scanning P earley = I = {[A  , i, j] | A    P G  0  i  j} D = D init  D scan  D compl  D pred H = { [a 1, 0, 1],..., [a n, n-1, n]} D init = {  [S  , 0, 0]} D scan = {[A   a , i, j], [a, j, j+1]  [A   a , i, j+1]} D compl = {[A   B , i, j], [B  , j, k]  [A  B , i, k]} D pred = {[A   B , i, j]  [B , j, j]} V = {[A  , i, j] |   * a i+1... a j  S  * a 1... a i A  } F = {[S  , 0, n]} C = {[S  , 0, n] |   * a 1... a n } inicialización compleción predicción

21 PLN parsing charts21 Earley 1 Complejidad espacial n 2 temporal n 3, n 2 si la gramática no es ambigua No es preciso CNF La estrategia de análisis es descendente F  SN, FV. SN  *N. SN  *DET, *N. FV  *V, SN.

22 PLN parsing charts22 Earley 2 Cada estado corresponde al consumo de una palabra de la cadena de entrada: I 0, I 1,... I i,... I |w| Los estados son conjuntos de “parse list” que indican grados de aplicación de las reglas para llegar a dicho estado. [A --> , i]  I j quiere decir que S -->  A  donde  --> a 1 a 2... a i  --> a i+1 a i+2... a j La condición de gramaticalidad será [S --> , 0]  I |w|

23 PLN parsing charts23 Earley 3 a 1 a 2... a i... a j a n     S S -->  A  [A --> , i]  I j

24 PLN parsing charts24 Earley 4 proceso iterativo: construcción del estado I 0 construcción del resto de estados (extensión) operaciones: predicción descendente scanning (absorción de una palabra) compleción (final de una regla)

25 PLN parsing charts25 Earley 5 A  wAwAw Scanner ABEABE E  CD Predictor DEADEAD  EA  A  BC  Completer S  AB Initialization tomada de Loper

26 PLN parsing charts26 Earley 6 Construcción de I 0 : 1) si [S-->  ]  P entonces [S-->  ]  I 0 2) si [B-->  ]  I 0 (lo cual sólo es posible si [B-->  ]  I 0 ) y [A-->  ]  I 0 entonces [A-->  ]  I 0 3) si [A-->  ]  I 0 y [B-->  ]  P entonces [B-->  ]  I 0

27 PLN parsing charts27 Earley 7 Extensión: 4) si [B-->  a , i]  I j-1 y a = a j entonces [B-->  a , i]  I j (scanning) 5) si [A--> , i]  I j y [B--> , k]  I i entonces [B--> , k]  I j (compleción) 6) si [A--> , i]  I j y [B-->  ]  P entonces [B--> , j]  I j (predicción)

28 PLN parsing charts28 Earley 8 For each rule S  in the grammar: Add S  to chart[0,0] For i = 0 to N: for edge in queue[i]: if edge is incomplete and edge.next is a part of speech: scanner(edge) if edge is incomplete and edge.next is not a POS: predictor(edge) if edge is complete: completer(edge) tomada de Loper

29 PLN parsing charts29 Earley 9 [F   SN FV  ]  I 0 [SN   *N  ]  I 0 [SN   *DET *N  ]  I 0 ejemplo: elgatocomepescado F  *DET *N SN FV inicialización predicción

30 PLN parsing charts30 Earley 10 [F-->  SN FV  ] [SN-->  *N  ] [SN-->  *DET *N  ] I0I0 [SN--> *DET  *N  ] I1I1 (4) el [SN--> *DET *N  ] I2I2 (4) gato

31 PLN parsing charts31 Earley 11 [SN--> *DET *N  ] [F--> SN  FV  ] [FV-->  *V SN  ] I2I2 aplico (4) aplico (5), miro en I 3 aplico (5), miro en I 2 [FV--> *V  SN  ] [SN-->  *DET *N  ] [SN-->  *N  ] I3I3 aplico (4) aplico (6) dos veces (4) come [SN--> *N   ] [FV--> *V SN  ] [F--> SN FV  ] (4) pescado aplico (5), miro en I 0 añado el 2º item aplico (6) añado el 3º


Descargar ppt "PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley."

Presentaciones similares


Anuncios Google