La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Análisis sintáctico GRIAL – UB KNOW. Análisis sintàctico Situación actual del análisis sintáctico del español Desarrollo de una gramática Adquisición.

Presentaciones similares


Presentación del tema: "Análisis sintáctico GRIAL – UB KNOW. Análisis sintàctico Situación actual del análisis sintáctico del español Desarrollo de una gramática Adquisición."— Transcripción de la presentación:

1 Análisis sintáctico GRIAL – UB KNOW

2 Análisis sintàctico Situación actual del análisis sintáctico del español Desarrollo de una gramática Adquisición de información para guiar el análisis sintáctico

3 Situación actual Analizadores existentes ‘asequibles’  análisis total  Hispal  Conexor  Freeling Evaluación cualitativa Análisis comparativo de los resultados - constituyentes, oraciones subordinadas - mala identificación de la función sintáctica - sintagmas preposicionales - complementos directos con ‘a’ - identificación de constituyentes coordinados - multiword expressions - adverbiales vs. objeto directo - elipsis del verbo principal en una cláusula

4 Comparación Fenómeno observadoHISPALFreeLingConnexor Syntactic Function Misidentification (1. El partido se convirtió en la pesadilla que había pronosticado Luís. 2. Papel fundamental han desempeñado en esta recuperación los evangelios… ) 1. + 2. OKNo Luis, los evangelios – objeto directo No Luis, los evangelios – objeto directo Grouping of Constituents ( E sa expresi ó n del deseo de ver convertida en candidata a alcaldesa de Madrid a la vicepresidenta del Gobierno refleja la realidad. ) NO impossibility of the three parsers to group the constituent s of compound subjects. NO impossibility of the three parsers to group the constituents of compound subjects. NO impossibility of the three parsers to group the constituents of compound subjects. Prepositional Phrases with a (1. Ven a la tienda oficial esta tarde. 2. Pero el colmo es ver a Lucio subiendo al ataque..) OKNO1. si 2. no

5 Comparación Ellipsis of the main verb in a clause ( Juan bebió vino y María cerveza.) OKNO grup-verb/top/(bebió beber VMIS3S0) sn/subj/(Juan juan NP00000) coor-n/obj/(y y CC) sn/co-n/(vino vino NCMS000) sn/co-n/(María maría NP00000) sn/obj/(cerveza cerveza NCFS000) NO 1 Juan juan subj:>2 @NH N MSC SG Prop 2 bebi ó beber main:>0 @MAIN V IND PRET SG P3 3 vino vino obj:>2 @NH N MSC SG 4 y y @CC CC 5 Mar í a mar í a adc:>6 @NH N FEM SG Prop 6 cerveza cerveza @NH N FEM SG Inversion of objects and subjects ( Averigua en qué lugar está la casa.) No especifica qué es casa NO (casa – objeto directo)No especifica qué es casa Treatment of multiword names (1. Ángel Amor se llama el individuo. 2. Anier García le dio el lunes a Cuba su primera medalla dorada.) 1. no analiza ángel amor como un todo, quiza porque Amor coincide con el sustantivo amor 2. Anier_garcia (un todo) 1. no analiza ángel amor como un todo 2. Anier_garcia (un todo) 1. OK ángel modifica a amor 2. El mismo análisis como en 1. Yes / No Questions ( ¿Renuncia España al veto en los fondos de cohesión?) OKNO, renuncia como sustantivo y no como verbo

6 Gramática RASP  Constituyentes básicos : sn, sv, sadj, sadv,sp, coordinación léxica y sintagmática  Construcciones principales  Oraciones subordinadas relativas y completivas  Metarreglas???  Gramática completa

7 Gramática del español RASP  gramática de unificación: GPSG  rasgos  reglas de estructura de frase  metarreglas ?  no incluye lemas  código cerrado  gramática completa FREELING  gramática de dependencias  clases  reglas a pares  funciones de situación en el árbol  incluye lemas  código “abierto”  gramática de la oración

8 Adquisición de Patrones de Subcategorización Objetivo Obtener clases de comportamiento sintáctico de los verbos a partir de SENSEM Extrapolar estos comportamientos a verbos desconocidos  adquisición Fases Crear una clasificación inducida a partir de los ejemplos / sentidos de SENSEM Aprender el clasificador Aplicar el clasificador sobre verbos no conocidos

9 Metodología Corpus etiquetado manualmente Reducción de los casos  PS Inducción de clases  clasificación Evaluación y selección de la solución Clasificador a partir de los ejemplos Analizados manual/automáticamente Agrupación por sentidos /ejemplos Asignación de clases a ejemplos no vistos

10 SenSem Corpus etiquetado:  Delimitación de constituyentes  Categoría sintáctica  Función sintáctica  Rol semántico  Clase eventiva

11 Reducción Patrones de Subcats  Argumentos  Sin variedad de orden  Compactación de categorías  sn v sp  sn(sto) v sp(oprep)  sn(sto-exp) v sp(oprep-tema)

12 Patrones  998 sentidos  250 lemas verbales  Patrones todos> 5>10 C 2409869 C+F785213130 C+F+R2854464317

13 Clasificación sentido verbal cada sentido se representa como un vector las dimensiones de los vectores son todos los esquemas de subcategorización que se dan en el corpus los valores de cada vector para cada dimensión son el número de veces que ocurre el sentido con el esquema anotación manual ejemplos individuales cada ejemplo se representa como un vector las dimensiones de los vectores son todos los esquemas de subcategorización que se dan en el corpus los valores de cada vector para cada dimensión son binarios: o el ejemplo tiene el esquema de la dimensión o no lo tiene anotación automática

14 Clasificación Clustering Simple Kmeans Expectation-Maximization Clusters Subclusters

15 Evaluación de las clasificaciones Evaluación  Tienen sentido los vectores: diátesis (compactadas)  Distribución de la población en clases  Parejas de verbos similares  Distinguibilidad de sentidos  Overlap de patrones  Aplicación de diferentes clasificadores con diferentes configuraciones

16 Solucion C+F 3 clases Clase 1: 704 sentidos verbales. Clase mixta 83% alternante: omisión de complemento 16% único patrón: trans, intrans y prep Subclustering: 5 clases  una clase mayoritaria con esquemas de subcategorización muy dispares  diversas clases más pequeñas que agrupan verbos con comportamientos mucho más definidos. Clase 2: 153 sentidos verbales  esquemas transitivos.  Diátesis: trans  intrans trans  ditrans Clase 3: 39 sentidos verbales  esquemas preposicionales y alta frecuencia de atributivos/circunstanciales/predicativos  diátesis se caracterizan por la omision/elisión de algunos preposicionales  preposicional -  intransitiu

17 Solución C+F >10 subcluster clase 5 (477) Diatesis: transitivos e intransitivos y en algún caso con preposicionales. subclases las subclases 5.5, 5.3 y 5.2 esquemas transitivos e intransitivos, las subclases 5.4, 5.6, 5.7 y 5.8 la alternancia intransitivo/preposicional clase 2 (163) Diatesis: preps  intrans y ditrans  preps subclases 2.2 esquemas ditranstivos 2.1.esquemas con circunstanciales.

18 Solución C+F >10 sublcuster Clase 1 (103) y clase 3 (68) Diatesis; transtiva/ditransitiva/intransitiva Estas clases no presentan subclases. Clase 4 Diatesis: preposicionales  intransitivos presencia de atributos. subclases 4.1 Diatesis: preposicional/intransitiva con atributos 4.2 Totalmente preposicional 4.3 Diatesis: transitivos  preposicionales.

19 Aplicación del Classificador

20 Porcentaje de sentidos bien clasificados en el primer nivel de clustering para la aproximación con esquemas de función y categoría que ocurren más de 10 veces 5 clases

21 Porcentaje de sentidos bien clasificados en el segundo nivel de clustering para la aproximación con esquemas de función y categoría que ocurren más de 10 veces. 12 clases

22 Pendiente… Decidir el mejor clasificador  Reconsiderar la clasificación en función de los resultados del clasificador?  Compactar clases?  evaluación WSD automática sobre SenSem  Aplicación y evaluación de WSD  Aplicación del clasificador Aplicación del clasificador sobre corpus desambiguados automáticamente  adquisición Estudiar la posible generalización de los vectores (alternancias de diátesis)

23


Descargar ppt "Análisis sintáctico GRIAL – UB KNOW. Análisis sintàctico Situación actual del análisis sintáctico del español Desarrollo de una gramática Adquisición."

Presentaciones similares


Anuncios Google