La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL – Lingüística - UPF

Presentaciones similares


Presentación del tema: "FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL – Lingüística - UPF "— Transcripción de la presentación:

1 nuria.bel@upf.edu Classe 7
FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL – Lingüística - UPF Classe 7 N.Bel - FPLN

2 El programa 4. Les oracions · Sintaxi: L’estructura de l’oració
·        Sintaxi: L’estructura de l’oració x    Categories, constituents i funcions. x    Gramàtiques, regles lliures de context i arbres. x    Analitzadors: algoritmes i tècniques de cerca. ·        Processament d’informació sintàctica. x    Concordança. Coordinació. Subcategorització. x    Trets i unificació. Formalismes d’Unificació. x    Gramàtiques lliures de context augmentades amb unificació.   Processament d’informació sintàctica N.Bel - FPLN

3 Informació sintàctica : indica les relacions entre les paraules
concordança el prestatge de fusta trencat la nena serveix el dinar freda subcategorització A Madrid la nena va La nena depèn sense cap mena de dubte dels seus pares Es tracta de les restriccions que s’imposen a la lliure combinació de paraules. Posar com exemple la traducció automàtica. “The pretty girls”. “the girl entered the room” N.Bel - FPLN

4 Concordança Relació que hi ha entre n paraules per la qual co-varien les seves propietats morfològiques: gènere, nombre, cas, etc. Depèn de la llengua. Las categories i les regles gramaticals han de mirar-se com objectes que tenen propietats associades, i hem d’especificar-les i poder fer operacions amb elles, per exemple: ‘co-varien’ N.Bel - FPLN

5 Tractament de la concordança?
O  SN SV SN  Art N Art  la Art  el N  nena SNfs  Artfs Nfs SNms  Artms Nms SNfp  Artfp Nfp SNmp  Artmp Nmp Artfs  la Artms  el Artfp  las Artmp  los Nfs  nena N.Bel - FPLN

6 Informació en forma de trets (features)
Necessitem poder afegir informació a les regles d’estructura de frase: SN  Art N [gen=X] [gen=X] [gen=X] Les categories i les regles són objectes que tenen propietats associades. N.Bel - FPLN

7 propietats i operacions
SNfs  Artfs Nfs SNms  Artms Nms SNfp  Artfp Nfp SNmp  Artmp Nmp Test d’igualtat llegit com una restricció: Solament es podrà aplicar la regla SN si el valor de cada variable és el mateix SN  Art N gen=X gen=X gen=X num=Y num=Y num=Y hem de poder definir operacions N.Bel - FPLN

8 Formalisme basat en estructures de trets
Hem de fer que el llenguatge en el que escrivim les regles (el formalisme) incorpori aquesta manera de donar informació i fer operacions amb elles La manera més fàcil de representar-ho: estructures de trets (“feature structure”). L’operació bàsica per treballar amb estructures de trets és la unificació Una de les formes més senzilles de codificar el tipus de propietats tal com hem vist és en estructures de trets. N.Bel - FPLN

9 Estructures de trets Els trets són associacions entre parells atribut valor, i poden tenir diferents notacions [atribut valor], <atribut> = valor, atribut===valor Els atributs són un conjunt finit de símbols atòmics no analitzables (gen, num, cat). Els valors poden ser símbols atòmics o estructures complexes El conjunt de trets, que són propietats d’un objecte, es representa com una Matriu d’atributs/valors (AVM) N.Bel - FPLN

10 Estructures de trets Exemples de Matrius atribut – valor
cat n num sing gen fem num sing = Nfs num sing gen fem cat n num sing conc gen fem Per definir la categoria nombre, usarem com atribut el símbol ‘num’ i com a possibles valors, segons hem vist que s’escau a la nostra gramàtica, usarem els símbols sing/plu. Són propietats de defineixen conjunts d’objectes: el conjunt dels objectes que són singulars, i podem anar afegint informació: el conjunt de les coses que són singular i femenines, i el conjunt de les coses que són n, singular i femenines. Ara ja tenim una cosa semblant a la que havíem usat en la nostra gramàtica. Però, fixeu-vos que podem relaxar o ampliar les nostres restriccions amb aquest formalisme. Els valors poden ser també complexos, estructures i això pot ser mol útil en casos com aquest ón sabem que la concordança té a veure amb el nombre i el gènere. estructures com a valors N.Bel - FPLN

11 Estructures de Trets Notació de graf dirigit (DAG)
cat n num sing conc gen fem cat conc num gen n sing fem La possibilitat de tenir estructures complexes com a valor, ens porta directament a la noció de ‘path’, camí. Un camí de trets (feature path) és la llista de trets que s’han de recorrer en una estructura de trets per arribar a un valor particular N.Bel - FPLN

12 Estructures de Trets Camí (path)
Un camí de trets (“feature path”) és la llista de trets que s’han de recórrer en una estructura per arribar a un valor particular gen cat conc num n sing fem Hi ha diferents notacions: <conc gen> = fem conc:gen===fem N.Bel - FPLN

13 Unificació l’operació bàsica
Intuïtivament és com la unió de dos conjunts però opera sobre les llistes de trets, les Estructures de Trets I inclou la noció de ‘compatibilitat’ de la informació. [num sing] ⊔ [num sing] = [num sing] [num sing] ⊔ [num plu] = Ø N.Bel - FPLN

14 Unificació (2) [num sing] ⊔ [gen fem] = [num sing] ⊔ = gen fem
N.Bel - FPLN

15 d’estructures complexes
Unificació (3) d’estructures complexes num sing gen mas conc ⊔ = [gen fem] = gen fem num sing gen mas conc ⊔ [conc[gen fem]] = Ø N.Bel - FPLN

16 Unificació (4) és una única operació per combinar informació i expressar: Restriccions d’igualtat N:conc===Det:conc Comparació de models/patrons (pattern-matching) N:cat===n Traspassar informació en forma de trets SN:conc === N:conc N.Bel - FPLN

17 Unificació (5) Traspassem informació perquè podem expressar “Compartir estructura (‘Structure Sharing’)” No estem solament passant informació. Estem dient que per trobar el valor segueixi un camí. SN:conc === N:conc I que qualsevol canvi, en qualsevol dels sentits, representarà un canvi per a tots els nusos que apuntin N.Bel - FPLN

18 Unificació (6) Compartir estructura: SN:con===N:conc cat conc sn conc
num gen n sing fem Regla de “la representante” N.Bel - FPLN

19 Unificació (7) Com les estructures de trets permeten:
Representar informació parcial sobre objectes Expressar restriccions, condicions que els objectes han de complir respecte de la informació que hi tenen associada Quan unifiquem 2 estructures en creem una d’igual o que conté informació més específica. Diem que la menys específica subsumeix una d’igual o més específica. N.Bel - FPLN

20 Unificació (8) Subsumpció es pot llegir com tenir restriccions per a la comparació de models: [gen fem] [gen fem] ⊔ [cat n] = cat n gen fem N.Bel - FPLN

21 Unificació (9) La relació de subsunció ens permet fer un ordre parcial de les Estructures de Trets ⊑ Totes les estructures de trets estan subsumides per [], semilattice, i permet que la relació d’unificació sigui monotònica: independent de l’ordre d’aplicació num sing gen fem gen fem pers 3 N.Bel - FPLN

22 Resum Gramàtiques d’unificació:
Gramàtica basada en restriccions: les regles s’apliquen si es compleixen certes condicions Estructures de trets: associacions entre parells atribut=valor Unificació és l’operació que controla que les condicions es compleixen N.Bel - FPLN

23 Formalisme en PATR-like (1)
regla(r3,SN ---> [D,N]):- SN:cat===sn, D:cat===d, N:cat===n, N:num===D:num. I tinguin el mateix valor per a l’atribut ‘num’ N.Bel - FPLN

24 Formalisme en PATR-like (2)
la informació??? al lèxic: mot(M,noia):- M:cat===n, M:conc:gen===fem, M:conc:num===sing regla(r3,SN ---> [D,N]):- SN:cat===sn, SN:conc===N:conc, D:cat===d, N:cat===n, N:conc===D:conc. I tinguin el mateix valor per a ‘conc’ N.Bel - FPLN


Descargar ppt "FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL – Lingüística - UPF "

Presentaciones similares


Anuncios Google