FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL – Lingüística - UPF

Slides:



Advertisements
Presentaciones similares
La llegenda m’ajuda a llegir el mapa.... a interpretar el que diu
Advertisements

Cambios en el espacio: transformaciones geométricas
EL NOU CATÀLEG DE LA BIBLIOTECA de l’escola
LES CATEGORIES GRAMATICALS
SINTAXI: L’oració simple
LES CATEGORIES GRAMATICALS
UNA TARDA QUALSEVOL D’UN DIA QUALSEVOL
Equacions amb dues incògnites.
MÚLTIPLES I DIVISORS.
FUNCIONS ELEMENTALS.
PRONOMS RELATIUS i PRONOMS INTERROGATIUS
Tema 2. DIVISIBILITAT.
MÚLTIPLES I DIVISORS ESCOLA EL Cim- 6è de primària.
Cambios en el espacio: transformaciones geométricas
SINTAXI: L’oració simple
PROJECTES: UN LLARG CAMÍ…
3a PART Els nens i nenes de P- 4
El mercat ELS NENS I NENES DE P-4.
PETITS REPORTERS Títol.
TREBALLEM EL SISTEMA SOLAR
Creació d’un mapa personalitzat
Models de Qualitat 17 d’Octubre de 2017.
Senyor, ensenya’m a ser feliç i a donar pau!
Resolució de problemes algebraics
LES CATEGORIES GRAMATICALS
Taller SOBRE l’aigua: L'inventor gota.
Una forma fàcil d'obtenir algunes fórmules
Éssers vius i éssers inerts
Potències de nombres racionals
Forma substancial (essència)
EL BOSC DE COLLSEROLA A LA PRIMAVERA
Els sintagmes Un sintagma és una paraula o un grup de paraules relacionades entre si, que tenen sentit i compleixen una mateixa funció sintàctica. Segons.
Termes i expressions algebraiques
Situacions Simuladores Preferencials (SSP)
1. L’empirisme de Locke 1.3. L’anàlisi dels conceptes de la metafísica escolàstica Pàgina 258 Els dos sentits de la substància: com a substrat i com a.
NUTRICIÓ I PREVENCIÓ DEL CÀNCER DE MAMA
Matemàtiques 3er E.S.O..
Problema 1: Trobar la recta que passa pel punts A(2, -3) i B(-1, 3)
DIADA DE LA PAU A SJO.
EL COLOR BLAU.
Objectiu Educatiu Trienni
valors humans i socials
-FIGURA SEGONA SETMANA: JOSEP I MARIA DIMECRES 9 -FIGURA SEGONA SETMANA: JOSEP I MARIA SOMRIU, JA QUEDA POC PER CELEBRAR EL NAIXEMENT DE NEN JESÚS.
Projecte: el mercat 2a PART P -4.
Tema 5: Nombres naturals i enters
LES XARXES LOCALS i els seus components.
"SENYOR, ENSENYA’M A SER FELIÇ I A DONAR PAU!"
MORFOLOGIA i SINTAXI PRONOMS RELATIUS i PRONOMS INTERROGATIUS
BIODIVERSITAT A L’HORT
ERIC Manual d’ús.
Problemes que es poden resoldre amb equacions
ESCOLA ANTONI TÀPIES- 5èB
LLENGUATGE PENSAMENT I REALITAT
Les taules de multiplicar
Projecte de P-3: Som fotògrafs!!
Jessica, Gerard, Laura P, Alex
La literatura i les matemàtiques van de la mà.
Observa aquesta balança i mira quins canvis hi fem
“Senyor, ensenya’m a ser feliç i a donar pau”
ESTALVIANT VIDA? AMB SO.
Propostes de millora en el GIR
MESURA DEL RADI DE LA TERRA (seguint Eratóstenes)
NO TINGUIS POR, QUE JO SÓC AMB TU
CONCURS BÍBLIC NOM: CÉSAR COGNOMS: GARCÍA MEDINA GRUP B DATA NAIXAMENT: 02/07/2003 COL·LEGI: SANT JOSEP OBRER CARRER: COVADONGA S/N
MORFOLOGIA i SINTAXI PRONOMS RELATIUS i PRONOMS INTERROGATIUS
CELEBRACIÓ DEL DIA DE LA PAU.
Introducció a l’anàlisi d’agrupaments (cluster)
LES MÀQUINES.
Estils i Plantilles Ms Word.
Aprendre junts alumnes diferents: Una escola per a tothom
Transcripción de la presentación:

nuria.bel@upf.edu Classe 7 FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL 13305 – Lingüística - UPF nuria.bel@upf.edu Classe 7 N.Bel - FPLN

El programa 4. Les oracions · Sintaxi: L’estructura de l’oració   ·        Sintaxi: L’estructura de l’oració x    Categories, constituents i funcions. x    Gramàtiques, regles lliures de context i arbres. x    Analitzadors: algoritmes i tècniques de cerca. ·        Processament d’informació sintàctica. x    Concordança. Coordinació. Subcategorització. x    Trets i unificació. Formalismes d’Unificació. x    Gramàtiques lliures de context augmentades amb unificació.   Processament d’informació sintàctica N.Bel - FPLN

Informació sintàctica : indica les relacions entre les paraules concordança el prestatge de fusta trencat la nena serveix el dinar freda subcategorització A Madrid la nena va La nena depèn sense cap mena de dubte dels seus pares Es tracta de les restriccions que s’imposen a la lliure combinació de paraules. Posar com exemple la traducció automàtica. “The pretty girls”. “the girl entered the room” N.Bel - FPLN

Concordança Relació que hi ha entre n paraules per la qual co-varien les seves propietats morfològiques: gènere, nombre, cas, etc. Depèn de la llengua. Las categories i les regles gramaticals han de mirar-se com objectes que tenen propietats associades, i hem d’especificar-les i poder fer operacions amb elles, per exemple: ‘co-varien’ N.Bel - FPLN

Tractament de la concordança? O  SN SV SN  Art N Art  la Art  el N  nena SNfs  Artfs Nfs SNms  Artms Nms SNfp  Artfp Nfp SNmp  Artmp Nmp Artfs  la Artms  el Artfp  las Artmp  los Nfs  nena N.Bel - FPLN

Informació en forma de trets (features) Necessitem poder afegir informació a les regles d’estructura de frase: SN  Art N [gen=X] [gen=X] [gen=X] Les categories i les regles són objectes que tenen propietats associades. N.Bel - FPLN

propietats i operacions SNfs  Artfs Nfs SNms  Artms Nms SNfp  Artfp Nfp SNmp  Artmp Nmp Test d’igualtat llegit com una restricció: Solament es podrà aplicar la regla SN si el valor de cada variable és el mateix SN  Art N gen=X gen=X gen=X num=Y num=Y num=Y hem de poder definir operacions N.Bel - FPLN

Formalisme basat en estructures de trets Hem de fer que el llenguatge en el que escrivim les regles (el formalisme) incorpori aquesta manera de donar informació i fer operacions amb elles La manera més fàcil de representar-ho: estructures de trets (“feature structure”). L’operació bàsica per treballar amb estructures de trets és la unificació Una de les formes més senzilles de codificar el tipus de propietats tal com hem vist és en estructures de trets. N.Bel - FPLN

Estructures de trets Els trets són associacions entre parells atribut valor, i poden tenir diferents notacions [atribut valor], <atribut> = valor, atribut===valor Els atributs són un conjunt finit de símbols atòmics no analitzables (gen, num, cat). Els valors poden ser símbols atòmics o estructures complexes El conjunt de trets, que són propietats d’un objecte, es representa com una Matriu d’atributs/valors (AVM) N.Bel - FPLN

Estructures de trets Exemples de Matrius atribut – valor cat n num sing gen fem num sing = Nfs num sing gen fem cat n num sing conc gen fem Per definir la categoria nombre, usarem com atribut el símbol ‘num’ i com a possibles valors, segons hem vist que s’escau a la nostra gramàtica, usarem els símbols sing/plu. Són propietats de defineixen conjunts d’objectes: el conjunt dels objectes que són singulars, i podem anar afegint informació: el conjunt de les coses que són singular i femenines, i el conjunt de les coses que són n, singular i femenines. Ara ja tenim una cosa semblant a la que havíem usat en la nostra gramàtica. Però, fixeu-vos que podem relaxar o ampliar les nostres restriccions amb aquest formalisme. Els valors poden ser també complexos, estructures i això pot ser mol útil en casos com aquest ón sabem que la concordança té a veure amb el nombre i el gènere. estructures com a valors N.Bel - FPLN

Estructures de Trets Notació de graf dirigit (DAG) cat n num sing conc gen fem cat conc num gen n sing fem La possibilitat de tenir estructures complexes com a valor, ens porta directament a la noció de ‘path’, camí. Un camí de trets (feature path) és la llista de trets que s’han de recorrer en una estructura de trets per arribar a un valor particular N.Bel - FPLN

Estructures de Trets Camí (path) Un camí de trets (“feature path”) és la llista de trets que s’han de recórrer en una estructura per arribar a un valor particular gen cat conc num n sing fem Hi ha diferents notacions: <conc gen> = fem conc:gen===fem N.Bel - FPLN

Unificació l’operació bàsica Intuïtivament és com la unió de dos conjunts però opera sobre les llistes de trets, les Estructures de Trets I inclou la noció de ‘compatibilitat’ de la informació. [num sing] ⊔ [num sing] = [num sing] [num sing] ⊔ [num plu] = Ø N.Bel - FPLN

Unificació (2) [num sing] ⊔ [gen fem] = [num sing] ⊔ = gen fem N.Bel - FPLN

d’estructures complexes Unificació (3) d’estructures complexes num sing gen mas conc ⊔ = [gen fem] = gen fem num sing gen mas conc ⊔ [conc[gen fem]] = Ø N.Bel - FPLN

Unificació (4) és una única operació per combinar informació i expressar: Restriccions d’igualtat N:conc===Det:conc Comparació de models/patrons (pattern-matching) N:cat===n Traspassar informació en forma de trets SN:conc === N:conc N.Bel - FPLN

Unificació (5) Traspassem informació perquè podem expressar “Compartir estructura (‘Structure Sharing’)” No estem solament passant informació. Estem dient que per trobar el valor segueixi un camí. SN:conc === N:conc I que qualsevol canvi, en qualsevol dels sentits, representarà un canvi per a tots els nusos que apuntin N.Bel - FPLN

Unificació (6) Compartir estructura: SN:con===N:conc cat conc sn conc num gen n sing fem Regla de “la representante” N.Bel - FPLN

Unificació (7) Com les estructures de trets permeten: Representar informació parcial sobre objectes Expressar restriccions, condicions que els objectes han de complir respecte de la informació que hi tenen associada Quan unifiquem 2 estructures en creem una d’igual o que conté informació més específica. Diem que la menys específica subsumeix una d’igual o més específica. N.Bel - FPLN

Unificació (8) Subsumpció es pot llegir com tenir restriccions per a la comparació de models: [gen fem] [gen fem] ⊔ [cat n] = cat n gen fem N.Bel - FPLN

Unificació (9) La relació de subsunció ens permet fer un ordre parcial de les Estructures de Trets ⊑ Totes les estructures de trets estan subsumides per [], semilattice, i permet que la relació d’unificació sigui monotònica: independent de l’ordre d’aplicació num sing ⊑ gen fem gen fem pers 3 N.Bel - FPLN

Resum Gramàtiques d’unificació: Gramàtica basada en restriccions: les regles s’apliquen si es compleixen certes condicions Estructures de trets: associacions entre parells atribut=valor Unificació és l’operació que controla que les condicions es compleixen N.Bel - FPLN

Formalisme en PATR-like (1) regla(r3,SN ---> [D,N]):- SN:cat===sn, D:cat===d, N:cat===n, N:num===D:num. I tinguin el mateix valor per a l’atribut ‘num’ N.Bel - FPLN

Formalisme en PATR-like (2) la informació??? al lèxic: mot(M,noia):- M:cat===n, M:conc:gen===fem, M:conc:num===sing regla(r3,SN ---> [D,N]):- SN:cat===sn, SN:conc===N:conc, D:cat===d, N:cat===n, N:conc===D:conc. I tinguin el mateix valor per a ‘conc’ N.Bel - FPLN