PLN sintaxis 1 Sintaxis Introducción Gramáticas formales Gramáticas para PLN.

Slides:



Advertisements
Presentaciones similares
La enseñanza de la Gramática
Advertisements

GRAMATICA LIBRE DE CONTEXTO
INSTITUTO TECNOLÓGICO DE MINATITLÁN
El latín es una lengua flexiva, esto quiere decir que hay un cierto número de palabras, en latín, que se declinan (cambian de forma según la función que.
Filminas Segunda semana
Compiladores e intérpretes
Gramáticas, lenguajes y reconocedores
Gramáticas Libres de Contexto
Gramáticas.
TERMINOLOGÍA EN ESPAÑOL
Tema: Decibilidad Integrantes: Ileana Rdguez Soto
¿Cómo hacer para que una máquina comprenda el LN?
Sintaxis INTRODUCCIÓN.
ANALIZADOR SINTACTICO
Tema 1.- Lenguajes. Gramáticas
Traducción dirigida por la Sintaxis
CAPITULO 2 La Representación del Conocimiento
2º curso Ingeniería Técnica en Informática de Sistemas UNED
El análisis sintáctico
La estructura de la oración Sintaxix Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto.
ANALISIS SINTACTICO El análisis gramatical es la tarea de determinar la sintaxis, o estructura, de un programa. Por esta razón también se le conoce como.
Tema 1.- Lenguajes. Gramáticas
Tema 2 Lenguajes Formales.
Introducción a la Teoría de Lenguajes Preparado por Manuel E. Bermúdez, Ph.D. Profesor Asociado University of Florida Curso de Compiladores.
Análisis Sintáctico (Parsing)
M.C. Meliza Contreras González
Análisis sintáctico LR: SLR (LR simple)
M.C. Juan Carlos Olivares Rojas
2º curso Ingeniería Técnica en Informática de Sistemas UNED
Problemas, algoritmos y programas: Modelar: Simular o programar su solución en un computador. Algoritmos: Es un conjunto finito, y no ambiguo de etapas.
SPAN 595 – Morfosintaxis Verano 2011 Dr. Waltermire.
PLN formalismos lógicos1 Formalismos lógicos Introducción Gramáticas lógicas Gramáticas de rasgos.
Gramáticas Otoño2012. Importancia de las gramáticas 2 Son una herramienta muy poderosa para describir y analizar lenguajes.
Teoría de lenguajes y compiladores
Introducción al Análisis Sintáctico
Tema 2 Autómatas finitos 1. Autómata finito determinista
Elementos Básicos de la Gramática
Teoría de lenguajes y compiladores Analizadores lexicográficos
Programación de Sistemas
COMPUTABILIDAD Y COMPLEJIDAD 1. Conceptos básicos (revisión). 2. Gramáticas independientes de contexto. 3. Propiedades de los lenguajes independientes.
Tema 1. Introducción y Conceptos Básicos
Gramáticas Formales Cadenas y Lenguajes.
Treebank y anotación semántica en euskara Grupo Ixa, UPV-EHU KNOW. Workshop de sintaxis Mayo, 2007.
Modelo de la Gramática Generativa Transformacional (1965)
Teoría de Autómatas y Lenguajes Formales Informática Técnica de Gestión ESCUELA SUPERIOR DE INFORMATICA Universidad de Castilla-La Mancha Tema 1. Introducción.
Gramáticas Otoño2012. Importancia de las gramáticas 2 Son una herramienta muy poderosa para describir y analizar lenguajes.
1 AFDAFN AF Gramáticas lineales derecha Expresiones regulares Tema 2 Método de los AF Método de las derivadas Sistemas de Ecuaciones Tema 1.
Prof. Fraibet Aveledo Universidad Simón Bolívar
UNIVERSIDAD LATINA (UNILA)
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) TRADUCTORES Y ANALIZADOR LEXICOGRÁFICO.
1 Sebastián Argüello A60490 semana 3 Autómatas y compiladores CI-1322.
Sobre el Lenguaje Rodrigo Jurado, MA*
Teoría de lenguajes y compiladores
Sintagmas y Oraciones: La GRAMATICA
I.- ESTUDIO DE LOS LENGUAJES DE PROGRAMACIÓN.
Análisis morfológico de oraciones
Unidad 3 Analizador Sintáctico
IV. GRAMÁTICAS DISTRIBUIDAS Y TABLAS DE SÍMBOLOS
LENGUA Y LITERATURA Curso
Programación de Sistemas
PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley.
Componentes de la oración, categorías gramaticales y signos de pausa Profesora M. Soto ESPA 3101.
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACION SUPERIOR UNIVERSIDAD VALLE DEL MOMBOY CARVAJAL EDO. TRUJILLO ENERO 2014.
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Superior Universidad Valle del Momboy Carvajal, Trujillo Alumnas Luzmila.
CATEGORÍAS GRAMATICALES: EL SINTAGMA NOMINAL
Modelos Formales No Transformacionales MFNT Clase 16. Gramáticas Estructuradas por Rasgos (Feature Structured Grammars) – Head-driven Phrase Structured.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Sintaxis y Semántica. S.Takahashi Fases en el proceso de análisis de lenguajes Lexer Parser caracteres tokensrespuesta.
Modelos Formales No Transformacionales MFNT Parsers tradicionales con Gramáticas Independientes de Contexto (Context Free Grammar CFG) : Top-down, bottom-up,
Centro Universitario Valle de México Gramáticas Libres de Contexto Dra. Maricela Quintana López Elaborado por: Autómatas y Lenguajes Formales.
Transcripción de la presentación:

PLN sintaxis 1 Sintaxis Introducción Gramáticas formales Gramáticas para PLN

PLN sintaxis 2 La descripción sintáctica 1 La Sintaxis describe la regularidad y productividad de la lengua explicitando la estructura de las oraciones. Objetivo del análisis sintáctico: Detectar la corrección de una frase Proporcionar una estructura de la frase que refleje sus relaciones sintácticas y pueda ser utilizada como base para los tratamientos posteriores

PLN sintaxis 3 Formas de definir la corrección Gramática G  L(G) w 1 n  L(G) ? Modelo del lenguaje P(w 1 n ) si P(w 1 n ) > 0  w 1 n  L Corpus (oraciones, patrones) que definen las oraciones correctas diccionario sintáctico reglas de composición Reglas de buena formación filtros, gramáticas negativas,...

PLN sintaxis 4 La descripción sintáctica 3 Formas de expresar la estructura sintáctica: Estructura de constituyentes Estructura de dependencias Modelo de actantes Forma lógica

PLN sintaxis 5 ORACION GNFV DETNRGNVTGN NRGN el gato come pescado La descripción sintáctica 4 Arbol de derivación (árbol de análisis)

PLN sintaxis 6 La descripción sintáctica 5 Estructura de dependencias

PLN sintaxis 7 La descripción sintáctica 6 Modelo de actantes (1)

PLN sintaxis 8 La descripción sintáctica 7 Modelo de actantes (2)

PLN sintaxis 9  X y(gato (X (  Y y(pescado (Y) comer(X,Y))))) La descripción sintáctica 8 Forma logica

PLN sintaxis 10 Gramática 1 Gramáticas de constituyentes Arboles de derivación Gramáticas de dependencias Esquemas de dependencia Gramáticas de casos Modelos de actantes => Redes semánticas Gramáticas Transformacionales Gramáticas sistémicas

PLN sintaxis 11 Lenguajes formales Alfabeto (vocabulario)  Operación de concatenación   * cadenas sobre  (monoide libre) lenguaje L   * lenguajes y gramáticas jerarquía de Chomsky

PLN sintaxis 12 Gramáticas de Estructura Sintagmática Vocabulario No Terminal (conjunto de variables) Vocabulario Terminal (alfabeto) Conjunto de producciones Variable inicial   V = Ø   V = Vocabulario S  V

PLN sintaxis 13 Jerarquía de Chomsky 1 Gramáticas Generales (Tipo 0) Reconocidas por máquinas de Turing Gramáticas Sensitivas (Tipo 1) Linear Bounded Automata Pspace-complete Gramáticas Incontextuales (Tipo 2) Autómatas a pila O(n 3 ) Gramáticas Regulares (Tipo 3) Autómatas de estados finitos O(n)

PLN sintaxis 14 Jerarquía de Chomsky 2 Tipo 0 Gramáticas sin restricciones Tipo 1 Gramáticas sensitivas (Context-sensitive Grammars) u  w, w,u  (V   ) * u  w, w,u  (V   )* i |u|  |v|

PLN sintaxis 15 Tipo 3 Gramáticas regulars (Regular Grammars, RG) Tipo 2 Gramáticas incontextuals (Context-free Grammars, CFG) A  w, A  V, w  (V   )* A  a A  aB, A,B  V, a   Jerarquía de Chomsky 3

PLN sintaxis 16 Condición de gramaticalidad Una frase w (una palabra de  *) pertenece al lenguaje generado por la gramática: Podemos decir que la gramática G puede derivar la palabra w utilitzando las producciones a partir de S.

PLN sintaxis 17 Propiedades formales del analizador Solidez (sound) Todo resultado (p.ej. árbol de derivación) es correcto (gramatical) Terminación Todo proceso de análisis acaba Completitud Un analizador es completo si dada una gramática y una oración es sólido, produce todos los análisis correctos y acaba

PLN sintaxis 18 GramáticaReconocedorLenguaje Tipo 0Máquinas de lenguajes enumerables Turing recursivamente Tipo 1linear-bounded lenguajes contextuales automata (LBA) Tipo 2autómatas a pila lenguajes incontextuales no deterministas (NPDA) Tipo 3autómatas finitos lenguajes regulares (FSA) Jerarquía de Chomsky 4

PLN sintaxis 19 Expresividad de la gramática Mínimo: Gramáticas incontextuales (CFG) excepto aplicaciones concretas, aproximaciones regulares ¿Es el LN incontextual? ¿Suficiente? NO (normalmente) Solución CFG + {adición procedimental del contexto} Gramáticas Lógicas

PLN sintaxis 20 Ejemplo gramática incontextual 1 G1= N1 = {ORACION,GN,FV,RGN,GP} T1 = {det,n,np,adj,vi,vt,prep} P1 ={ 1 FRASE --> GN FV. 2 GN --> det n RGN. 3 GN --> n RGN. 4 GN --> np RGN. 5 RGN --> . 6 RGN --> GP RGN. 7 RGN --> adj RGN. 8 FV --> vi. 9 FV --> vt GN. 10 GP --> prep GN. }

PLN sintaxis 21 Ejemplo gramática incontextual 2 grup-nom==> n, grup-adj. grup-adj ==> a, grup-adj. grup-adj ==> a. grup-adj ==> adv, a. n ==> ncms000.%chico n ==> ncmp000.%chicos n ==> ncfs000.%chica n ==> ncfp000.%chicas n ==> nccs000.%mar, oyente n ==> nccp000.%mares, oyentes n ==> ncmn000.%pantalones n ==> ncfn000.%tijeras n ==> ncms00a.%chiquito a ==> aq0cp00.%alegres a ==> aq0cs00.%alegre a==> aq0fp00.%bonitas a ==> aq0fs00.%bonita a ==> aq0mp00.%bonitos a ==> aq0ms00.%bonito

PLN sintaxis 22 Ejemplo gramática incontextual 3 grup-nom==> ncms, grup-adj-ms. grup-nom==> ncfs, grup-adj-fs. grup-nom==> ncmp, grup-adj-mp. grup-nom==> ncfp, grup-adj-fp. grup-adj-ms ==> aq0ms00, grup-adj-ms. grup-adj-mp ==> aq0mp00, grup-adj-mp. grup-adj-ms ==> aq0ms00, grup-adj-cs. ncms ==> ncms000.%chico ncmp ==> ncmp000.%chicos ncfs ==> ncfs000.%chica ncfp ==> ncfp000.%chicas

PLN sintaxis 23 Ejemplo gramática incontextual ampliada 4 grup-nom==>n(Rasgos1), grup-adj(Rasgos2), {concordancia Rasgos1 Rasgos2} n(ms) ==> ncms000.%chico n(mp)==> ncmp000.%chicos n(fs)==> ncfs000.%chica n(fp)==> ncfp000.%chicas a(cp)==> aq0cp00.%alegres a(cs) ==> aq0cs00.%alegre a(fp)==> aq0fp00.%bonitas a(fs) ==> aq0fs00.%bonita

PLN sintaxis 24 CFG + {adición procedimental del contexto}

PLN sintaxis 25 Ejemplo LSP (Sager) *BNF %= '.'. %=. %= /. %=. *RESTR WCONC1= IN LNR % BOTH $SING AND $PLUR. $SING= IF CORE OF LNR HAS ATTRIBUTE SG THEN CORE OF LN DOES NOT HAVE ATTRIBUTE PL. $PLUR= IF CORE OF LNR HAS ATTRIBUTE PL THEN CORE OF LN DOES NOT HAVE ATTRIBUTE SG.

PLN sintaxis 26 Gramáticas incontextuales con rasgos 1 Head Features Rasgos que los constituyentes no terminales adquieren a partir de sus núcleos (heads) Algunos se filtran directamente Otros requieren cierto proceso AGR (agreement) gen, num, persona, caso,... VFORM (subcategorización verbal) problemática con los auxiliares, modales, locuciones verbales,...

PLN sintaxis 27 Gramáticas incontextuales con rasgos 2 np  {np agr AGR}, det, {det agr AGR}, n, {n agr AGR}. vp  v, {v subcat _np}, np. vp  v, {v subcat _np _pp:loc}, np, pp, {pp pform loc}. vp  {vp agr A, vp vform V},v, {v subcat _vp:inf, v agr A, v vform V}, vp, {vp vform inf}.

PLN sintaxis 28 Obtención de la gramática Definición del vocabulario terminal (tagset,  ) Definición del vocabulario no terminal (V) Reglas de la gramática (P) construcción manual construcción automática inferencia (inducción) gramatical construcción semiautomática

PLN sintaxis 29 La selección de las categorías Vocabulario terminal Categorías atómicas vs complejas El tagset La utilización de rasgos Vocabulario no terminal Motivación lingüística Teoría Categorías barradas (slashed categories) dependencias a larga distancia

PLN sintaxis 30 Categorías Parole 1 categorias posibles: adj= adjetivo, adv= adverbio, art= artículo, con= conjunción det= determinante, nom=nombre, np= nombre propio, prep = preposición, pron= pronombre, verb=verbo, intj=interjección, res=residuales, spun = signo puntuación, abr = abreviatura cifra = z, fecha = w

PLN sintaxis 31 Categorías Parole 2 géneros posibles: ambi=ambiguo, fem= femenino, masc= masculino, n=neutro, i=indiscriminado

PLN sintaxis 32 Categorías Parole 3 Verbo 1 categoría 2 tipo 3 modo 4 tiempo 5 persona 6 número 7 género

PLN sintaxis 33 Penn treebank Tagset 1 CCCoordinating conjunction CD Cardinal number DT Determiner EX Existential there FW Foreign word IN Preposition JJ Adjective JJR Adjective, comparative JJS Adjective, superlative LS List item marker MD Modal NN Noun, singular NNP Proper noun, singular NNS Noun, plural NNPSProper noun, plural PDTPredeterminer POS Posessive ending PRP Personal pronoun PPPossessive pronoun RB Adverb RBR Adverb, comparative RBS Adverb, superlative RP Particle SYM Symbol TO to UH Interjection VB Verb, base form VBD Verb, past tense VBG Verb, gerund VBN Verb, past participle VBP Verb, non-3rd ps. sing. present VBZ Verb, 3rd ps. sing. present WDT wh-determiner WP wh-pronoun WPPossessive wh-pronoun WRB wh-adverb

PLN sintaxis 34 Penn treebank Tagset 2 # Pound sign $ Dollar sign. Sentence-final punctuation, Comma : Colon, semi-colon ( Left bracket character ) Right bracket character " Straight double quote ` Left open single quote `` Left open double quote ' Right close single quote '' Right close double quote

PLN sintaxis 35 Modificaciones de las gramáticas Transformaciones de las gramáticas para obtener gramáticas equivalentes: Eliminación de símbolos y producciones no alcanzables Eliminación de producciones unarias Eliminación de producciones  Formas normales Chomsky Greibach Aproximaciones de CFG por RG

PLN sintaxis 36 Forma Normal de Chomsky Una gramática incontextual está en CNF si sólo tiene producciones: unarias de tipo A  a binarias de tipo A  BC con a   y A,B,C  V El paso de cualquier CFG a CNF es trivial

PLN sintaxis 37 Forma Normal de Greibach Una gramática incontextual está en GNF si sólo tiene producciones: A  a  con a   y   V* El paso de cualquier CFG a GNF es trivial