La estructura de la oración Sintaxix Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto.

Slides:



Advertisements
Presentaciones similares
La enseñanza de la Gramática
Advertisements

ÁRBOLES DE SINTAXIS ÁRBOL grafo dirigido acíclico.
GRAMATICA LIBRE DE CONTEXTO
Algoritmos y Programas
INSTITUTO TECNOLÓGICO DE MINATITLÁN
Filminas Segunda semana
Compiladores e intérpretes Análisis Sintáctico III
Lingüística: ciencia que estudia la lengua
Gramáticas Libres de Contexto
¿Palabra o afijo?.
¿Cómo hacer para que una máquina comprenda el LN?
Los sintagmas y sus clases
ANALIZADOR SINTACTICO
Analizadores Sintácticos Descendentes Predictivos
1 Parsing Un parser podría ser definido como un programa que analiza una porción de texto para determinar su estructura lógica: la fase de parsing en un.
Traducción dirigida por la Sintaxis
ANALISIS SINTACTICO DESCENDENTE
Teoría de lenguajes y compiladores
CAPITULO 2 La Representación del Conocimiento
El análisis sintáctico
ANALISIS SINTACTICO El análisis gramatical es la tarea de determinar la sintaxis, o estructura, de un programa. Por esta razón también se le conoce como.
Teoría de lenguajes y compiladores
Analizador Sintáctico Descendente
Tratamiento Automático de Textos
Tema 2 Lenguajes Formales.
Algoritmos para calcular el Conjunto Primero y el Conjunto Siguiente
Representación del Conocimiento
Curso de cálculo Niveles medio superior Nivel superior Concepto de límite manera formal (usando definiciones formales) Manera intuitiva ESTUDIO SOCIOEPISTEMOLÓGICO.
Filosofía del lenguaje
Representando para Aprender
Procesamiento Práctico del lenguaje Natural Capítulo XXIII.
Gramáticas Otoño2012. Importancia de las gramáticas 2 Son una herramienta muy poderosa para describir y analizar lenguajes.
Todo traductor esta basado en una gramática para el lenguaje fuente. Todo traductor esta basado en una gramática para el lenguaje fuente. Una gramática.
Introducción al Análisis Sintáctico
Teoría de lenguajes y compiladores Analizadores lexicográficos
Programación de Sistemas
Describiendo las reglas del Lenguaje
Tema 1. Introducción y Conceptos Básicos
Teoría de Autómatas y Lenguajes Formales Informática Técnica de Gestión ESCUELA SUPERIOR DE INFORMATICA Universidad de Castilla-La Mancha Tema 1. Introducción.
Autómatas de Pila (Pushdown Automatón)
Gramáticas Otoño2012. Importancia de las gramáticas 2 Son una herramienta muy poderosa para describir y analizar lenguajes.
Programación de Sistemas FEI – 2008
Unidad 1. Introducción a los Compiladores.
Prof. Fraibet Aveledo Universidad Simón Bolívar
LA MORFOLOGÍA.
UNIVERSIDAD LATINA (UNILA)
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) TRADUCTORES Y ANALIZADOR LEXICOGRÁFICO.
1 Sebastián Argüello A60490 semana 3 Autómatas y compiladores CI-1322.
Teoría de lenguajes y compiladores
SINTAXIS. Las funciones
Sintagmas y Oraciones: La GRAMATICA
I.- ESTUDIO DE LOS LENGUAJES DE PROGRAMACIÓN.
COMPETENCIAS PARA LA COMUNICACIÓN CIENTÍFICA
ESTRUCTURA DE LA LENGUA:
Monografías, ensayos, proyectos y tesis
IV. GRAMÁTICAS DISTRIBUIDAS Y TABLAS DE SÍMBOLOS
La oración Simple y compuesta
LENGUA Y LITERATURA Curso
Análisis morfológico de oraciones
Programación de Sistemas
PLN parsing charts1 Métodos basados en Charts Extensiones a partir de Charts Métodos Tabulares CKY Earley.
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACION SUPERIOR UNIVERSIDAD VALLE DEL MOMBOY CARVAJAL EDO. TRUJILLO ENERO 2014.
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Superior Universidad Valle del Momboy Carvajal, Trujillo Alumnas Luzmila.
EL ESQUEMA.
Sandra Parada Mesa y Jesica Alejandra Alarcón
Modelos Formales No Transformacionales MFNT Clase 16. Gramáticas Estructuradas por Rasgos (Feature Structured Grammars) – Head-driven Phrase Structured.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Sintaxis y Semántica. S.Takahashi Fases en el proceso de análisis de lenguajes Lexer Parser caracteres tokensrespuesta.
Modelos Formales No Transformacionales MFNT Parsers tradicionales con Gramáticas Independientes de Contexto (Context Free Grammar CFG) : Top-down, bottom-up,
Análisis de fenómenos de fusión en los niveles de la arquitectura gramatical. Sevilla, mayo de 2007.
Transcripción de la presentación:

La estructura de la oración Sintaxix Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto Nacional de Astrofísica, Óptica y Electrónica

¿Qué es la sintaxis? Cómo se agrupan las palabras Una gramática enlista los principios bajo los cuales se agrupan las palabras, es el conjunto de reglas que describe que es válido en un lenguaje Gramáticas clásicas: Pensadas para gente que conoce el lenguaje Definiciones y reglas soportadas sólo por ejemplos Gramáticas explícitas: Descripción formal Programables y validadas sobre datos

¿Para qué la sintaxis? Cómo se relacionan las palabras en una oración Formalizar las relaciones entre las palabras de una oración es el primer paso para entender su contenido

Sintaxis Entrada: Secuencia de pares (lema, tags) Salida: Estructura de la frase (árbol sintáctico) con nodos anotados (lema, tags, función) Estudia: La relación de lemas y categorías morfológicas con estructuras de frase Puede usar categorías sintácticas como sujeto, verbo, objeto, etc. Por ejemplo: (yo/PT1PS) ví/VP1PS un/DI perro/NCS ( (yo)FN ( (ví)V ((un)DET (perro)N)FN )FV )S

En busca de un formalismo Actualmente existen dos enfoques: Restringir las teorías derivadas de las gramáticas dependientes del contexto Extender las teorías derivadas de las gramáticas independientes del contexto En cualquiera de los dos casos: el trabajo en la búsqueda de una teoría gramatical pertinente proveerá elementos para una comprensión indirecta sobre la naturaleza y organización del aparato cognitivo humano

Sin embargo… Sólo estamos interesados de manera secundaria en la búsqueda de explicaciones sobre cómo el ser humano “entiende” el lenguaje Nuestro principal objetivo es que las computadoras realicen tareas útiles e interesantes involucrando el lenguaje humano.

Formalizando el lenguaje Tres ideas principales Constituyentes Un grupo de palabras que actúan como una unidad El gato escandaloso es mío Ayer murió el gato escandaloso Relaciones gramaticales Formalización de la ideas de la gramática tradicional Sujeto; Objetos El gato escandaloso durmió en el tejado Subcategorización y relaciones de dependencia El verbo querer es seguido de verbos en indicativo El verbo encontrar todo lo contrario Pertenecen a distintas subcategorías

Constituyentes Muchos tipos de constituyentes Frase nominal / grupo nominal Cómo lo reconocemos, qué palabras lo forman: Antecede al verbo Describe un referente El constituyente puede colocarse como un todo en diferentes lugares en la oración, no sus palabras El gato come en el patio En le patio come el gato Come el gato en el patio *Come gato en el patio el

Modelando la estructura Usando las gramáticas libres de contexto (Phrase- Structure Grammars) Tenemos un conjunto de reglas o producciones Describen las maneras de cómo los símbolos del lenguaje pueden agruparse Y un lexicón de palabras y símbolos Son los elementos básicos, las piezas a partir de las cuales se construyen las expresiones del lenguaje

Reglas para FN Una frase nominal puede formarse a partir de un artículo y un nominal o de un nombre propio y un nominal puede formarse de un nombre con o sin adjetivo

Reglas para FN FN → Artículo Nominal FN → NombrePropio Nominal → Nombre | Nombre Adjetivo Las reglas pueden establecerse jerárquicamente de manera que podemos incluir por ejemplo las reglas que nos relacionan con el lexicón: Artículo → un Artículo → el Símbolos terminales y no-terminales Una regla determina un orden de uno o más terminales o no- terminales

Ejemplo Gramática para expresiones matemáticas

CFG Entonces una frase puede ser derivada a partir del no-terminal FN Una CFG puede ser usada para generar frases cualesquiera Una secuencia de reescritura es llamada una derivación Una derivación puede ser representada gráficamente a través de un árbol sintáctico (parse tree) Una CFG cuenta con un símbolo inicial

Ejemplos de componentes principales FN - NP (noun phrase) S (sentence) VP (verb phrase) PP (prepositional phrase)

Ejemplo PPVerb VPNP S Mi hermano comió una manzana Verb  comió VP  Verb NP S  NP VP

3 vistas de una regla generación (producción): S  NP VP parsing (análisis): S  NP VP verificación: S = NP VP Hasta aquí el mecanismo es muy sencillo es necesario enriquecer las reglas con características para capturar las relaciones entre los constituyentes: S[features…] = NP[features…] VP[features…]

Extendiendo las CFGs A través de características incluímos las ideas de relaciones gramaticales y subcategorización Morfología de la palabra: Verbo [head=comer, tense=pasado, num=sing, person=3,…]  comió Proyección de características a constituyentes superiores VP [head= , tense= , num=  …]  V [head= , tense= , num=  …] NP Concordancia entre constituyentes hermanos: S [head= , tense=  ]  NP [num= ,…] VP [head= , tense= , num=  …]

Generando una frase NPVerb VPNP S Mi hermano comío una manzana Verb [head=comer, tense=presente, num=sing, person=3,…]  comió VP [head= , tense= , num=  …]  V [head= , tense= , num=  …] NP S [head= , tense=  ]  NP [num= ,…] VP [head= , tense= , num=  …] num=sing comió

Mi hermano comío una manzana Analizando una frase NPVerb VPNP S Verb [head=comer, tense=presente, num=sing, person=3,…]  comió VP [head= , tense= , num=  …]  V [head= , tense= , num=  …] NP S [head= , tense=  ]  NP [num= ,…] VP [head= , tense= , num=  …] num=sing comió

 Infinidad de características (tense, number, person, gaps, vowels, commas, wh, etc., etc....) él ido ha