Anotación morfosintáctica y sintáctica

Slides:



Advertisements
Presentaciones similares
Cuestión A: análisis sintáctico
Advertisements

Lingüística: ciencia que estudia la lengua
Alfonso Sancho Rodríguez 1 El sintagma verbal El sintagma verbal (SV) está constituido por un verbo o una expresión compleja que funciona como tal y unos.
ESQUEMA. MORFOSINTAXIS
Complemento regido, de régimen o suplemento.. Definición: Palabra o grupo de palabras semánticamente necesarias para que una oración con algunos verbos.
El sintagma verbal El sintagma verbal (SV) está constituido por un verbo o una expresión compleja que funciona como tal y unos complementos que, en su.
CLASES DE PALABRAS MORFOLOGÍA FLEXIVA Y MORFOLOGÍA LÉXICA
TEORÍA BÁSICA DE LA SINTAXIS LA ORACIÓN SIMPLE ORACIÓN SN (sujeto) + SV (predicado)[menos las impersonales]
SenSemCat:. Corpus de la lengua catalana. anotado con información
GRAMÁTICA LA COMUNICACIÓN ORGANIZACIÓN DE LA LENGUA LENGUA = SISTEMA
Modelo de la Gramática Generativa Transformacional (1965)
¿CÓMO SE ORGANIZA LA LENGUA?
LA MORFOLOGÍA.
CLASES DE PALABRAS O CATEGORÍAS GRAMATICALES
ESTRUCTURA DE LA LENGUA:
2.3. Didáctica de la Sintaxis
TEMA 2 GRAMÁTICA.
La oración gramatical.
CATEGORÍAS GRAMATICALES: EL SINTAGMA NOMINAL
Diferenciamos los sintagmas
Conjunto de reglas que rigen una lengua El + hombre + preocupado = El hombre preocupado /p/ /r/ /e/ = pre- /o/ /k/ /u/ /p/ = ocup- /a/ /d/ /o/ = -ado Sintáctico.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Análisis de fenómenos de fusión en los niveles de la arquitectura gramatical. Sevilla, mayo de 2007.
Análisis morfológico de oraciones Prof. Estrella Durán L.
ANÁLISIS SINTÁCTICO. Las oraciones Los enunciados son grupos de palabras ordenadas y que tienen sentido. Hay dos clases: ● Frases: son enunciados que.
Radford, A.; Atkinson, M.; Britain, D.; Clahsen, H. y A. Spencer (1999). Linguistics. An Introduction. UK-USA: Cambridge Univeristy Press. pp
Bogard, S. (2004). En Báez, G. y E. Luna Traill. Disquisiciones sobre Filología Hispánica. In memoriam Juan M. Lope Blanch. México: UNAM.
Claves para comentar un texto El comentario de texto.
Traducción dirigida por la Sintaxis Teoría de Autómatas y Lenguajes Formales Alma María Pisabarro, 2007.
Los sintagmas y sus clases. ¿Qué es un sintagma?
LAS CATEGORÍAS GRAMATICALES. DEFINICIÓN: ES LA CLASIFICACIÓN DE LAS PALABRAS DE ACUERDO A LA FUNCIÓN QUE CUMPLEN DENTRO DE UNA ORACIÓN. CLASIFICACIÓN:
El Sintagma Verbal.
Treebanks: introducción estado de la cuestión
TRABAJO DE LENGUA. LOS SUSTANTIVOS..
Gramática Niveles de la Lengua.
HERMENÉUTICA Hermenéutica Autor: Henry A. Virkler
SUSTANTIVO.
El lenguaje en los textos expositivos
PROFE… ¿PARA QUÉ SIRVE LA SINTAXIS?
LA ORACIÓN Y EL SINTAGMA
                                                                                                                                                                                 
Estrategias de la clase de español AP/IB Lengua
LA ESTRUCTURA DE LA PALABRA
Funciones sintácticas
LENGUAJE, LENGUA Y HABLA. EL SIGNO LINGÜÍSTICO.
Sintaxis: SINTAGMAS.
Gramática.
Concepto y características
LENGUAJE PERIODÍSTICO Y LA NOTICIA
SINTAXIS 4º ESO Chano Rodríguez enero 2017.
Proyecto Cortos: «Habla, te escucho»
LA ORACIÓN Y EL SINTAGMA
La gramática. Sus clases y partes. La Gramática es el estudio de las reglas y principios que regulan el uso de las lenguas y la organización de las palabras.
4º ESO D Rosana Moya Isach
EL SIGNO LINGÜÍSTICO.  ¿Qué es un signo? EL SIGNO LINGÜÍSTICO Es aquello que percibimos con nuestros sentidos y que nos transmite alguna información.
¿ como realiza el análisis del texto desde la gramática textual?
UNIDAD 1. LOS ENUNCIADOS Y SU ANÁLISIS
CARACTERÍSTICAS DE LOS INFORMES. Redacción y Presentación de Informes Técnicos Un informe técnico es una forma especializada de exposición, que tiene.
Criterios Evaluación Portafolio de evidencias 5 Mapa conceptual 10 Practicas 30 Examen teórico 20 Analizador Sem. 35.
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (III)
Sesión #2 SPAN 115 Prof. MC Arribas
Claves del Lenguaje Humano
DEFINICIÓN SUSTANTIVO CATEGORÍAS Morfológico: género y número
UNIDAD 1. LOS ENUNCIADOS Y SU ANÁLISIS
GRAMÁTICA LOS SINTAGMAS I. GRAMÁTICA En esta lección veremos… Sintagma nominalSintagma adjetivalSintagma adverbialSintagma preposicional.
Análisis lingüístico automático
COMPETENCIAS QUE EVALÚA LA PRUEBA SABER. LECTURA CRÍTICA CONTEXTOS FILOSÓFICOS LECTURA CRÍTICA Comprender contenidos explícitos del texto Articulación.
El conjunto de palabras que yo uso se llama VOCABULARIO EL LÉXICO es el conjunto de palabras que forman una lengua El léxico, ordenado alfabéticamente,
ESPAÑOL ARELI MÉNDEZ LUIS WONG. UNIDAD UNO “LA LENGUA” FUNCIÓN REFERENCIAL FUNCIÓN APELATIVA FUNCIÓN POÉTICA.
Claves del Lenguaje Humano
Transcripción de la presentación:

Anotación morfosintáctica y sintáctica Lingüística de corpus

sintaxis y morfosintaxis estudia las reglas que gobiernan la forma en que las palabras se organizan en sintagmas y, a su vez, estos sintagmas en oraciones estudia forma y función de los elementos lingüísticos dentro de la oración permite estudiar las categorías gramaticales en su contexto sintáctico

etiquetado morfosintáctico cada palabra gráfica y cada unidad léxica tiene una categoría gramatical/clase de palabras/parte de la oración (Part of Speech) asignación de una etiqueta de este tipo a cada palabra se conoce como etiquetado POS (POS Tagging)

etiquetado morfosintáctico Identificación de palabras o unidades léxicas definición de las clases de palabras pertinentes definición de las etiquetas que representan dichas clases procedimiento de etiquetado

PUEBLA PEROTE JALAPA VERACRUZ La palabra PUEBLA PEROTE JALAPA VERACRUZ

la palabra palabra gráfica palabras y unidades léxicas ¿lo que ocurre entre dos espacios? puntuación, números, siglas palabras y unidades léxicas diversas definiciones de “palabra” fronteras convencionales de las palabras (clíticos o afijos) “me la dio”, “dámela” pero *“me no la dio” ¿concordancia con argumentos del verbo? problemas tipológicos: lenguas analíticas vs sintéticas en lenguas poco estudiadas no siempre es claro si algo es un modificador/clítico o marca de flexión

la palabra Multipalabras (varias palabras gráficas  unidad léxica) sentido total diferente a la suma de los sentidos de las partes (“por favor”, “de acuerdo a”, “vuestra merced” , “San Luis Potosí”, “Comisión Nacional del Agua”, etc.) nombres propios (lugares, personas, instituciones) fechas términos (denotan conceptos de especialización)

la palabra Composición método de formación de unidades léxicas sacacorchos, sociocultural, etc. veces son multipalabras (hombre rana) muy productivo en muchas lenguas blackbird, black-bird, black bird Begriffsinhaltsbeschreibung

la palabra Acortamientos (mergers): una palabra gráfica  varias unidades léxicas enclíticos del español: cómetelo = come+te+lo contracciones (portmanteaus) gramaticales: del, al, desta; dunno, gonna, gotta,.. idiomáticas: pa’l, mi’jo; don’t siglas (UNAM) y acrónimos (Conacyt) Abreviaturas y notaciones R.S.V.P; H2O punto de las abreviaturas

definición de las clases consenso inexistente depende del objetivo específico del corpus el conjunto de clases puede ser pequeño (las más elementales) 10 ó 12; o muy grande (varios cientos) con detalles descriptivos de fenómenos específicos tres niveles posibles de clases obligatorias: verbo, sustantivo, etc. recomendadas: accidentes gramaticales, casos, etc. opcionales: concreto, abstracto, sarcasmo, etc.

definición de las etiquetas características deseables brevedad claridad de interpretación estructura analizable ejemplos Penn Treebank EAGLES Etiquetario morfosintáctico (corpus IULA)

Métodos de etiquetado Basados en reglas Estadísticos Híbridos gramáticas y autómatas Estadísticos n-gramas y probabilidad condicional Híbridos

ejemplos Analizador morfológico, etiquetador y parser del Grupo de PLN de la UPC Memory Based Tagging Demo

lematización lema lematización vs stemming forma canónica del diccionario; lexema; raíz o tema lematización vs stemming métodos: Porter, entropía, etc. palabras gráficas lemas somos, soy, eres, fueron ser voy, fui, irán ir poder, pudieron, podrán poder

ejemplos Muestra (corpus IULA) http://www.gedlc.ulpgc.es/investigacion/scogeme02/lematiza.htm

análisis sintáctico (parsing) análisis de las relaciones entre constituyentes de la oración se generan árboles sintácticos categorías: sujeto, nodo verbal, complemento directo, sintagma circunstancial, etc. poco preciso y ambiguo muy costoso [O [SN El_Art hombre_Sust SN] [SV vio_Vb [SP a_Prep [SN la_Art nena_Sust SN] SP] [SP en_Prep [SN el_Art parque_Sust SN] SP] [SP con_Prep [SN el_Art telescopio_Sust SN] SP] SV] O]

análisis sintáctico parcial análisis superficial (shallow) o chunking chunks: regiones del texto que no se intersectan En [un lugar] de [la Mancha] de [cuyo nombre] no quiero acordarme idea: determinar los constituyentes principales que sirven de argumentos verbales, sin especificar etiquetas