Know T2. Procesadores lingüísticos UPV/EHU

Slides:



Advertisements
Presentaciones similares
La enseñanza de la Gramática
Advertisements

ÁRBOLES DE SINTAXIS ÁRBOL grafo dirigido acíclico.
Tesistas: Percy Balbín James Ponce
LATÍN 4.º DE ESO.
Compiladores e intérpretes Generación de código intermedio II
MORFOSINTAXIS DEL ESPAÑOL.
Programa de Estudio Tercer Año Medio.
La lengua como sistema Desde el punto de vista de la lengua como sistema, los niveles de indagación y formalización lingüísticas se distinguen 4 pilares.
Labor del IAEG en la inclusión de indicadores complementarios en el Manual sobre indicadores ODM División de Estadística de las Naciones Unidas San José,
© Rocío Lineros Quintero
María Cristina Ortiz León María de Lourdes Mota Morales
Hacia la construcción de la escritura
¿Cómo hacer para que una máquina comprenda el LN?
Análisis morfosintáctico
PMG de Género 2008 DPTO. DE COORDINACIÓN INTERSECTORIAL Bernardita Valenzuela P. / junio 2008.
Predicado Integrantes - José Carlos Gutiérrez - Diego Reyes
Competencia en comunicación lingüística. IES LEVANTE (Algeciras)
Repaso de morfología Tema 4 – Morfosintaxis: morfología
Lengua y Literatura española
Teoría de lenguajes y compiladores
Experiencias gremiales De seguir así Propuesta Resultados educativos de ASBANC – IFB y otros gremios resultan parciales y dispersos.
Ramas de la Lingüística
Reunión de seguimiento en la Fundación CNSE
Reunión de seguimiento en ETSIT 13/01/2009
Traducción dirigida por la Sintaxis
Repaso de sintaxis Tema 4 – Morfosintaxis: sintaxis
Integración de tecnologías de la información y la comunicación a los procesos de formación en la Universidad de Antioquia Noviembre 2008 Por: Donna Zapata.
Teresa Sanz y Clara Sanz.. TIPO DE TEXTO Se trata de un texto expositivo. TIPO DE TEXTO EXPOSITIVO Es un texto expositivo divulgativo.
¿Qué celebramos el 12 octubre ? 1cnt 1,000€ ¿Cuál es el nombre De la fiesta del 12 de octubre? ¿Originalmente cuál fue el nombre de La fiesta del 12 de.
© Manuel ColladoEntornos de Programación-1 Entornos de programación Concepto, funciones y tipos.
Competencia comunicativa
¿Cómo hacer un ensayo?.
La estructura de la oración Sintaxix Luis Villaseñor Pineda Laboratorio de Tecnologías del Lenguaje Coordinación de Ciencias Computacionales, Instituto.
1. Introducción El objetivo final del proyecto piloto es probar el uso de la tecnología XBRL para el intercambio de información financiera entre el Banco.
Algoritmos para calcular el Conjunto Primero y el Conjunto Siguiente
Seminario de Análisis Documental  Presenta: Lilian Martínez Carrillo  Profesor: Georgina Araceli Torres México, D.F., 2011 Ley de Zipf y sus aplicaciones.
Teoría de lenguajes y compiladores
DISEÑO DE LA INTERFAZ DE USUARIO
ACIDE A C onfigurable I ntegrated D evelopment E nvironment (Un entorno integrado de desarrollo configurable)
ANALISIS SINTACTICO Parte I
MORFOSINTAXIS DE LAS LENGUAS. Determinar cómo la morfología y la sintaxis permiten al estudiante apropiarse del estudio de las lenguas y posteriormente.
Academia: Español Tema: Ramas de la lingüística Profesor (a):
La Sintaxis Derechos reservados © Gastón Salamanca, 2002.
Un método de extracción de equivalentes de traducción a partir de un compus comparable castellano-gallego Grupo de Gramática do Espanhol Departamento de.
SenSemCat:. Corpus de la lengua catalana. anotado con información
Análisis sintáctico GRIAL – UB KNOW. Análisis sintàctico Situación actual del análisis sintáctico del español Desarrollo de una gramática Adquisición.
4/27/2015Lingüística Computacional1 LEXICONES Y CORPUS Carlos Mario Zapata J.
Evaluación de la dimensión morfosintáctica
Introducción al PLN 2 Lingüística Computacional vs Tratamiento del Lenguaje Natural (Tratamiento de la Lengua). Disciplinas afines Lingüística Inteligencia.
PLN chunking1 Análisis superficial y fragmental Introducción Chunking.
GPLSI Armando Suárez Definición de la tarea EI Fundamentos Aplicación Enfoque del Trabajo Conclusiones Documentación Extracción de Información.
1 Procesamiento del Lenguaje Natural Curso Arantza Díaz de Ilarraza German Rigau IXA group Ingeniería.
Marcatge de textos amb XML Servei de Tecnologia Lingüística (STeL)
Treebank y anotación semántica en euskara Grupo Ixa, UPV-EHU KNOW. Workshop de sintaxis Mayo, 2007.
Modelo de la Gramática Generativa Transformacional (1965)
¿CÓMO SE ORGANIZA LA LENGUA?
MORFOSINTAXIS DE LA LENGUAS. Determinar cómo la morfología y la sintaxis permiten al estudiante apropiarse del estudio de las lenguas y posteriormente.
LA MORFOLOGÍA.
Sintagmas y Oraciones: La GRAMATICA
ESTRUCTURA DE LA LENGUA:
La labor del IAEG para el desarrollo de capacidades estadísticas en los países y la mejora en el reporte de indicadores OMD Taller sobre el monitoreo de.
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Lingüística computacional unidad 2. análisis sintáctico
Lingüística computacional unidad 2. análisis semántico
LENGUA Y LITERATURA Curso
Componentes de la oración, categorías gramaticales y signos de pausa Profesora M. Soto ESPA 3101.
DISEÑO DE BASES DE DATOS (modelos para el diseño)
Rasgos particulares de los lenguajes especializados de las disciplinas
MORFOLÉXICO NIVELES LINGüÍSTICOS FONOLÓGICO O FONETOLÓGICO Correspondiente a los fonemas, es decir, con los sonidos. Además, incluye la entonación, acentuación.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Transcripción de la presentación:

Know T2. Procesadores lingüísticos UPV/EHU

Know.Tarea 2. PROCESADORES LINGÜÍSTICOS “UB reunirá los procesadores lingüísticos existentes para cada una de las lenguas de KNOW, y abordará el desarrollo del eslabón perdido: analizadores sintácticos de amplia cobertura para el español, catalán y euskera. Además, este subproyecto adquirirá modelos verbales, que son indispensables para dar coherencia a los análisis sintácticos y permiten la interpretación semántica.”

Know: Objetivos T2 Recursos Lingüísticos básicos. Adaptación, recopilación y enriquecimiento de las herramientas y recursos lingüísticos básicos disponibles para todas las tareas del proyecto. Esto incluye: Identificación de las unidades y límites oracionales Análisis morfológico Tratamiento de entidades referenciales Análisis sintáctico parcial Subcategorización y patrones de diátesis Análisis sintáctico profundo automático. Desarrollo de gramáticas para el análisis sintáctico profundo para las lenguas del proyecto. (UB, EHU/UPV)

Know: Objetivos T2 En el análisis sintáctico Estandarización de las anotaciones de los diferentes corpus sintácticos. Estudio de la situación actual de los analizadores sintácticos de las lenguas implicadas en el proyecto. Desarrollo de gramáticas sintácticas para las lenguas del proyecto con el objetivo de realizar un análisis sintáctico profundo. Implementación y evaluación de las versiones de la gramática

PROCESADORES LINGÜÍSTICOS UPV/EHU Recursos lingüísticos básicos (1) Chunker (Constraint Grammar, rule-based) Sintagmas nominales Cadenas verbales Tratamiento de entidades

PROCESADORES LINGÜÍSTICOS UPV/EHU Recursos lingüísticos básicos (2) Corpus etiquetado sintácticamente: Basado en dependencias 50.000 palabras actualmente (3LB) Extensión a otras 250.000

PROCESADORES LINGÜÍSTICOS UPV/EHU Análisis sintáctico (A) Analizador de dependencias (Constraint Grammar): Basado en reglas Sintaxis parcial (?) Falta evaluación

PROCESADORES LINGÜÍSTICOS UPV/EHU Análisis sintáctico (B) Statistical parsing, dependency-based. Primer año: estado del arte: Spanish (Cowan and Collins 2005); English (Bikel/Collins 2004); Charniak (2000); (Briscoe and Carroll 2006) Turkish (Oflazer 2006) CoNLL 2006/2007 MaltParser (Nivre et al. 2007) Fin del primer año: primera versión del analizador estadístico para el euskera

PROCESADORES LINGÜÍSTICOS UPV/EHU Análisis sintáctico (B) Statistical parsing, dependency-based MaltParser (Nivre et al. 2007). Determinista Basado en el treebank 3LB Experimentos: 73% (Labeled Attachment Accuracy) Tratamiento de ambigüedad morfosintáctica?

PROCESADORES LINGÜÍSTICOS UPV/EHU Análisis sintáctico (B) Statistical parsing, dependency-based. CoNLL 2007

PROCESADORES LINGÜÍSTICOS UPV/EHU Análisis sintáctico (C) Statistical parsing, dependency-based. Segundo año: añadir información léxica (subcategorización verbal, etc.; Aitziber Atutxa?)

PROCESADORES LINGÜÍSTICOS UPV/EHU Análisis sintáctico (C) RASP (rule-based + statistical training): Actualmente: ~200 reglas Entrenado sobre 100 sentencias anotadas manualmente Previsto: ?