Etiquetado de Contextos Definitorios

Slides:



Advertisements
Presentaciones similares
Describe: un extractor irrestricto de definiciones Gerardo Sierra, Rodrigo Alarcón, César Aguilar, Héctor Jiménez, José Manuel Pérez 4° Taller de Tecnologías.
Advertisements

INGLÉS Elena Bárcena Centro de Gestión de Estudiantes Internacionales 1.Objetivos de la prueba 2.Criterios de valoración 3.Descripción.
“PRESENTACIÓN DE UN ENSAYO” ¿Qué es un ensayo? Es un escrito en el cual un autor desarrolla sus ideas brevemente, se caracteriza por ser libre cada autor.
Universidad Veracruzana Facultad de Enfermería
Profesora: Paola Masa Alumna: Ivana Molina. Son objetos físicos que almacenan, mediante determinadas formas y códigos de representación, el conocimiento.
Predicación secundaria depictiva en español Palancar, E. y L. J. Alarcón Neve (2007). “Predicación secundaria depictiva en español”. Revista Española de.
1. Diversas herramientas de software libre para diseño. -Ingenio tu sitio -Compromisos de trabajos -El software y su licencia -Aspectos analizados 2.
MANUALES DE PROCEDIMIENTOS ¿¿Que son los manuales ?? Manuales de procedimientos.
Cómo presentar trabajos académicos
Metodología de la Investigación Cualitativa
TEMAS DEL BLOQUE 2.
Enfoque de los comunicadores:
UNIVERSIDAD TECNOLÓGICA DE PEREIRA
TERMINOLOGÍA BÁSICA Informática: conjunto de conocimientos científicos y técnicas que hacen posible el tratamiento automático y racional de la información,
METODOLOGÍA DE SISTEMAS
Seguimiento y Avance.
Departamento de Informática y Sistemas Universidad EAFIT
APRENDIZAJES AUTÓNOMO Y SIGNIFICATIVO FACTORES ENDÓGENOS QUE INFLUYEN EN ELLOS CURRÍCULO POR COMPETENCIAS Giovanni M. Iafrancesco V.
Elaboración del formulario
Conceptos teóricos sobre Lenguajes Documentales y Clasificación
ALGORITMOS, LENGUAJES Y TECNICAS DE PROGRAMACION
Profesor: José Luis Gonzalez
CLASIFICACION DE SOFWARE EDUCATIVO
Desarrollo Actividad Número 3
TEMAS DEL BLOQUE 2.
Recursos generales del traductor
Institución: Facultad de Ciencias d la computación Asignatura:
UNIVERSIDAD NACIONAL DE INGENIERÍA
Facultad de Ingeniería Mecánica y Eléctrica (FIME).
Metodología de la Investigación EDUCADIS
Metodología de diseño curricular para educación superior
Planeación y diseño curricular
Las herramientas Case Julian madrigal.
Análisis del discurso Facultad de Estudios Superiores Acatlán Comunicación Investigación en Comunicación IV.
El proyecto del Diccionario del Español de México (DEM)
Organización y estructura curricular
UNIDAD IV: Organización y estructuración curricular
Organización & Estructuración Curricular
Institución educativa pequeña María
Herramientas tecnológicas
LA ENSEÑANZA DE TEXTOS EN LA ESCUELA SECUNDARIA
ELABORACION DEL PERFIL PROFESIONAL
QUE ES PROGRAMAR.
Introducción a la Lingüística de corpus
HACIA UN NUEVO PLAN DE ESTUDIOS
Mónica Delgado Caracas, septiembre 2016
Los actos de habla la taxonomía de Searle
LUZ MERY SILVA BUITRAGO
CONCEPTOS BÁSICOS DE COMPUTACIÓN E HISTORIA
Plataforma de Gestión de Servicios Sociales
LAS VARIABLES EN LA INVESTIGACIÓN
Elaboración de los documentos
Desarrollo de sitios web
PRINCIPIOS FUNDAMENTALES DE LA AUDITORÌA DE DESEMPEÑO
Enfoque de los comunicadores:
MSc. Lisett Pérez Quintero Ing. Jorge Carrera Ortega
Material Realizado por Centro Zonal Universidad de Concepción
María Pereira Rico Tipos de texto Texto instructivo.
Sistema de Búsqueda de Respuestas
Lingüística computacional
Nombre del Docente: María Guadalupe Salazar Chapa
Procesamiento de Texto
Unidad 4. Capítulo I. Introducción.
PLANTILLA PARA LA PRESENTACIÓN DE UN TRABAJO DE TESIS
Estrategias de Búsquedas y Uso de Bases de Datos
CONSTRUCCION DE BANCO DE REACTIVOS
Unidad IV. Etapa tres: Organización y estructuración curricular
Capítulo 5 La sintaxis.
ACTIVIDAD RESULTADOS ISCE 2018
Escuela Nacional Preparatoria
Transcripción de la presentación:

Etiquetado de Contextos Definitorios Bertha Lecumberri Salazar BLecumberriS@iingen.unam.mx Facultad de Filosofía y Letras Grupo de Ingeniería Lingüística

Introducción Proyecto CONACYT: Extracción de conceptos en textos de especialidad a través del reconocimiento de patrones lingüísticos y metalingüísticos Objetivo: Obtener contextos definitorios (CD) de terminología especializada para apoyar a la construcción de diccionarios electrónicos onomasiológicos y semasiológicos, la elaboración de bancos terminológicos, el diseño de ontologías, además de agilizar la búsqueda automática de términos y definiciones.

Contexto definitorio (CD): Un fragmento textual cuyos principales elementos son un término y su definición, también presentan otras unidades cuya función es ligar a los dos primeros. Aquellas frases verbales del tipo X define Y como Z, X es Y, X se compone de Yα...Yn, X funciona en Y, X se llama también Y, y otras similares, cuya función es la de asociar, desde un plano gramatical, un término a una definición. Lafourcae (1980) define el perfil profesional como una especificación de habilidades , rasgos y disposiciones que orientan la construcción del plan de estudios y asuntos que definen el que hacer de los miembros de cierta profesión.

CD Término Patrones Pragmáticos Definición Definitorios Aut Gen+Dif Temp Inst Definitorios Tipográficos Predicación Verbal Definitoria Marcadores Reformulativos Sintácticos Definición Mer/Ext Gen+Dif Sin Gen Fun Dif Gen E. CD Lingüístico No Lingüístico

Etiquetas

XML es un lenguaje para estructuración de datos que tiene la BOTON ETIQUETA 1. CD <CD num= ""> </CD> 2. TERM <TERM tipterm= "" stterm= ""> </TERM> 3. DEF <DEF tipdef= ""> </DEF> 4. PVD <PVD> </PVD> 5. VD <VD lema= "" args= "" mdo= ""> </VD> 6. SEmarc <SEmarc tipsemarc= ""> </SEmarc> 7. Vaux <Vaux> </Vaux> 8.NX <NX tipnx= ""> </NX> 9. MRD <MRD> </MRD> 10.MTD <MTD mdef= "" mt= ""> </MTD> 11. PP <PP tippp= ""> </PP> XML es un lenguaje para estructuración de datos que tiene la ventaja de ayudar a la manipulación de la información y es fácil de usar. Una etiqueta en lenguaje XML sirve para la organización y estandarización de datos o conocimiento para su tratamiento.

Proceso de etiquetado Extracción de CD Corpus Lingüístico de Ingeniería (CLI). Cuenta con 81 documentos especializados de ingeniería y son aproximadamente 300,000 palabras. El primer paso consistió en rastrear las ocurrencias de lemas de verbos definitorios. Posteriormente se hace una selección manual de candidatos a CD para ser etiquetados.

usadas para economizar tareas; una macro no es más que un conjunto MACROS Para facilitar el etiquetado, se ha implementado un método semiautomático por medio de MACROS. Las MACROS son grupos de instrucciones que tienen un seguimiento cronológico usadas para economizar tareas; una macro no es más que un conjunto de expresiones (instrucciones) que se almacenan en una ubicación especial. Para su aplicación, se creó una barra de herramientas con botones para cada una de las etiquetas:

Consideraciones del etiquetado: Todas las etiquetas deben ir dentro de la etiqueta CD. Las etiquetas VD, Semarc, Vaux y NX deben ir dentro de la etiqueta PVD. - Todas las etiquetas deben aparecer en cada CD aunque algunas queden vacías.

Ejemplo La Teoría del Buque que estudia el barco considerado como un flotador que se mueve en un líquido.

<CD num= "1"> La Teoría del Buque estudia el barco considerado como un flotador que se mueve en un líquido. </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el barco considerado como un flotador que se mueve en un líquido. </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> considerado como un flotador que se mueve en un líquido. </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> considerado como </PVD> un flotador que se mueve en un líquido. </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> como </PVD> un flotador que se mueve en un líquido. </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> <NX tipnx= "adv"> como </NX> </PVD> un flotador que se mueve en un líquido. </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> <NX tipnx= "adv"> como </NX> </PVD> <DEF tipdef= "GD"> un flotador que se mueve en un líquido </DEF> . </CD>

<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> <NX tipnx= "adv"> como </NX> <SEmarc tipsemarc= ""> </SEmarc> <Vaux> </Vaux> </PVD> <DEF tipdef= "GD"> un flotador que se mueve en un líquido </DEF> . <MRD> </MRD> <MTD mdef= "" mt= ""> </MTD> </CD>

Planteamientos lingüísticos

Términos y definiciones no lingüísticas Términos no lingüísticos V1 es el voltaje al principio de la línea. <TERM tipterm= “NL" stterm= ""> V1 </TERM> <PVD> es </PVD> <DEF tipdef= ""> el voltaje al principio de la línea </DEF> .

Definiciones no lingüísticas El coeficiente de acomodamiento se define como: F = nk ( 1-P ) ( 3 ) Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza. El <TERM tipterm= "L" stterm= "fn"> coeficiente de acomodamiento </TERM> <PVD> se define como </PVD> : <DEF tipdef= ""> F = nk ( 1-P ) ( 3 ) </DEF> Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza. El <DEF tipdef= ""> coeficiente de acomodamiento </DEF> <PVD> se define como </PVD> : <TERM tipterm= “NL" stterm= ""> F = nk ( 1-P ) ( 3 ) </TERM> Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza.

Preguntas: ¿Es esta estructura una definición o una descripción? En caso de ser un contexto definitorio, ¿F = nk ( 1-P ) ( 3 ) es el término o la definición? ¿Sería “Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza.” parte de la definición o una descripción de la misma?

El proceso de interrupción se puede describir brevemente Delimitación de un CD Los criterios de extracción de los CD fueron: Rastrear los lemas de los verbos definitorios. Recupera el contexto que contenga dicho verbo definitorio contenido entre dos puntos. 1 El proceso de interrupción se puede describir brevemente como sigue : 1 . 2 Este consta de un banco de capacitores sumergidos en aceite en un recipiente de porcelana y conectados en serie para aumentar la resistencia de la línea de alto voltaje.

Gracias