Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Etiquetado de Contextos Definitorios
Bertha Lecumberri Salazar Facultad de Filosofía y Letras Grupo de Ingeniería Lingüística
2
Introducción Proyecto CONACYT: Extracción de conceptos en textos de especialidad a través del reconocimiento de patrones lingüísticos y metalingüísticos Objetivo: Obtener contextos definitorios (CD) de terminología especializada para apoyar a la construcción de diccionarios electrónicos onomasiológicos y semasiológicos, la elaboración de bancos terminológicos, el diseño de ontologías, además de agilizar la búsqueda automática de términos y definiciones.
3
Contexto definitorio (CD):
Un fragmento textual cuyos principales elementos son un término y su definición, también presentan otras unidades cuya función es ligar a los dos primeros. Aquellas frases verbales del tipo X define Y como Z, X es Y, X se compone de Yα...Yn, X funciona en Y, X se llama también Y, y otras similares, cuya función es la de asociar, desde un plano gramatical, un término a una definición. Lafourcae (1980) define el perfil profesional como una especificación de habilidades , rasgos y disposiciones que orientan la construcción del plan de estudios y asuntos que definen el que hacer de los miembros de cierta profesión.
4
CD Término Patrones Pragmáticos Definición Definitorios Aut Gen+Dif
Temp Inst Definitorios Tipográficos Predicación Verbal Definitoria Marcadores Reformulativos Sintácticos Definición Mer/Ext Gen+Dif Sin Gen Fun Dif Gen E. CD Lingüístico No Lingüístico
5
Etiquetas
6
XML es un lenguaje para estructuración de datos que tiene la
BOTON ETIQUETA 1. CD <CD num= ""> </CD> 2. TERM <TERM tipterm= "" stterm= ""> </TERM> 3. DEF <DEF tipdef= ""> </DEF> 4. PVD <PVD> </PVD> 5. VD <VD lema= "" args= "" mdo= ""> </VD> 6. SEmarc <SEmarc tipsemarc= ""> </SEmarc> 7. Vaux <Vaux> </Vaux> 8.NX <NX tipnx= ""> </NX> 9. MRD <MRD> </MRD> 10.MTD <MTD mdef= "" mt= ""> </MTD> 11. PP <PP tippp= ""> </PP> XML es un lenguaje para estructuración de datos que tiene la ventaja de ayudar a la manipulación de la información y es fácil de usar. Una etiqueta en lenguaje XML sirve para la organización y estandarización de datos o conocimiento para su tratamiento.
7
Proceso de etiquetado Extracción de CD Corpus Lingüístico de Ingeniería (CLI) Cuenta con 81 documentos especializados de ingeniería y son aproximadamente 300,000 palabras. El primer paso consistió en rastrear las ocurrencias de lemas de verbos definitorios. Posteriormente se hace una selección manual de candidatos a CD para ser etiquetados.
8
usadas para economizar tareas; una macro no es más que un conjunto
MACROS Para facilitar el etiquetado, se ha implementado un método semiautomático por medio de MACROS. Las MACROS son grupos de instrucciones que tienen un seguimiento cronológico usadas para economizar tareas; una macro no es más que un conjunto de expresiones (instrucciones) que se almacenan en una ubicación especial. Para su aplicación, se creó una barra de herramientas con botones para cada una de las etiquetas:
9
Consideraciones del etiquetado:
Todas las etiquetas deben ir dentro de la etiqueta CD. Las etiquetas VD, Semarc, Vaux y NX deben ir dentro de la etiqueta PVD. - Todas las etiquetas deben aparecer en cada CD aunque algunas queden vacías.
10
Ejemplo La Teoría del Buque que estudia el barco considerado como un flotador que se mueve en un líquido.
11
<CD num= "1"> La Teoría del Buque estudia el barco considerado como un flotador que se mueve en un líquido. </CD>
12
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el barco considerado como un flotador que se mueve en un líquido. </CD>
13
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> considerado como un flotador que se mueve en un líquido. </CD>
14
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> considerado como </PVD> un flotador que se mueve en un líquido. </CD>
15
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> como </PVD> un flotador que se mueve en un líquido. </CD>
16
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> <NX tipnx= "adv"> como </NX> </PVD> un flotador que se mueve en un líquido. </CD>
17
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> <NX tipnx= "adv"> como </NX> </PVD> <DEF tipdef= "GD"> un flotador que se mueve en un líquido </DEF> . </CD>
18
<CD num= "1"> <PP tippp= "Inst"> La Teoría del Buque </PP> estudia el <TERM tipterm= "L" stterm= "fn"> barco </TERM> <PVD> <VD lema= "considerar" args= "3" mdo= "part"> considerado </VD> <NX tipnx= "adv"> como </NX> <SEmarc tipsemarc= ""> </SEmarc> <Vaux> </Vaux> </PVD> <DEF tipdef= "GD"> un flotador que se mueve en un líquido </DEF> . <MRD> </MRD> <MTD mdef= "" mt= ""> </MTD> </CD>
19
Planteamientos lingüísticos
20
Términos y definiciones no lingüísticas
Términos no lingüísticos V1 es el voltaje al principio de la línea. <TERM tipterm= “NL" stterm= ""> V1 </TERM> <PVD> es </PVD> <DEF tipdef= ""> el voltaje al principio de la línea </DEF> .
21
Definiciones no lingüísticas
El coeficiente de acomodamiento se define como: F = nk ( 1-P ) ( 3 ) Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza. El <TERM tipterm= "L" stterm= "fn"> coeficiente de acomodamiento </TERM> <PVD> se define como </PVD> : <DEF tipdef= ""> F = nk ( 1-P ) ( 3 ) </DEF> Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza. El <DEF tipdef= ""> coeficiente de acomodamiento </DEF> <PVD> se define como </PVD> : <TERM tipterm= “NL" stterm= ""> F = nk ( 1-P ) ( 3 ) </TERM> Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza.
22
Preguntas: ¿Es esta estructura una definición o una descripción? En caso de ser un contexto definitorio, ¿F = nk ( 1-P ) ( 3 ) es el término o la definición? ¿Sería “Donde n = 1 es el número de capas, k = 1.31 es el coeficiente empírico de la capa, y P = 0.25 es la porosidad de la capa de coraza.” parte de la definición o una descripción de la misma?
23
El proceso de interrupción se puede describir brevemente
Delimitación de un CD Los criterios de extracción de los CD fueron: Rastrear los lemas de los verbos definitorios. Recupera el contexto que contenga dicho verbo definitorio contenido entre dos puntos. 1 El proceso de interrupción se puede describir brevemente como sigue : 1 . 2 Este consta de un banco de capacitores sumergidos en aceite en un recipiente de porcelana y conectados en serie para aumentar la resistencia de la línea de alto voltaje.
24
Gracias
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.