La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México.

Presentaciones similares


Presentación del tema: "Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México."— Transcripción de la presentación:

1 Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México

2 Contenido Introducción Propuesta para la creación de un nuevo modelo de documento Extracción de conceptos Análisis de la estructura lógica Análisis de la estructura semántica Un nuevo modelo de documento Conclusión

3 Introducción Contexto: Biblioteca Digital. Instituto Nacional de Ciencias Aplicadas de Lyon, Francia (INSA). Consulta Integral de Tesis en Red (CITHER) Difusión de tesis en línea. Búsqueda a partir de palabras claves. Búsqueda por catálogo. Formato PDF (Portable Document Format).

4 Introducción

5 Objetivo: Crear nuevo modelo de documentos para permitirle al usuario obtener la información pertinente. Nuestro trabajo consiste en: Modelar la tesis durante su creación. Permitir la búsqueda de información pertinente. Uso de “etiquetas semánticas”.

6 Contenido Introducción Propuesta para la creación de un nuevo modelo de documento Extracción de conceptos Análisis de la estructura lógica Análisis de la estructura semántica Un nuevo modelo de documento Conclusión

7 Propuesta para la creación de un nuevo modelo de documentos Llamado a Nomino Base de Conceptos Creación manual de etiquetas Llamado a la base Estudiante Tesis con las nuevas etiquetas Tesis Almacenamiento de la tesis CITHER (1) (2) (3) Etapa 1 Etapa 2

8 Contenido Introducción Propuesta para la creación de un nuevo modelo de documento Extracción de conceptos Análisis de la estructura lógica Análisis de la estructura semántica Un nuevo modelo de documento Conclusión

9 Extracción de conceptos Estudio comparativo de 4 herramientas de extracción automática de conceptos: Copernic Summarizer Nomino TerminologyExtractor Xerox Terminology Suite (XTS) Corpus: 25 documentos científicos. Análisis basado en la “precisión” y la “exhaustividad”.

10 Extracción de conceptos La “precisión” es la proporción de documentos recuperados realmente relevantes, del total de documentos recuperados. Precisi ó n = Documentos relevantes recuperados Documentos recuperados

11 Extracción de conceptos La “exhaustividad” es la proporción de documentos que son relevantes en la base de datos, independientemente de que éstos se recuperen o no. Exhaustividad = Documentos relevantes recuperados Documentos relevantes

12 Extracción de conceptos Resultados del análisis de nuestro corpus:

13 Extracción de conceptos Selección de Nomino como la herramienta más adecuada a nuestras necesidades. A pesar de la calidad de las herramientas el usuario experto debe de validar los conceptos extraídos.

14 Contenido Introducción Propuesta para la creación de un nuevo modelo de documento Extracción de conceptos Análisis de la estructura lógica Análisis de la estructura semántica Un nuevo modelo de documento Conclusión

15 Análisis de la estructura lógica Dos tipos de análisis: Estructura lógica Estructura semántica Análisis de la estructura lógica: Observando la organización de la tesis constatamos que: Siguen un plan, estructura  “descomposición lógica”. Existe una relación entre la estructura “semántica”.

16 Análisis de la estructura lógica Análisis de los principales conceptos extraídos de acuerdo a la estructura lógica Nomino se apoya en dos principios: “ganancia al alcance”: estipula que la información es aún más importante si es rara “ganancia a la expresividad”: clasifica los árboles en función de la información que se encuentra a su alrededor Aplicando Nomino al corpus nos damos cuenta de que hay conceptos que se repiten mucho y que por lo tanto no serán clasificados como pertinentes

17 Análisis de la estructura lógica

18

19 Resultados Para nuestro estudio: Índice Introducción Conclusión Son de menor interés

20 Contenido Introducción Propuesta para la creación de un nuevo modelo de documento Extracción de conceptos Análisis de la estructura lógica Análisis de la estructura semántica Un nuevo modelo de documento Conclusión

21 Análisis de la estructura semántica “Segmento semántico”: descomposición o corte del documento que nos permite acceder al contenido de las tesis por medio de temas o conceptos tratados. Ejemplos: estado del arte, metodología, modelo, algoritmo, etc.

22 Análisis de la estructura semántica Análisis de la estructuración de la tesis de acuerdo a sus “segmentos semánticos”.

23 Análisis de la estructura semántica Un ejemplo de la extracción de conceptos usando dos “segmentos semánticos”.

24 Análisis de la estructura semántica Validación del interés de cortar la tesis en diferentes “segmentos semánticos” Localización de las partes de la tesis más ricas en información Extracción de conceptos del área de estudio (informática) Creación de una base de conceptos del área

25 Contenido Introducción Propuesta para la creación de un nuevo modelo de documento Extracción de conceptos Análisis de la estructura lógica Análisis de la estructura semántica Un nuevo modelo de documento Conclusión

26 Un nuevo modelo de documento (1) Creación de un documento de tipo TESIS Estructura lógica (recomendaciones del Ministerio de Educación + Universidad). Estructura semántica: usando XML Schéma.

27 Un nuevo modelo de documento (2) Puesta en marcha de un sistema que ayuda al estudiante a la hora de redactar su tesis. Llamado a Nomino Base de Conceptos Creación manual de etiquetas Llamado a la base de conceptos Estudiante Tesis con las nuevas etiquetas Tesis Almacenamiento de la tesis CITHER (1) (2) (3) Etapa 1 Etapa 2

28 Un nuevo modelo de documento

29 Extracción de conceptos haciendo una llamada a Nomino Nomino

30 Un nuevo modelo de documento

31

32

33 Conclusión Definición de un nuevo modelo de documento tipo “TESIS” Permitiendo el acceso a las partes pertinentes de los documentos Conjugando simultáneamente las 2 estructuras: lógica y semántica Construcción de una herramienta para la generación de tesis Obedeciendo a una estructura predefinida y controlable Permitiendo la integración de los conceptos con el fin de describir el contenido Aprovechando la experiencia del autor

34 Conclusión Dra. Rocío Abascal Mena mabascal@correo.cua.uam.mx


Descargar ppt "Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México."

Presentaciones similares


Anuncios Google