DOCUMENTACIÓN DEL PROCESO DE ANOTACIÓN Orlando Furioso John A. Roberto STeL - UB.

Slides:



Advertisements
Presentaciones similares
Publicaciones científicas apoyadas con tecnologías de información Jorge Walters Gastelu Marzo de 2004 Santiago, Chile.
Advertisements

Herramientas informáticas
SISTEMAS DE GESTIÓN DE LA SEGURIDAD DE LA INFORMACIÓN
Tecnología Biométrica: Escritura Manuscrita
DISEÑO DE SITIOS WEB CON DREAMWEAVER 8.
ELEMENTOS DEFINICIÓN HIPERTEXTO DIMENSIONES ESTRUCTURA.
Dirección de Servicios Corporativos Tecnología de Información Administración y Finanzas Proyecto de Digitalización de documentos Febrero 2010.
Secretaría General Firma electrónica UNED- febrero 2010.
Open Journal System Roles y funciones.
Taller de Herramientas de Google Docs
DESARROLLO DE HABILIDADES INFORMATIVAS DHI
Framework Hexápodo PHP fácil, rápido y sin dolor
USO EFECTIVO DE LAS BASES DE DATOS ACADÉMICAS EN UPB
Facultad de Odontología Biblioteca Catálogos de la BUC: Cisne, Dioscórides, Compludoc, Complured.
Los metadatos, el nuevo Metadoc y la página maestra
HACIA LA BIBLIOTECA VIRTUAL DE LA SECRETARIA DISTRITAL DE SALUD
Acceso del usuario a la aplicación.
DOCUMENT TYPE DEFINITION DTD
Características y elementos fundamentales J.M. Morales-del-Castillo
Coordinación de Bibliotecas UAEM
II Xornada de Innovación Educativa na Universidade
Fundamentos de Ingeniería de Software Facultad de Ingenieria Universidad Distrital Francisco José de Caldas ESPECIFICACIÓN Y MANEJO DE LOS REQUERIMIENTOS.
JUGAR Karina Ramos García María Camila Torres. Que es un sistema operativo? ¿Cuál es la misión y los objetivos de un sistema operativo? ¿Qué es la interfaz.
Proceso de Digitalización De Información Sobre Desastres y Salud Información Sobre Desastres y Salud Experiencias Obtenidas en Honduras Lic. Ovidio Enrique.
Fundamentos de Calidad Total Ing. Roberto Matute Integrantes: Yulia Cárcamo Luis sarmiento Elsa Ruiz Heydi Medrano UNIVERSIDAD NACIONAL AUTÓNOMA DE HONDURAS.
Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México.
AUDITORIAS DE SEGURIDAD
Diseño de algoritmos La computadora puede realizar procesos y darnos resultados, sin que tengamos la noción exacta de las operaciones que realiza. Con.
LA DIGITALIZACION DE DOCUMENTOS
Sistema de Gestión Documental 1. 2 Tecnotur 3000 S.L. ¿En qué consiste un sistema de Gestión Documental? Es un sistema de archivo de documentos en formato.
Gestión Documental Software de y archivo electrónico de información
Prof. Adelaide Bianchini. Dpto. de Computación y Tecnología de la Información. Universidad Simón Bolívar. Mayo Conceptos sobre hipertexto Prof. Adelaide.
Marcatge de textos amb XML Servei de Tecnologia Lingüística (STeL)
Introducción a XML por Joel Candia C Universidad Técnica Federico Santa María Departamento de Electrónica ELO-330 Programación de Sistemas.
Guía fácil del RSS.
FESABID 2005 Mesa redonda: Gestión de contenidos y gestión documental: la integración de la información en la empresa Actuación de la Biblioteca en el.
Using e-technology in production, proofing and printing, and in marketing and promotion Jorge Walters Gastelu Metodologías y Tecnologías de Información.
Tecnologías para el Aprendizaje
Diseño y Producción Multimedia.
Examen final FABRICIO BAQUERIZO.
1 Clase 3 Registro de resultados Tecnología de la Comunicación I.
Libros electrónicos.
Cómo insertar hipervínculos en Power Point. Una vez realizada la presentación completa se elige el sitio desde donde se desea establecer el vínculo.
HERRAMIENTAS DE LAS WEB 2.0 PRESENTADO POR: María Isabel Baquero Villero 11°B.
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
Internet y Navegadores Unidad 5. Fecha: 1 de agosto de 2011 Periodo# : 2 Objetivo: identificar el contenido de una dirección web Tema: Elementos de una.
Un sistema de administración de bases de datos DBMS (es un sistema basado en computador (software) que maneja una base de datos, o una colección de bases.
Definición objeto de aprendizaje y propiedades Integrantes Edgar Misael Mata Vazquez Luis Angel Espinosa Arroyo Brenda Carolina Peña Garza Claudia Nataly.
Aplicaciones del Sistema de Información Geográfica en la República Argentina Instituto Geográfico Militar 2001.
INICIA tema 2.- Acceder a sitios y fuentes de información externas
LINA PATIÑO Y REINALDO LIZCANO
Taller: Desarrollo de Competencias de Información Integrado al Currículo Universitario XLVI Asamblea/Conferencia Anual Sociedad de Bibliotecarios de Puerto.
LINA PATIÑO Y REINALDO LIZCANO
Primera página web: “presentacion” 1.Abrir el programa Front Page 2000.
Gestión Electrónica Documental (GED)
Internet Internet es una red de alcance mundial, compuesta por redes de datos privadas y públicas que se comunican entre si, independientemente del hardware.
Modelos del Proceso Omar de Jesús Rosales Hernández.
Sistemas Gestores de Bases de Datos
La estrategia de búsqueda
1. Iniciación a la arquitectura de la información.
República Bolivariana de Venezuela Universidad Nacional Experimental Politécnica de la Fuerza Armada (UNEFA) Carrera: Ingeniería de Sistemas Cátedra: Análisis.
HIPERTEXTO + MULTIMEDIA = HIPERMEDIA
PORTAL DE PRESUPUESTOS DE LA COMUNIDAD DE MADRID Área de Administración y Difusión Electrónica.
DEFINICION ADMINISTRACIÓN Y SEGURIDAD Administración Humano regula el acceso a todos los Módulos y permite restringir la ejecución de determinadas tareas.
Algunas anotaciones sobre las TIC y los procesos de investigación Vivian Rivera R. Setiembre, 2015.
Operaciones y funciones básicas del sistema operativo Windows Mayo 2010 Castillo Navarro Adolfo y González Bello Edgar Oswaldo (2010). Operaciones y funciones.
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Correo electrónico, Chat y otros servicios. INDICE *Orígenes del Correo Electrónico *Correo electrónico o s *Ventajas del correo electrónico *Recibir.
El formato PDF Unidad Análisis y Obtención del Texto Taller de herramientas para la traducción Traductorado Público en idioma inglés Facultad de Lenguas.
Transcripción de la presentación:

DOCUMENTACIÓN DEL PROCESO DE ANOTACIÓN Orlando Furioso John A. Roberto STeL - UB

Objeto y objetivos Limitamos el objeto y la extensión del proyecto. Proyecto “Orlando Furioso” Finalidad: digitalizar Orlando Furioso, en concreto las ediciones (en papel) de 1549, 1550, 1553, 1583, 1554, 1578, 1542 y 1575 de los cantos 1 al 5. Aplicación: pueda ser consultado por expertos vía Web.

Tareas y recursos Para comenzar el proyecto se determinaron las tareas y el personal encargado de su ejecución. Expertos 3 Determinan las unidades y criterios de anotación. Técnicos 2 Definen cual es la mejor manera de anotar en términos de herramientas y tecnologías. Anotadores 2 Emplean las herramientas seleccionadas para marcar los documentos siguiendo los criterios metodológicos de los expertos. Facultad de Filología Italiana & STeL

Adquisición de datos (1) Se escanearon los libros y se aplicó el reconocimiento óptico de caracteres (OCR) para obtener … 4.jpg 5.jpg

Adquisición de datos (2) … el texto en formato electrónico y … ORLANDO FURIOSO DIRIGIDO AL PRÍINCIPE DON PHILIPE, NUESTRO SEÑOR, traduzido en Romance Castellano, por don Ieronimo de Urrea. [Imagen] CANTO PRIMERO Que trata de la huida de Angélica y como siguiéndola Renaldos, topó con Ferraguto: assimismo la venida de Sacripante Rey de Circasia: y lo que con Angélica y otros le avino. 1 Damas, armas, amor y empresas canto,. cavalleros, esfuerço y cortesía d’aquel tiempo que a Francia dañó tanto passar moros Moros el mar de Bervería, d’Agramante, su reyRey, siguiendo quanto con juvenil furor les prometía, en él vengar la muerte de Troyano sobre ’l Rey Carlo, emperador Romano. canto_I_1549.doc

Adquisición de datos (3) … las imágenes. E1549-c01-ima01.swf

Definición de las búsquedas (1) Se definieron las unidades o elementos ESTRUCTURALES que pretendíamos recuperar de las versiones digitalizadas del Orlando Furioso. Búsqueda por ediciones, palabras, imágenes, índices, cantos, textos, etc. Imagen de portada - canto primero - edición de 1549

Definición de las búsquedas (2) Se definieron las unidades o elementos CONCEPTUALES que pretendíamos recuperar de las versiones digitalizadas del Orlando Furioso. Búsqueda por nombres de autores y personajes, escenas, acciones, lugares, etc. Huida de Angélica

Definición de un vocabulario “OF” (1) Una vez teníamos claro qué buscar, necesitábamos saber cómo buscarlo. Para ello el experto en el dominio definió un conjunto de marcas que nos ayudarían a encontrarlo (LEXICO) y … Una aplicación XML o vocabulario XML es la definición de un conjunto de elementos genéricos y una estructura de documento que describe un tipo de documento en particular. Canto Imagen Estrofa Verso Texto Paratext o …

Definición de un vocabulario “OF” (2) … las relaciones que surgían entre tales elementos (SINTÁXIS). Una aplicación XML o vocabulario XML es la definición de un conjunto de elementos genéricos y una estructura de documento que describe un tipo de documento en particular. + Canto + Texto + Estrofa + Verso - refIMAG + Paratexto + Imagen

Estructuración del corpus Las carpetas tienen nombres significativos (H) y los archivos están codificados alfanuméricamente de modo que permiten un acceso secuencial (M). C:/ + Orlando + Escaneados + E1549-c r.jpg + 1-v.jpg + … + E E1549-c01 + E1549.doc + E1549-c01.xml (canto 1) + E1549-c01.xml (canto 2) + E1549-a01.xml (prologo 1) + E1549-a01.xml (prologo 2) + E1549-z01.xml (apéndice 1) + E1549-z01.xml (apéndice 2) + E … + DTDs + Software Estructuración

Principios de anotación (1) Definida la estructura de las carpetas, se definió la estructura y convenciones al interior de cada uno de los ficheros … estrofa_ATT_ numEstrofa Versos Id identificador E1549-c01-e001 Idref relacionador E1542-c01-e001 archivo archivo asociado 7-v.jpg CANTOS Representación

Principios de anotación (2) … de forma que la anotación (en el caso de las estrofas) quedaría de esta manera … Representación

Protocolo de anotación (1) Preproceso: algunos elementos estructurales como párrafos, estrofas o versos y conceptuales como nombres propios, que presentaban una cierta regularidad o existía evidencia de su presencia en el texto pudieron ser anotados de forma automática.nombres propios Conversión

Protocolo de anotación (2) Anotación: para anotar los elementos que requerían supervisión humana se adapto un editor basado en DTDs que permitía insertar etiquetas según el contexto reduciendo el margen de error. Conversión

Protocolo de anotación (3) Validación: el texto marcado se somete a una serie de comprobaciones para asegurar que no incumpla las normas definidas en el modelo de datos de las DTDs … <!ATTLIST estrofa_ATT_ id ID #REQUIRED idref IDREF #IMPLIED archivo CDATA #REQUIRED> Revisión

Protocolo de anotación (4) … el explorador es una de las herramientas empleadas para validar, junto con herramientas específicas. Revisión

Herramienta de explotación Definir los mecanismos que permitan localizar y acceder a los elementos marcados y representados en los documentos XML según las necesidades de información de los potenciales usuarios. Explotación