2º Periodismo Documentación Informativa David Rodríguez Mateos - 2004 ALMACENAMIENTO Y RECUPERACIÓN DE LA INFORMACIÓN GENERADA POR UN MEDIO PERIODÍSTICO.

Slides:



Advertisements
Presentaciones similares
Fuentes de información
Advertisements

INTRODUCCIÓN A LA DOCUMENTACIÓN
Descubre tu Biblioteca: Plataforma de Descubrimiento SUMMON
Evaluación mediante Medidas de Recuperación
Herramientas informáticas
III - Gestión de memoria
Cómo consultar una base de datos en 5 minutos
La web semántica y su impacto en la recuperación de información
Calvin N. Mooers Information Retrieval La búsqueda de información en un stock de documentos, efectuada a partir de la especificación.
Biblioteca.unizar.es Produce Base de datos Econlit Administra.
Cómo consultar una base de datos o un catálogo en 5 minutos
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
Bases de Datos por: Zulma Santiago Irizarry 2011
El portal de recursos electrónicos de la UAM
Estrategias de Búsqueda
Base de Datos ProQuest.
Como usar el Catálogo Bello Guía práctica Acceso al catálogo  Se puede acceder al catálogo desde cualquier parte del mundo por Internet.  Es posible.
Requerimientos para producir
El análisis y recuperación de información
UNIDAD I Conceptos Básicos.
Colegio San Ignacio de Loyola
Acceso del usuario a la aplicación.
ANALISIS DEL CURSO. Las herramientas multimediales nos permiten tener acceso a una amplia gama de productos e información lo cual nos posibilita ponernos.
1 5. La Búsqueda (I) Los ordenadores almacenan gran cantidad de información…  Hay que clasificarla y ordenarla para encontrarla con facilidad. ¿Y si no.
Ing. Héctor Abraham Hernández Erazo
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
DATA WAREHOUSE Equipo 9.
Introducción a las Bases de Datos Relacionales Juan Alberto Sigüenza Escuela Técnica Superior de Informática Universidad Autónoma de Madrid.
Proyecto Integral “Fortalecimiento de los Procesos de Enseñanza” Sub- proyecto Actualización en Procesos Técnicos: Análisis Documental Dirección Provincial.
Ingeniería de Sistemas Ing. Eddye Arturo Sánchez Castillo
Plan de Sistemas de Información (PSI)
Support.ebsco.com Tutorial de búsqueda básica para bibliotecas académicas.
Moodle es un entorno de aprendizaje que está basado en los principios pedagógicos constructivistas, con un diseño modular que hace fácil agregar contenidos.
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
ALGUNOS CONCEPTOS DOCUMENTALES: FUENTES, SOPORTES, PROCESOS
Evaluación de la Indización
Tecnologías para el Aprendizaje
TEMA 2: SISTEMAS OPERATIVOS. ENTORNO MONOUSUARIO
Guía para la Búsqueda de Información
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Ing. Noretsys Rodríguez. Definición de Conceptos  Falla: Ocurre cuando un programa no se comporta de manera adecuada. Es una propiedad estadística de.
1 Clase 3 Registro de resultados Tecnología de la Comunicación I.
TECNOLOGIA E INFORMATICA BLOG Y SITIO WEB 2013 es un sitio web periódicamente actualizado que recopila cronológicamente textos o artículos de uno o varios.
MANUAL DE USO BASES DE DATOS Por: EBSCO Information Services
EL ANALISIS DE CONTENIDO
Por: Mónica María Rúa Blandón
Título Calibri 28 puntos 2015 Subtítulos: Calibri mínimo 18 ptos y máximo 23 ptos.
Introducción a las bases de datos
Unidad 7 Escritorio de Windows.
Búsqueda de Información en Internet
SHUTTENBORG ACCESS CONOCE LOS PROGRAMAS. Cortés Gamboa Lizzeth
Support.ebsco.com Búsqueda avanzada guiada de EBSCOhost Tutorial.
Lic. Carla Aguirre Montalvo
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
UNIVERSIDAD EUROPEA DEL ATLÁNTICO Servicio de Biblioteca biblio.uneatlantico.es.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Elaboración de artículos científicos
Gestión Electrónica Documental (GED)
Temas: El Ordenador | Redes | ¿Qué es un wiki? | Diseño Web | Programación informática | Hojas de cálculo El OrdenadorRedes¿Qué.
¿QUÉ ES EL MODELO ENTIDAD-RELACIÓN?  Como ya he comentado este modelo es solo y exclusivamente un método del que disponemos para diseñar estos esquemas.
La estrategia de búsqueda
Recursos bibliográficos y gestión de la información
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
ACCESS Microsoft Access es un sistema de gestión de bases de datos incluido en el paquete ofimático denominado Microsoft Office. Es igualmente un gestor.
Determinar la naturaleza y nivel de la información que necesitamos
En el presente trabajo, se explica los diferentes elementos que nos ofrece Microsoft Access, para hacer mas fácil y rápido la realización de bases de.
BUSINESS T&G Think & Grow Uniclass Gestión Documental Solución Web para Mejorar la Captura y Gestión.
Biblioteca de Arquitectura. Universidad de Sevilla. Curso 15/16 Máster en Urbanismo, Planeamiento y Diseño Urbano.
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
13/11/14. UNIDADES DEL SEMESTRE Este trabajo esta diseñado para saber los propósitos de los sistemas de información, así como el buen desempeño que le.
Transcripción de la presentación:

2º Periodismo Documentación Informativa David Rodríguez Mateos ALMACENAMIENTO Y RECUPERACIÓN DE LA INFORMACIÓN GENERADA POR UN MEDIO PERIODÍSTICO Tema 11 Documentación Informativa Licenciatura en Periodismo Universidad Carlos III de Madrid Curso 2004/2005

2º Periodismo Documentación Informativa David Rodríguez Mateos Índice 1.Almacenamiento de contenidos 2.El control físico de los documentos 3.Los contenidos digitales 4.Guardar para recuperar: productos documentales de almacenamiento 5.Sistemas de recuperación de información (SRI) 6.Recuperación de datos / recuperación de documentos 7.Diseño y uso de los SRI 8.Cómo recuperar documentos relevantes 9.¿Cómo representar la información para que pueda ser recuperada? 10.Algunos parámetros de evaluación de SRI 11.Efectividad de los SRI 12.Los grandes problemas de la recuperación de información

2º Periodismo Documentación Informativa David Rodríguez Mateos Almacenamiento de contenidos Funciones –Mantener el control físico de los documentos durante un periodo de tiempo ¿Dónde están? ¿Cuánto tiempo pueden durar?  Conservación –Permitir su reutilización ¿Cómo localizar físicamente un documento? –Necesidad de una buena descripción formal  Especialmente, de los elementos materiales (soporte, tamaño, ubicación, duración...) –Necesidad de una buena clasificación  Válida para ordenar los documentos por unos mismos criterios

2º Periodismo Documentación Informativa David Rodríguez Mateos El control físico de los documentos Diferentes tipos de soporte –Papel Diferentes calidades –Soporte magnético Disquetes, discos duros (internos/externos), unidades ZIP, memorias flash...) –Soporte óptico CD, DVD, Laserdisc... ¿Cómo elegir un soporte? Por su duración física –Los soportes ópticos, a priori, son más duraderos –Los soportes magnéticos, a priori, son mucho más frágiles Por su facilidad de acceso –Los soportes magnéticos y ópticos requieren un reproductor –Pero permiten almacenar contenidos digitales

2º Periodismo Documentación Informativa David Rodríguez Mateos Los contenidos digitales ¿Por qué usar contenidos digitales? –Estructuración Los contenidos pueden estar físicamente en distintos lugares –Pero pueden verse como un solo conjunto –Distintos objetos pueden verse en diferentes conjuntos –Interrelación Hiperenlaces: desde un documento se puede acceder a otros directamente –Reutilización Copiar y cortar contenidos digitales es más fácil –Multimedia Un soporte puede almacenar múltiples formatos Un documento puede estar formado por diferentes formatos

2º Periodismo Documentación Informativa David Rodríguez Mateos Guardar para recuperar: productos documentales de almacenamiento Productos documentales –Sirven para facilitar la recuperación de información Recuperación de información –Conjunto de tareas mediante las cuales el usuario localiza y accede a la información pertinente (útil) para la resolución de un problema planteado

2º Periodismo Documentación Informativa David Rodríguez Mateos Guardar para recuperar: productos documentales de almacenamiento Productos documentales –Carpetas Agrupan todos los documentos sobre un tema o un personaje concreto No tienen ninguna relación explícita entre ellos (son un mero soporte físico) –Originalmente, en papel –Actualmente, también se usan en soportes digitales –Dossieres Información sobre un tema concreto, un personaje, etc. Organizada y relacionada entre sí

2º Periodismo Documentación Informativa David Rodríguez Mateos Guardar para recuperar: productos documentales de almacenamiento Productos documentales –Cronologías Recopilación de referencias sobre hechos agrupadas por orden temporal –Previsiones Recopilación de menciones a hechos futuros que, con certeza o con una alta probabilidad, se van a producir –A veces, son denominadas calendarios –Sistemas de recuperación de información (SRI) Formas de almacenar contenidos digitales –Pueden agrupar contenidos sobre un mismo tema o sobre temas distintos –Permiten recuperar esos contenidos buscando por palabras que estén insertas en esos contenidos

2º Periodismo Documentación Informativa David Rodríguez Mateos Sistemas de recuperación de información (SRI) Referenciales: bases de datos (SGBD) –Contienen datos (referencias) sobre objetos del mundo real Ejemplos –Datos personales –Datos formales sobre documentos –Datos estadísticos –Etc. Texto completo: bases documentales (SBD) –Permiten búsqueda sobre el contenido completo de los documentos A veces, una base documental puede incorporar datos adjuntos (por ejemplo, descriptores documentales o datos formales)

2º Periodismo Documentación Informativa David Rodríguez Mateos Recuperación de datos / recuperación de documentos Recuperación directa que responde la pregunta del usuario. Ej: Quiero saber el nombre del director de Casablanca. Necesariamente, existe una relación entre una pregunta bien construida y la respuesta correcta. Recuperación indirecta que proporciona o referencia a un conjunto de documentos que probablemente contenga la respuesta a lo que pregunta el usuario  Ej: Quiero encontrar información sobre Casablanca. Probablemente, existe una relación entre una pregunta bien construida y la respuesta correcta Recuperación de datosRecuperación de documentos

2º Periodismo Documentación Informativa David Rodríguez Mateos Recuperación de datos / recuperación de documentos El criterio para medir el éxito de una búsqueda es la corrección de la respuesta Evaluación objetiva ¿Es la respuesta correcta? La velocidad de la recuperación depende sobre todo de la velocidad del acceso físico del sistema que se utilice Un buen ordenador Un buen SRI Una buena red de comunicacion El criterio para medir el éxito de una búsqueda es su utilidad. Evaluación subjetiva ¿Se ha satisfecho la necesidad del usuario? La velocidad de la recuperación depende sobre todo del número de decisiones lógicas que el usuario debe tomar durante el desarrollo de la búsqueda sólo secundariamente de la velocidad del acceso del sistema que se utilice Recuperación de datosRecuperación de documentos

2º Periodismo Documentación Informativa David Rodríguez Mateos Diseño y uso de los SRI El diseño de los sistemas de recuperación de datos es simple –Cada ítem (característica) de un dato sólo tiene un punto de acceso Si un usuario busca el nombre del autor del artículo en una base de datos de referencias sobre artículos, solo podrá encontrarlo en un lugar de la base de datos (un campo de autores) Los documentos tienen múltiples y distintos puntos de acceso Si un usuario busca menciones a una persona en un documento, ¿dónde puede estar? Un sistema de recuperación de documentos debe –Proporcionar un gran número de puntos de acceso a un documento –Proporcionar el acceso a ese documento a través de un gran número de combinaciones booleanas de esos puntos de acceso

2º Periodismo Documentación Informativa David Rodríguez Mateos Diseño y uso de los SRI Expectativas del usuario –En un sistema de recuperación de datos El usuario espera conocer con exactitud el dato por el que preguntaba. –En un sistema de recuperación de documentos El usuario raramente espera recuperar todos los documentos y sólo la información que buscaba Normalmente espera documentos no relevantes (que deberá visualizar y desechar) Además, nunca tiene la certeza de qué documentos relevantes no ha encontrado (por indización incorrecta, por búsqueda incorrecta...)

2º Periodismo Documentación Informativa David Rodríguez Mateos Cómo recuperar documentos relevantes La recuperación de documentos relevantes (útiles) debe equilibrar dos objetivos: 1.Predecir cómo están representados o indexados los documentos que le van a ser útiles. El que busca en un SBD debe tratar de predecir –Los términos que han servido para representar un documento en el SBD –Los términos utilizados para representar documentos no relevantes. 2.Recuperar un conjunto de documentos lo suficientemente pequeño para visualizarlos y encontrar los más útiles

2º Periodismo Documentación Informativa David Rodríguez Mateos Cómo recuperar documentos relevantes La recuperación de documentos relevantes (útiles) debe equilibrar dos objetivos: 1.Predecir cómo están representados o indexados los documentos que le van a ser útiles. El que busca en un SBD debe tratar de predecir –Los términos que han servido para representar un documento en el SBD –Los términos utilizados para representar documentos no relevantes

2º Periodismo Documentación Informativa David Rodríguez Mateos Cómo recuperar documentos relevantes La recuperación de documentos relevantes (útiles) debe equilibrar dos objetivos: 2. Recuperar un conjunto de documentos lo suficientemente pequeño para visualizarlos y encontrar los más útiles Criterio de predicción ideal: conjunto de palabras, frases o descripciones contextuales que representan únicamente al conjunto de documentos relevantes en los que se está interesado. Importa el objetivo final, no solo la estrategia inicial El número de documentos recuperados en una búsqueda debe ser más pequeño que el punto de futilidad del usuario = el número máximo de documentos recuperados que la persona que busca está dispuesto a visualizar

2º Periodismo Documentación Informativa David Rodríguez Mateos ¿Cómo representar la información para que pueda ser recuperada? La representación de datos es un conjunto de descripciones completas del dato que se referencia: una dirección, un precio, etc. La representación de documentos es una representación incompleta del contenido intelectual o contexto del documento –Incluso cuando se trata de SBD (a texto completo) Muchas SRI son híbridos –Tienen los contenidos a texto completo –Añaden una parte de BD (campos de descripción documental) Pero ni siquiera así se pueden cubrir todos los posibles puntos de acceso a un documento  PROBLEMA LINGÜISTICO –¿De cuántas formas se pueden mencionar todos los temas tratados en un documento?

2º Periodismo Documentación Informativa David Rodríguez Mateos Algunos parámetros de evaluación de SRI Tiempos –De entrada –Para una búsqueda simple –Para una búsqueda complicada –Para truncados –Para visualizar índices –Para visualizar resultados –Para imprimir resultados –Para descargar registros –Para comenzar una nueva sesión –Para salir

2º Periodismo Documentación Informativa David Rodríguez Mateos Algunos parámetros de evaluación de SRI Módulo de búsqueda –Permite perfiles de usuario –Operadores booleanos –Operadores de proximidad –Adyacencia según un orden –Adyacencia sin orden –N palabras entre dos términos –La misma frase –El mismo descriptor –En el mismo subcampo –En el mismo campo –Operadores relacionales –>,<,=, intervalos, fuera de intervalos

2º Periodismo Documentación Informativa David Rodríguez Mateos Algunos parámetros de evaluación de SRI Módulo de búsqueda –Truncados –De longitud definida –De longitud indefinida –Truncado a la izquierda –Recuperación de singulares y plurales –Corrección de las expresiones de búsqueda –Longitud máxima de una expresión de búsqueda –Combinación de búsquedas –Búsquedas por índices de campos –Que el índice se sitúe en el término según tecleamos –Número máximo de términos que se pueden elegir del índice. –Historial de búsqueda –Borrado de búsquedas anteriores –Existencia de tesauro

2º Periodismo Documentación Informativa David Rodríguez Mateos Algunos parámetros de evaluación de SRI Visualización de la información –Visualizar los resultados de cualquier búsqueda sin tener que volver a realizarla –Número de formatos de visualización –Definición de formatos por el usuario –Guardar y reutilizar los formatos de usuario –Ir hacia delante y hacia atrás en la visualización –Visualizar un registro concreto, por su número –Marcar los registros que se necesitan –Marcar los registros que no se necesitan –Que resalte los términos por los que se ha buscado

2º Periodismo Documentación Informativa David Rodríguez Mateos Algunos parámetros de evaluación de SRI Salidas de la información –Imprimir o descargar –Número de registros que se pueden imprimir (se puede ajustar) –Salida sólo de los registros marcados o de un intervalo de registros –Capacidad del usuario para definir, guardar y reutilizar formatos de salida –Descarga de la estrategia junto con los resultados –Clasificar la salida por uno o más campos

2º Periodismo Documentación Informativa David Rodríguez Mateos Efectividad de los SRI Medida por dos parámetros –Exhaustividad De todos los posibles documentos relevantes en un SRI, ¿qué porcentaje hemos encontrado en nuestra búsqueda? –Puede haber otros documentos relevantes que no hayamos encontrado = SILENCIO –Precisión De todos los documentos encontrados tras una búsqueda en un SRI, ¿qué porcentaje incluye documentos relevantes? –Puede haber documentos recuperados que no sean relevantes (no nos sirvan) = RUIDO

2º Periodismo Documentación Informativa David Rodríguez Mateos Efectividad de los SRI RELEVANTENO RELEVANTE RECUPERADOAB NO RECUPERADO CD Exhaustividad = a/(a+c) Nº docs. relevantes recup. / nº docs. relevantes Precisión = a/(a+b)  Nº docs. relevantes recuperados / nº docs. recuperados

2º Periodismo Documentación Informativa David Rodríguez Mateos Efectividad de un SRI Principio que guía una búsqueda –Una búsqueda debe alcanzar alta exhaustividad Recuperando casi todo aquello que es relevante Manteniendo al mismo tiempo una alta precisión Rechazando una gran proporción de lo que no se desea Realidad de una búsqueda –Exhaustividad y precisión tienden a variar inversamente A mayor precisión menor exhaustividad, y viceversa. –¿Cómo se alcanzaría la "perfecta" exhaustividad? Recuperando toda la base de datos  precisión nula. ¿Cómo se alcanzaría la precisión "perfecta"? –Conociendo y recuperando previamente un documento que sabemos que se adecúa a lo que buscamos. –Pero la exhaustividad sería nula

2º Periodismo Documentación Informativa David Rodríguez Mateos Los grandes problemas de la recuperación de la información 1.¿Qué significa relevancia? Si se realizan dos búsquedas en un SRI, y se recupera un documento que ya se conoce, puede resultar no relevante  No aporta nueva información 2.¿Cómo se mide la exhaustividad cuando su definición requiere conocer el número de documentos relevantes no recuperados? Cuánto más grande es el número de documentos, más difícil resulta saber cuáles de ellos podrían ser relevantes para una determinada búsqueda

2º Periodismo Documentación Informativa David Rodríguez Mateos Bibliografía HERNÁNDEZ PÉREZ, Antonio. "La búsqueda y recuperación de información en Internet." En: CARIDAD SEBASTIÁN, Mercdes (coordinadora). La sociedad de la información: Política, Tecnología e Industria de los contenidos. Madrid: Centro de Estudios Ramón Areces, p RODRÍGUEZ YUNTA, Luis. "Evaluación e indicadores de calidad en bases de datos." En: Revista Española de Documentación Científica, vol. 21, nº 1, (1998), p VALLE GASTAMINZA, Félix del. Teoría de la recuperación de información. Curso 2003/ [Consulta: 24/01/2005]