Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción

Slides:



Advertisements
Presentaciones similares
Recuperación de Textos (RTT)‏
Advertisements

Evaluación mediante Medidas de Recuperación
Tema 1. Modelos de RI avanzados
Tema 6. Evaluación de SRIs
Definición de Paradigma y su Relación con la Investigación
CAROLINA ZONA MARYELY TORRES TR 8° SEMESTRE. LA INFORMACION CRECE DE FORMA EXPONENCIAL, Y EL CONOCIMIENTO CIENTIFICO SE PUBLICA EN MUCHAS Y VARIADAS PUBLICACIONES.
Exposición: Clustering
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
Análisis de reportes administrativos
El poder de las redes. Sociedad de la información El acelerado ritmo de apropiación social de las tecnologías de la información proceso de alfabetización.
Tutorial de búsqueda básica en CINAHL
Buscar bibliografía en
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Teórico: Introducción
Danilo Yáñez Alarcón. Avance II
Soluciones de Colaboración con Valor Agregado
WEB SEMANTICA Integrantes: Juan Carreño Ojeda Felipe Salazar Fernández.
INGENIERIA DE REQUERIMIENTOS
Recuperación de Información (IR)
Estrategias de Búsqueda
Optimización de sistemas de trading
El análisis y recuperación de información
SISTEMAS GETIONADORES DE BASES DE DATOS
Modelos de Texto Estructurado M
Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Departamento de Referencia CPICM_C [Hoja Informativa No. 8; 2012]
Especificación de Consultas M
* FRAUSTO JIMENEZ GABRIELA * * HERNANDEZ TORRES ANA LAURA * * MANDUJANO JUAN CARLOS * * NOVA MARIN YARELI PAULINA * * ZAVALA CORTE JOCELYN ARELI *
Greenstone Basado en el trabajo de Jesús Tramullas Depto. CC. Documentación /Univ. de Zaragoza
COLEGIO DE BACHILLERATO "RAFAEL RODRÍGUEZ PALACIOS"
Interfaces y Visualización M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México.
World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
El software como una obra humana.
Proyecto Final de Carrera Gestor de Referencias Bibliográficas Integrado Escuela Politécnica Superior de Albacete (UCLM) Autora: Laura Ruiz Navarro Tutores:
Introducción a las Bases de Datos Relacionales Juan Alberto Sigüenza Escuela Técnica Superior de Informática Universidad Autónoma de Madrid.
Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
WWW: Máquinas de Búsqueda M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
NOMBRES:OLIVARES ALFARO JOSE L. BONETTI ARON GRUPO:308.
Creación y publicación de sitios web R e d d e P r o f e s o r e s I n n o v a d o r e s Módulo: Creación y publicación de Sitios Web.

Indexación M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
 TECNOLOGIAS DE LA INFROMACIONM Y COMUNICACIÓN En este bloque vemos trabajamos con las definiciones de que es Word. Excel y Power point. WORD: Microsoft.
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Ing. Noretsys Rodríguez. Definición de Conceptos  Falla: Ocurre cuando un programa no se comporta de manera adecuada. Es una propiedad estadística de.
Mapas Conceptuales Usando CmapTools.
Diseño de Sistemas.
CURADORES DE CONTENIDO. Definición Los curadores de contenido se utiliza para clasificar, etiquetar, en definitiva filtrar la información que ya existe,
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
LOS PROGRAMAS PARA LAS ASIGNATURAS EN LA ESTRUCTURA DEL PLAN
La Universidad Pedagógica Experimental Libertador
SOFTWARE Se conoce como software al equipamiento lógico o soporte lógico de un sistema informático, que comprende el conjunto de los componentes lógicos.
Búsqueda de Información en Internet
Bases de Datos Unidad 1.
Un sistema de administración de bases de datos DBMS (es un sistema basado en computador (software) que maneja una base de datos, o una colección de bases.
Diseño de Adiestramientos
SISTEMAS COMPUTACIONALES ADMINISTRATIVOS E.E. Fundamentos de Base de Datos 1.8 Estructura de un sistema de base de datos Fuentes: Fundamentos de Bases.
FASE DE DESCRIPCIÓN DEL PROBLEMA En esta fase se debe: [Explicitar, acordar y documentar objetivos y contenidos del producto (qué y por qué). [Caracterizar.
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
LINA PATIÑO Y REINALDO LIZCANO
AFM – Web File Manager Versión 5. Novedades técnicas – Forma de Implementación Siguiendo última tecnología de Microsoft: Framework.NET 3.5 Implementación.
Seminario de Tecnologías de Información Emergentes Agosto-Diciembre, 2007 Sesión # 3.
Estrategias efectivas para buscar y encontrar información Dr. Valentino Morales López Investigador INFOTEC Centro de Investigación.
El portafolio en el trabajo docente. Niveles de media y Superior.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
En Internet: Los datos se transforman en información cuando una persona los lee, los comprende y los usa con algún fin: para estudiar, para trabajar,
Conociendo el modelo Cliente-Servidor
Preguntas de la pagina de las pagina 52. 1: Complete: Las bases de datos se pueden clasificar de acuerdo a su……MODELO…..de datos. Este modelo mas utilizado.
Clase invertida Características: ● Los temas de la clase, con enviados como investigaciones para fuera de la clase. ● Las investigaciones se pueden utilizar.
Transcripción de la presentación:

Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción

Definición Recuperación de información es un término convencionalmente usado para denotar el proceso por el cual un usuario es informado de la existencia (o no existencia) del documento que ha solicitado. No es un proceso que cambia el conocimiento del usuario con respecto a un tema específico, sistemas de pregunta- respuesta, ni un proceso de recuperación de datos.

Motivación IR: representación, almacenamiento, organización y acceso de ítems de información Se centra en las necesidades del usuario Necesidad de un usuario: Encuentre todos los documentos que contengan información de conferencias en ciencias de la computación y que: (1) hayan ocurrido en Europa o EEUU (2) durante los últimos 2 años. El énfasis es en la recuperación de información y no en los datos.

Datos versus Información Recuperación de Datos Recuperación de Información CorrespondenciaExactaParcial ModeloDeterminísticoProbabilístico Lenguaje/ especificación Artificial/completaNatural/incompleta Tolerancia a errorsensibleno sensible

Sistema IR Interpreta contenidos de ítems de información Genera un ranking que refleja una relevancia La noción de relevancia es muy importante

Motivación IR inicialmente vista como una área particular: clasificación y categorización sistemas y lenguajes interfaz de usuarios y visualización Aparece la Web y IR adquiere mayor relevancia repositorio universal bajo costo de acceso no existe una editorial centralizada muchos problemas relacionados con IR

Tareas de Usuario Recuperación información o datos basado en própositos Browsing exploración Retrieval Browsing Database

Conceptos Básicos Vista lógica de documentos structure Accents spacing stopwords Noun groups stemming Manual indexing Docs structureFull textIndex terms

User Interface Text Operations Query Operations Indexing Searching Ranking Index Text query user need user feedback ranked docs retrieved docs logical view inverted file DB Manager Module 4, 10 6, Text Database Text The Retrieval Process

Proceso de Recuperación Sistemas IR usan términos llamados índices para procesar consultas Índices o palabras claves: una palabra clave o un conjunto de palabras seleccionadas cualquier palabra Stemming: connect: connecting, connection, connections Una estructura de indexación (índice invertidos) es construida para los índices escogidos.

Docs Usuario índices doc query Ranking match

Desafíos Matching a nivel de índices es impreciso Los usuarios no quedan muy satisfechos Los usurios no tienen experiencia en consultas Relevancia es crítica

Medidas de Evaluación Recall: |R*|/|R| Precision: |R*|/|A|

Medidas de Evaluación Precision promedio: Corresponde al promedio de la precisión después de cada nuevo documento relevante observado. R-precision: Es la precisión al R th documento relevante recuperado. Histogramas: Compara dos algoritmos de recuperacion en base a la diferencia en los valores de R th precision para un set de consultas