La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción

Presentaciones similares


Presentación del tema: "Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción"— Transcripción de la presentación:

1 Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción http://www.inf.udec.cl/~andrea

2 Definición Recuperación de información es un término convencionalmente usado para denotar el proceso por el cual un usuario es informado de la existencia (o no existencia) del documento que ha solicitado. No es un proceso que cambia el conocimiento del usuario con respecto a un tema específico, sistemas de pregunta- respuesta, ni un proceso de recuperación de datos.

3 Motivación IR: representación, almacenamiento, organización y acceso de ítems de información Se centra en las necesidades del usuario Necesidad de un usuario: Encuentre todos los documentos que contengan información de conferencias en ciencias de la computación y que: (1) hayan ocurrido en Europa o EEUU (2) durante los últimos 2 años. El énfasis es en la recuperación de información y no en los datos.

4 Datos versus Información Recuperación de Datos Recuperación de Información CorrespondenciaExactaParcial ModeloDeterminísticoProbabilístico Lenguaje/ especificación Artificial/completaNatural/incompleta Tolerancia a errorsensibleno sensible

5 Sistema IR Interpreta contenidos de ítems de información Genera un ranking que refleja una relevancia La noción de relevancia es muy importante

6 Motivación IR inicialmente vista como una área particular: clasificación y categorización sistemas y lenguajes interfaz de usuarios y visualización Aparece la Web y IR adquiere mayor relevancia repositorio universal bajo costo de acceso no existe una editorial centralizada muchos problemas relacionados con IR

7 Tareas de Usuario Recuperación información o datos basado en própositos Browsing exploración Retrieval Browsing Database

8 Conceptos Básicos Vista lógica de documentos structure Accents spacing stopwords Noun groups stemming Manual indexing Docs structureFull textIndex terms

9 User Interface Text Operations Query Operations Indexing Searching Ranking Index Text query user need user feedback ranked docs retrieved docs logical view inverted file DB Manager Module 4, 10 6, 7 58 2 8 Text Database Text The Retrieval Process

10 Proceso de Recuperación Sistemas IR usan términos llamados índices para procesar consultas Índices o palabras claves: una palabra clave o un conjunto de palabras seleccionadas cualquier palabra Stemming: connect: connecting, connection, connections Una estructura de indexación (índice invertidos) es construida para los índices escogidos.

11 Docs Usuario índices doc query Ranking match

12 Desafíos Matching a nivel de índices es impreciso Los usuarios no quedan muy satisfechos Los usurios no tienen experiencia en consultas Relevancia es crítica

13 Medidas de Evaluación Recall: |R*|/|R| Precision: |R*|/|A|

14 Medidas de Evaluación Precision promedio: Corresponde al promedio de la precisión después de cada nuevo documento relevante observado. R-precision: Es la precisión al R th documento relevante recuperado. Histogramas: Compara dos algoritmos de recuperacion en base a la diferencia en los valores de R th precision para un set de consultas


Descargar ppt "Recuperación de Información M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción"

Presentaciones similares


Anuncios Google