La web semántica y su impacto en la recuperación de información

Slides:



Advertisements
Presentaciones similares
Búsqueda de una frase exacta
Advertisements

UNIVERSIDAD POLITÉCNICA DE MADRID UNIVERSIDAD CARLOS III DE MADRID
TERMINOLOGÍA EN ESPAÑOL
María Simarro Vázquez 4. LA DOCUMENTACIÓN ESPECIALIZADA.
TECNICATURA UNIVERSITARIA EN INFORMATICA
Introducción a LAS Bases de Datos
7ª Jornada sobre la Biblioteca Digital Universitaria JBDU2009 "La biblioteca universitaria en la web" 5 y 6 de noviembre de 2009 Biblioteca Central de.
Herramientas para la Investigación
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
MÉTODOS Y ELEMENTOS DE PROGRAMACIÓN
Servicios Web.
Ontologías y Bases de Datos
Understanding SOA Design Patterns
WEB SEMANTICA Integrantes: Juan Carreño Ojeda Felipe Salazar Fernández.
Cómo consultar una base de datos o un catálogo en 5 minutos
VINCULOS E HIPERVINCULOS
Seminario de Análisis Documental
Estrategias de Búsqueda
DE LAS CUENTAS DE USUARIO Y OPCIONES DE CARPETA
Sindy Carolina Asprilla
Desarrollo de un sistema de clasificación de recursos electrónicos en el ámbito de la lógica matemática” Autor: Antonio Sarasa Cabezuelo Directora: María.
ESTRATEGIAS DE BÚSQUEDA
Buscador Es un sistema informático que busca archivos almacenados en servidores web HERRAMIENTAS DE COMPUTACION I.
El análisis y recuperación de información
Representación del Conocimiento
Web Semántica M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Lo bucadores son sistemas que permite al usuario buscar información,estos la consiguen de la web, pero otroa tanto la obtienen del news,gopher,ftp,etc.
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
Dirección Provincial de Información y Planeamiento Educativo
MODELOS DE BASES DE DATOS
Qué es un tesauro y para qué sirve
 El primer navegador Web incluía un lenguaje de estilo interno que utilizaba dicho navegador para mostrar las páginas HTML.  Sin embargo estos primeros.
Dirección Provincial de Información y Planeamiento Educativo
BASES DE DATOS INTRODUCCION
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
Sistemas de Información IS95872
Procesamiento Práctico del lenguaje Natural Capítulo XXIII.
(Organización y Manejo de Archivos)
Análisis y Diseño Orientado a Objetos utilizando UML
Google Objetivos: comprender y conocer los beneficios que nos entrega este buscador. Nombres: -Javiera Arratia -Milena Pereira Curso: 2ºMedio B Fecha:
Manejo Eficiente de la información en el siglo XXI
Integrantes: Jorge Herrera M. Carlos Rodríguez R..
Clase 3 complementaria Tecnología de la Comunicación I Estrategias de búsqueda.
Técnicas de Indización y Resumen Félix del Valle Gastaminza 5º A Licenciatura en Documentación Curso
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS

Tesauros y descriptores en Ciencias de la Salud MeSH/DeCS
Considerada como la actividad en la cual se realiza una investigación de la literatura existente sobre un tema en particular, con el fin, de identificar.
BUSCADORES.
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Búsqueda de información
WEB SEMÁNTICA.
Creado por: Ángela Pico
EL ANALISIS DE CONTENIDO
Ingeniería de Requisitos
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
Fundamentos de Sistemas Expertos
METADATOS Definicion: «datos sobre datos», «informaciones sobre datos», «datos sobre informaciones» e «informaciones sobre informaciones».
Definición objeto de aprendizaje y propiedades Integrantes Edgar Misael Mata Vazquez Luis Angel Espinosa Arroyo Brenda Carolina Peña Garza Claudia Nataly.
Estrategias eficientes para buscar y encontrar
CONCEPTO DE SISTEMA DE RECUPERACION DE INFORMACION Proceso donde se accede a una información previamente almacenada, mediante herramientas informáticas.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
En Internet: Los datos se transforman en información cuando una persona los lee, los comprende y los usa con algún fin: para estudiar, para trabajar,
BUSINESS T&G Think & Grow Uniclass Gestión Documental Solución Web para Mejorar la Captura y Gestión.
Diccionario/Directorio de Datos
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Entorno de Recomendación para el Desarrollo de Objetos de Aprendizaje Manuel E. Prieto Universidad de Castilla-La Mancha, España Victor H. Menéndez Universidad.
Gestión del Conocimento MBA Luis Elissondo. Definición de KM Knowledge Management Es el proceso de administrar y aprovechar de forma sistemática y activa.
INSTITUTO DE ESTUDIOS SUPERIORES DEL ESTADO DE CHIAPAS UNIVERSIDAD SALAZAR NARVAES Materia Informática Médica Docente: MTRO. Alfredo Alfaro Magdaleno Alumnos:
Transcripción de la presentación:

La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México 2010

El proceso de recuperación de información en la Web Creación de contenidos Datos en la Web Resultados NO significativos Información Conocimiento Reporta El usuario transforma en El usuario transforma en

¿Qué es la web semántica? Relativa al significado de las palabras o vocablos en función de una lengua y un contexto. Es decir, las palabras tienen un significado particular para una comunidad establecida Por tanto, la web semántica es, por definición, aquélla donde los contenidos tienen un significado preciso para una comunidad determinada

¿Qué es la web semántica? Una ampliación de la web actual Un espacio donde los datos tienen un significado bien definido en función de su contexto Los datos se convierten, mediante un proceso de organización, en información llena de significado La organización puede ser realizada por humanos o por procesos computarizados La información puede ser usada por diferentes softwares (uso de una infraestructura común), permitiendo la búsqueda, recuperación e integración de manera más eficiente durante los procesos de búsqueda y recuperación (interoperabilidad) El usuario puede encontrar respuesta a sus cuestionamientos de manera más rápida y sencilla (eficiencia) porque la información puede ser interpretada tanto por personas como por procesos computacionales (agentes)

Condiciones para que funcione la Web Semántica Descripción Representación de los contenidos Lenguajes documentales Significado

El proceso de recuperación de información en la Web semántica Organización Creación de contenidos Datos en la Web Información Resultados significativos Conocimiento Conversión a Reporta El usuario transforma en

Organización Metadatos Descriptiva Contenido Forma Soporte Creación Obra Ubicación Propiedad Representación Contenido intelectual del documento Clasificación Indización Puntos de acceso Representación

Los lenguajes documentales Dado lo anterior, la web semántica no puede funcionar sin una herramienta que de significado al contenido a través de un vocabulario específico y las relaciones de los términos en función de un contexto Los lenguajes documentales

Los lenguajes documentales Libres (naturales) Controlados Descriptores libres Palabras clave Folksonomías Vocabularios Encabezamientos de materia Sistemas de clasificación Taxonomías Tesauros Ontologías Mapas conceptuales Mapas de tópicos o mapas temáticos

Los lenguajes documentales Libres (naturales) Controlados Características: Exhaustivos Imprecisos Polisemia Sinonimia Sin contexto No relacionales Características: Preciso Menor polisemia Menor sinonimia Contextuales Representan un área (o varias) del conocimiento Relacionales Facetados

Lenguajes controlados Herramientas para la representación y organización del conocimiento Enfatizan los aspectos fundamentales del contenido del objeto de información Facilitan la búsqueda precisa pero también la búsqueda de contexto

Un buen lenguaje controlado es aquel que: Permite al usuario buscar sin tener que conocer la estructura del propio lenguaje Usa términos que son adecuados al contexto y conocidos en el ambiente del usuario (uso) Permite conocer las relaciones preestablecidas en el propio lenguaje de manera que obtenga un panorama más amplio (precoordinación) Permite al usuario establecer relaciones durante el proceso de búsqueda (postcoordinación)

Los lenguajes controlados Vocabularios – Listado de términos. Finalidad: agrupar y controlar Encabezamientos de materia – Lenguaje precoordinado con sintaxis no natural. Representación de una colección a partir de conceptos, formas, etc., y sus relaciones jerárquicas. Finalidad: localizar Sistemas de clasificación – Organización del conocimiento mediante la categorización y la jerarquización, uso de nomenclatura natural o artificial. Relaciones al mismo nivel: difusas, a menos que sean facetados. Finalidad: clasificar y localizar

Los lenguajes controlados Taxonomías – Organización del conocimiento mediante la categorización y la jerarquización en estructura plana. Normalmente basadas en conceptos. Finalidad: clasificar Tesauros – Sintaxis natural. Organización del conocimiento en base a conceptos y sus relaciones jerárquicas, equivalencias y asociaciones. Términos preferentes. Multijerárquicos. Finalidad: localizar

Los lenguajes controlados Ontologías – Diversos tipos: Terminológicas y de Información Tesauros más avanzados. Incluyen taxonomías. Representación del conocimiento a partir de los conceptos y sus relaciones Delimita propiedades, características: rasgos y atributos Facetas Mayor variedad de relaciones Modelos conceptuales Finalidad: Almacenamiento de conocimiento (vertido en términos que representan conceptos) para ser usado por varios sistemas automáticos (reusabilidad)

Los lenguajes controlados Ontologías – “En teoría, son una de las piezas clave para la comunicación entre organizaciones, personas y aplicaciones y así facilitar la interoperabilidad entre sistemas. Gracias al conocimiento almacenado en las ontologías, los agentes inteligentes podrían extraer directamente datos de las páginas web, procesarlos y hacer inferencias. Sin embargo, esta funcionalidad actualmente aún no está disponible fuera de dominios reducidos.” (Vallez, Mari, 2010)

Parámetros de la indización de los documentos Pertinencia – Utilidad real de los resultados de búsqueda Exhaustividad – Representación suficiente de los contenidos Especificidad – Eliminación de ambigüedades, asociación de términos correcta y jerarquización adecuada Uniformidad – Coincidencia de los términos de búsqueda con los términos usados para la descripción

Entonces… Bien desarrollados, los lenguajes controlados optimizan la recuperación de la información porque: Evitan la dispersión de la información debido a la estructuración del conocimiento Evitan la polisemia y la sinonimia porque establecen relaciones entre los términos con significados diferentes y significados iguales Dan significado a los términos con los que se describe el contenido de un recurso porque son sistemas semánticos Establecen las relaciones entre los términos de búsqueda, no la tiene que hacer el usuario

En conclusión Una búsqueda en la web utilizando un buscador normal, tipo Google, reporta un número infinito de resultados; la gran mayoría de ellos no tienen ni relevancia ni pertinencia El uso de un lenguaje controlado en la web semántica, que permite la búsqueda contextual, equivale, según los estudios realizados, a la reducción de más del 70% del número de resultados Así, el acceso a la información se hace más eficiente y expedito, proporcionando resultados a través de búsquedas más sencillas usando términos que corresponden al contexto del interesado

Derecho de acceso a la información Transparencia Si y solo sí Disponibilidad Suficiencia Claridad Oportunidad Facilidad de acceso Organización  Representación Requiere