La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

La web semántica y su impacto en la recuperación de información

Presentaciones similares


Presentación del tema: "La web semántica y su impacto en la recuperación de información"— Transcripción de la presentación:

1 La web semántica y su impacto en la recuperación de información
Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México 2010

2 El proceso de recuperación de información en la Web
Creación de contenidos Datos en la Web Resultados NO significativos Información Conocimiento Reporta El usuario transforma en El usuario transforma en

3 ¿Qué es la web semántica?
Relativa al significado de las palabras o vocablos en función de una lengua y un contexto. Es decir, las palabras tienen un significado particular para una comunidad establecida Por tanto, la web semántica es, por definición, aquélla donde los contenidos tienen un significado preciso para una comunidad determinada

4 ¿Qué es la web semántica?
Una ampliación de la web actual Un espacio donde los datos tienen un significado bien definido en función de su contexto Los datos se convierten, mediante un proceso de organización, en información llena de significado La organización puede ser realizada por humanos o por procesos computarizados La información puede ser usada por diferentes softwares (uso de una infraestructura común), permitiendo la búsqueda, recuperación e integración de manera más eficiente durante los procesos de búsqueda y recuperación (interoperabilidad) El usuario puede encontrar respuesta a sus cuestionamientos de manera más rápida y sencilla (eficiencia) porque la información puede ser interpretada tanto por personas como por procesos computacionales (agentes)

5 Condiciones para que funcione la Web Semántica
Descripción Representación de los contenidos Lenguajes documentales Significado

6 El proceso de recuperación de información en la Web semántica
Organización Creación de contenidos Datos en la Web Información Resultados significativos Conocimiento Conversión a Reporta El usuario transforma en

7 Organización Metadatos Descriptiva Contenido Forma Soporte Creación
Obra Ubicación Propiedad Representación Contenido intelectual del documento Clasificación Indización Puntos de acceso Representación

8 Los lenguajes documentales
Dado lo anterior, la web semántica no puede funcionar sin una herramienta que de significado al contenido a través de un vocabulario específico y las relaciones de los términos en función de un contexto Los lenguajes documentales

9 Los lenguajes documentales
Libres (naturales) Controlados Descriptores libres Palabras clave Folksonomías Vocabularios Encabezamientos de materia Sistemas de clasificación Taxonomías Tesauros Ontologías Mapas conceptuales Mapas de tópicos o mapas temáticos

10 Los lenguajes documentales
Libres (naturales) Controlados Características: Exhaustivos Imprecisos Polisemia Sinonimia Sin contexto No relacionales Características: Preciso Menor polisemia Menor sinonimia Contextuales Representan un área (o varias) del conocimiento Relacionales Facetados

11 Lenguajes controlados
Herramientas para la representación y organización del conocimiento Enfatizan los aspectos fundamentales del contenido del objeto de información Facilitan la búsqueda precisa pero también la búsqueda de contexto

12 Un buen lenguaje controlado es aquel que:
Permite al usuario buscar sin tener que conocer la estructura del propio lenguaje Usa términos que son adecuados al contexto y conocidos en el ambiente del usuario (uso) Permite conocer las relaciones preestablecidas en el propio lenguaje de manera que obtenga un panorama más amplio (precoordinación) Permite al usuario establecer relaciones durante el proceso de búsqueda (postcoordinación)

13 Los lenguajes controlados
Vocabularios – Listado de términos. Finalidad: agrupar y controlar Encabezamientos de materia – Lenguaje precoordinado con sintaxis no natural. Representación de una colección a partir de conceptos, formas, etc., y sus relaciones jerárquicas. Finalidad: localizar Sistemas de clasificación – Organización del conocimiento mediante la categorización y la jerarquización, uso de nomenclatura natural o artificial. Relaciones al mismo nivel: difusas, a menos que sean facetados. Finalidad: clasificar y localizar

14 Los lenguajes controlados
Taxonomías – Organización del conocimiento mediante la categorización y la jerarquización en estructura plana. Normalmente basadas en conceptos. Finalidad: clasificar Tesauros – Sintaxis natural. Organización del conocimiento en base a conceptos y sus relaciones jerárquicas, equivalencias y asociaciones. Términos preferentes. Multijerárquicos. Finalidad: localizar

15 Los lenguajes controlados
Ontologías – Diversos tipos: Terminológicas y de Información Tesauros más avanzados. Incluyen taxonomías. Representación del conocimiento a partir de los conceptos y sus relaciones Delimita propiedades, características: rasgos y atributos Facetas Mayor variedad de relaciones Modelos conceptuales Finalidad: Almacenamiento de conocimiento (vertido en términos que representan conceptos) para ser usado por varios sistemas automáticos (reusabilidad)

16 Los lenguajes controlados
Ontologías – “En teoría, son una de las piezas clave para la comunicación entre organizaciones, personas y aplicaciones y así facilitar la interoperabilidad entre sistemas. Gracias al conocimiento almacenado en las ontologías, los agentes inteligentes podrían extraer directamente datos de las páginas web, procesarlos y hacer inferencias. Sin embargo, esta funcionalidad actualmente aún no está disponible fuera de dominios reducidos.” (Vallez, Mari, 2010)

17 Parámetros de la indización de los documentos
Pertinencia – Utilidad real de los resultados de búsqueda Exhaustividad – Representación suficiente de los contenidos Especificidad – Eliminación de ambigüedades, asociación de términos correcta y jerarquización adecuada Uniformidad – Coincidencia de los términos de búsqueda con los términos usados para la descripción

18 Entonces… Bien desarrollados, los lenguajes controlados optimizan la recuperación de la información porque: Evitan la dispersión de la información debido a la estructuración del conocimiento Evitan la polisemia y la sinonimia porque establecen relaciones entre los términos con significados diferentes y significados iguales Dan significado a los términos con los que se describe el contenido de un recurso porque son sistemas semánticos Establecen las relaciones entre los términos de búsqueda, no la tiene que hacer el usuario

19 En conclusión Una búsqueda en la web utilizando un buscador normal, tipo Google, reporta un número infinito de resultados; la gran mayoría de ellos no tienen ni relevancia ni pertinencia El uso de un lenguaje controlado en la web semántica, que permite la búsqueda contextual, equivale, según los estudios realizados, a la reducción de más del 70% del número de resultados Así, el acceso a la información se hace más eficiente y expedito, proporcionando resultados a través de búsquedas más sencillas usando términos que corresponden al contexto del interesado

20 Derecho de acceso a la información
Transparencia Si y solo sí Disponibilidad Suficiencia Claridad Oportunidad Facilidad de acceso Organización Representación Requiere


Descargar ppt "La web semántica y su impacto en la recuperación de información"

Presentaciones similares


Anuncios Google