La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México.

Presentaciones similares


Presentación del tema: "La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México."— Transcripción de la presentación:

1 La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México 2010

2 El proceso de recuperación de información en la Web Creación de contenidos Datos en la Web Resultados NO significativos Información Conocimiento Reporta El usuario transforma en

3 ¿Qué es la web semántica? Semántica Relativa al significado de las palabras o vocablos en función de una lengua y un contexto. Es decir, las palabras tienen un significado particular para una comunidad establecida Por tanto, la web semántica es, por definición, aquélla donde los contenidos tienen un significado preciso para una comunidad determinada

4 ¿Qué es la web semántica? Una ampliación de la web actual Un espacio donde los datos tienen un significado bien definido en función de su contexto Los datos se convierten, mediante un proceso de organización, en información llena de significado La organización puede ser realizada por humanos o por procesos computarizados La información puede ser usada por diferentes softwares (uso de una infraestructura común), permitiendo la búsqueda, recuperación e integración de manera más eficiente durante los procesos de búsqueda y recuperación (interoperabilidad) El usuario puede encontrar respuesta a sus cuestionamientos de manera más rápida y sencilla (eficiencia) porque la información puede ser interpretada tanto por personas como por procesos computacionales (agentes)

5 Condiciones para que funcione la Web Semántica Descripción Representación de los contenidos Lenguajes documentales Significado

6 El proceso de recuperación de información en la Web semántica Creación de contenidos Datos en la Web Información Resultados significativos Conocimiento Organización Conversión a Reporta El usuario transforma en

7 Organización Descriptiva Forma Soporte Creación Obra Ubicación Propiedad Representación Contenido Contenido intelectual del documento Clasificación Indización Puntos de acceso Representación Metadatos

8 Dado lo anterior, la web semántica no puede funcionar sin una herramienta que de significado al contenido a través de un vocabulario específico y las relaciones de los términos en función de un contexto Los lenguajes documentales

9 Libres (naturales) Descriptores libres Palabras clave Folksonomías Controlados Vocabularios Encabezamientos de materia Sistemas de clasificación Taxonomías Tesauros Ontologías Mapas conceptuales Mapas de tópicos o mapas temáticos

10 Los lenguajes documentales Libres (naturales) Características: Exhaustivos Imprecisos Polisemia Sinonimia Sin contexto No relacionales Controlados Características: Preciso Menor polisemia Menor sinonimia Contextuales Representan un área (o varias) del conocimiento Relacionales Facetados

11 Lenguajes controlados Herramientas para la representación y organización del conocimiento Enfatizan los aspectos fundamentales del contenido del objeto de información Facilitan la búsqueda precisa pero también la búsqueda de contexto

12 Permite al usuario buscar sin tener que conocer la estructura del propio lenguaje Usa términos que son adecuados al contexto y conocidos en el ambiente del usuario (uso) Permite conocer las relaciones preestablecidas en el propio lenguaje de manera que obtenga un panorama más amplio (precoordinación) Permite al usuario establecer relaciones durante el proceso de búsqueda (postcoordinación) Un buen lenguaje controlado es aquel que:

13 Los lenguajes controlados Vocabularios – Listado de términos. Finalidad: agrupar y controlar Encabezamientos de materia – Lenguaje precoordinado con sintaxis no natural. Representación de una colección a partir de conceptos, formas, etc., y sus relaciones jerárquicas. Finalidad: localizar Sistemas de clasificación – Organización del conocimiento mediante la categorización y la jerarquización, uso de nomenclatura natural o artificial. Relaciones al mismo nivel: difusas, a menos que sean facetados. Finalidad: clasificar y localizar

14 Los lenguajes controlados Taxonomías – Organización del conocimiento mediante la categorización y la jerarquización en estructura plana. Normalmente basadas en conceptos. Finalidad: clasificar Tesauros – Sintaxis natural. Organización del conocimiento en base a conceptos y sus relaciones jerárquicas, equivalencias y asociaciones. Términos preferentes. Multijerárquicos. Finalidad: localizar

15 Los lenguajes controlados Ontologías – –Diversos tipos: Terminológicas y de Información –Tesauros más avanzados. –Incluyen taxonomías. –Representación del conocimiento a partir de los conceptos y sus relaciones –Delimita propiedades, características: rasgos y atributos –Facetas –Mayor variedad de relaciones –Modelos conceptuales –Finalidad: Almacenamiento de conocimiento (vertido en términos que representan conceptos) para ser usado por varios sistemas automáticos (reusabilidad)

16 Los lenguajes controlados Ontologías – –En teoría, son una de las piezas clave para la comunicación entre organizaciones, personas y aplicaciones y así facilitar la interoperabilidad entre sistemas. Gracias al conocimiento almacenado en las ontologías, los agentes inteligentes podrían extraer directamente datos de las páginas web, procesarlos y hacer inferencias. Sin embargo, esta funcionalidad actualmente aún no está disponible fuera de dominios reducidos. (Vallez, Mari, 2010)

17 Parámetros de la indización de los documentos Pertinencia – Utilidad real de los resultados de búsqueda Exhaustividad – Representación suficiente de los contenidos Especificidad – Eliminación de ambigüedades, asociación de términos correcta y jerarquización adecuada Uniformidad – Coincidencia de los términos de búsqueda con los términos usados para la descripción

18 Entonces… Bien desarrollados, los lenguajes controlados optimizan la recuperación de la información porque: 1.Evitan la dispersión de la información debido a la estructuración del conocimiento 2.Evitan la polisemia y la sinonimia porque establecen relaciones entre los términos con significados diferentes y significados iguales 3.Dan significado a los términos con los que se describe el contenido de un recurso porque son sistemas semánticos 4.Establecen las relaciones entre los términos de búsqueda, no la tiene que hacer el usuario

19 En conclusión Una búsqueda en la web utilizando un buscador normal, tipo Google, reporta un número infinito de resultados; la gran mayoría de ellos no tienen ni relevancia ni pertinencia El uso de un lenguaje controlado en la web semántica, que permite la búsqueda contextual, equivale, según los estudios realizados, a la reducción de más del 70% del número de resultados Así, el acceso a la información se hace más eficiente y expedito, proporcionando resultados a través de búsquedas más sencillas usando términos que corresponden al contexto del interesado

20 Si y solo sí Derecho de acceso a la información Transparencia Disponibilidad Suficiencia Claridad Oportunidad Facilidad de acceso Disponibilidad Suficiencia Claridad Oportunidad Facilidad de acceso Organización Representación Requiere


Descargar ppt "La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México."

Presentaciones similares


Anuncios Google