La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción a la Web Semántica (Curso en Buenos Aires. SIU)

Presentaciones similares


Presentación del tema: "Introducción a la Web Semántica (Curso en Buenos Aires. SIU)"— Transcripción de la presentación:

1 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Octubre 2009 Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación Introducción a la Web Semántica: vocabularios, tecnologías y estándares 30/Oct/2009 Eva Méndez. Universidad Carlos III de Madrid

2 Esta presentación es vuestra en:
Presentaciones Recursos Programa Bibliografía

3 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Contenidos / Programa Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica. La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW),etc. Web Semántica, Servicios Web y la Recuperación de información en la WWW. Estándares para la Web y estándares para la Web Semántica: RDF/XML Conceptos clave en la SW: metadatos, ontologías, agentes, etc. Ejemplos y casos de uso de la Web Semántica. Buscadores semánticos Búsqueda de ontologías, vocabularios y reutilización de ontologías Algunas aplicaciones para trabajar con la Web Semántica: Creación de ontologías y tesauros SKOSificados (Protégé, ThManager), creación de perfiles FOAF, etc. Estándares y Tecnologías para la Representación del Conocimiento en la Web Semántica. RDF y Metadatos: DCMI-DCAM RDF y Tesauros: SKOS RDF y Ontologías: OWL RDF y Redes sociales: FOAF Microformatos: Web Semántica en minúsculas Discusión sobre el futuro de la Web Semántica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semánticas. Eva Méndez. Universidad Carlos III de Madrid

4 Estándares para la Web y estándares para la Web Semántica: RDF/XML
Conceptos clave en la SW: metadatos, ontologías, agentes, etc

5 SW: Definición tradicional (IA, informática)
“La Web Semántica es una extensión de la actual Web en la que a la información disponible se le otorga (anota o marca con) una semántica bien definida. Está basada en la idea de proporcionar en la Web datos definidos y enlazados, permitiendo que aplicaciones heterogéneas descubran, integren, razonen, utilicen la información presente en la web.” Fuente: Asun Gómez, basado en: Hendler, J., Berners-Lee, T., and Miller, E. Ontologías Anotación

6 SW: una visión desde la Documentación
No es otra versión de la Web: es la Web. Implica crear una interfaz común a todos los conceptos y bases de conocimiento terminológico en la Web. Sistema de información de acceso integrado de datos, términos y conceptos (=información). Aunar distintos recursos que existen en diferentes sistemas o servicios de información digital basados en Web (diccionarios, tesauros, ontologías, esquemas de clasificación, etc): NKOS (Network Knowledge Organization Systems/Services). Facilitar la búsqueda por materias y la ampliación temática CBU (Control Bibliográfico Universal) CWU (Control Web Universal) Semantic Web (global knowledge exchange).

7 SW implica... Lenguajes formales como: (DAML+OIL), RDF, OWL, etc. Metadatos y esquemas de metadatos. Ontologías: tanto específicas de un dominio, como ontologías de alto nivel de tal forma que se proporcionen relaciones entre ontologías para la recuperación, el intercambio y la integración de la información interdisciplinar en la Web.

8 SW implica... Un amplio esquema conceptual que pueda mantener todas los tipos de información semántica y especificar las relaciones entre ellos. Normalmente esto se conoce como “ontologías” pero veremos cómo se pueden crear schemes conceptuales y otros vocabularios para representar los conceptos implicados en un sistema de información. Definición de servicios para interactuar con el sistema: Protocolos y tecnologías que permitan tanto al usuario (humano) como al ordenador (máquina) interpretar la información e interactuar.

9 SW: algo más que XML  Semántica
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Significados legibles por máquina (codificar la “semántica de mundo”). XML (eXtended Markup Language) ante la semántica. Estándar de representación, metalenguaje para el intercambio de datos/información en la web. Desde un punto de vista estrictamente informático: XML no añade semántica. Por ello, necesita además: metadatos y ontologías (semántica). Eva Méndez. Universidad Carlos III de Madrid

10 Procesamiento automático
SW implica... Semántica Metadatos Ontologías Descripciones Lógica Motores de inferencia semántica Procesamiento automático

11 La Web Semántica y Servicios Web Semánticos (SW+WS)
DAML-S, OWL-S WSMO Se describen utilizando el vocabulario de una ontología y se expresan en algún lenguaje de marcado semántico UDDI, WSDL, SOAP WS Dinámica URI, HTML, HTTP WWW RDF(S), OWL Web Semántica Estática Riqueza semántica

12 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Basado en: Tim Berners Lee, 2000: Octubre 2009 Aplicaciones de la Web Semántica (Web 3.0, Bases de conocimiento, Aplicaciones de negocio) SPARQL Eva Méndez. Universidad Carlos III de Madrid

13 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Basado en: Tim Berners Lee, 2000: Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid

14 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Fuente: Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid

15 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Fueente: Semantic Web Activities: Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid

16 Aproximación a los principales estándares
RDF: Resource Description Framework es el lenguaje principal de la Web Semántica para definir DATOS. Los datos se enlazan como grafos utilizando triples. Los triples consisten en sujeto-predicado-objeto identificados únicamente por un URI. RDFS: RDF Schema es el lenguaje de modelado de datos para RDF (crear vocabularios) OWL: Web Ontology Language es un lenguaje de modelado de datos avanzado para RDF.

17 Aproximación a los principales estándares
SPARQL: Simple Protocol and RDF Query Language (protocolo y lenguaje de interrogación para RDF) RIF: Rule Interchange Format GRDDL: Gleaning Resource Descriptions from Dialects of Languages, para transformar XML y XHTML a RDF SAWSDL: Semantic Annotations for Web Service Definitions (WSDL) típicamente utilizado en modelizaciones RDF y OWL. RDFa: RDF Atributes, para insertar datos estructurados en RDF páginas XHTML

18 RDF, el estándar clave/principal
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 RDF es un estándar propuesto por el W3C para definir la arquitectura necesaria para soportar metadatos (descripciones) sobre recursos web. Es la aplicación XML recomendada por el consorcio para codificar, intercambiar y reutilizar metadatos estructurados. RDF es una base para procesar metadatos; proporciona interoperabilidad entre aplicaciones que intercambian información legible por máquina en la Web. Eva Méndez. Universidad Carlos III de Madrid

19 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
RDF: Definición Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 RDF destaca por la facilidad para permitir un procesamiento legible por máquina de representaciones de recursos Web. RDF hereda todos los conceptos de XML que permiten especificar propiedades de los elementos (por ejemplo, los espacios de nombre o namespaces). Eva Méndez. Universidad Carlos III de Madrid

20 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
RDF: Características Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Basado en XML Es una Infraestructura de Descripción de recursos. RDF propone un modelo de datos coherente y lenguaje de esquema (RDFS) para definir vocabularios. Componentes de RDF: Un modelo de datos formal. Una sintaxis para intercambiar datos. Un esquema. Una sintaxis legible por máquina del esquema. Protocolos de interrogación. Eva Méndez. Universidad Carlos III de Madrid

21 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Componentes de RDF Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Modelo RDF:  asocia tipos de propiedades (atributos) con sus valores. Esquema RDF (RDFS)  proporciona los mecanismos para crear vocabularios y relacionar propiedades y recursos. Namespaces XML:  identifica cada tipo de propiedad de forma unívoca. Eva Méndez. Universidad Carlos III de Madrid

22 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
RDF: Modelo de datos Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 El modelo de datos que propone RDF consiste en tres tipos de objetos: Recursos Tipos de propiedades Descripciones Recurso VALOR TIPO DE PROPIEDAD Propiedad / descripción Eva Méndez. Universidad Carlos III de Madrid

23 RDF: Modelo basado en declaraciones
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 El modelo de datos de RDF está basado, en declaraciones, afirmaciones o aserciones (statements). Una afirmación / sentencia es un predicado de n componentes. Los valores pueden ser: strings, fechas y URIs. SUJETO (recurso) PREDICADO (tipo de propiedad) OBJETO (valor) S, P, O Eva Méndez. Universidad Carlos III de Madrid

24 RDF: Representación gráfica
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 AUTOR Explicando RDF Title DC: EVA “Eva Méndez” Creator “Eva Méndez” “UC3M” BIB: BIB:Aff BIB:Name uc3m Eva Méndez. Universidad Carlos III de Madrid

25 RDF: Propiedades (contenedores)
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 <?xml version="1.0"?> <RDF xmlns=" xmlns:DC=" <Bag ID="pages"> <li resource=" /> <li resource=" /> </Bag> <Description aboutEach="#pages"> <DC:Creator>Ora Lassila</DC:Creator> </Description> </RDF> Eva Méndez. Universidad Carlos III de Madrid

26 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Ejemplo RDF-sintaxis Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 <RDF:RDF> <RDF: Description about= ” <Title> Explicando RDF</Title> <Author>Eva Méndez </Author> </RDF: Description> </RDF:RDF> SELIALIZADA <rdf:RDF xmlns:rdf=" xmlns:dc=" <rdf:Description rdf:about=" dc:creator=”Eva Méndez" dc:title=”Explicando RDF" dc:date=“ " /> </rdf:RDF> ABREVIADA Eva Méndez. Universidad Carlos III de Madrid

27 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
RDF: Esquema Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Cualquier URI de namespace que se usa en RDF debe apuntar a un esquema para el vocabulario. El esquema en RDF describe la semántica y la sintaxis permitida. Se ha convertido en un vocabulario RDF para describir otros vocabularios RDF, por ejemplo SKOS. Eva Méndez. Universidad Carlos III de Madrid

28 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
RDF: Esquema Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Recurso rdfs:Literal Propiedad rdf:type rdf:subClassOf rdfs:subPropertyOf rdfs:comment rdfs:label rdfs:seeAlso rdfs:isDefinedBy ConstraintProperty rdfs:range rdfs:domain Clase rdfs:Resource rdfs:Class rdf:Property rdfs:ConstraitProperty Eva Méndez. Universidad Carlos III de Madrid

29 Validador RDF

30 Buscadores semánticos
2. Ejemplos y casos de uso de la Web Semántica Buscadores semánticos Búsqueda de ontologías, vocabularios y reutilización de ontologías Algunas aplicaciones para trabajar con la Web Semántica

31 La Web semántica… funciona… Mmmm, bueno, empieza a funcionar y a tener casos de uso

32 Navegadores y extensiones: “ver” la SW
Tabulator RDF Browser: Disco - Hyperdata Browser: LENA: Marbles: Piggy Bank:

33 Buscadores: “buscar” la SW
Falcons: Sindice: Watson: Lexxe: MicroSearch (Yahoo): SWSE: Semantic WebSearch: URI Search: Hakia: Worio: Wolframalpha: PowerSet:

34 Buscadores: “buscar” la SW
Yahoo indexa microformatos (Marzo de 2008): hCard, hCalendar, hReview, hAtom, XFN, Dublin Core, Creative Commons, FOAF, GeoRSS, MediaRSS, RDFa y eRDF

35 Buscadores: “buscar” la SW

36 Buscadores de ontologías / vocabularios
SWoogle:

37 Una aplicación en español-ar: TemaTres
Ver ejemplos:

38 3. Estándares y Tecnologías para la Representación del Conocimiento en la Web Semántica.
Microformatos: la Web Semántica “en minúsculas” RDF y Metadatos: DCMI-DCAM RDF y Tesauros: SKOS RDF y Ontologías: OWL RDF y Redes sociales: FOAF

39 Añadir semántica al Doc Digital
DLO AC Automático: Indización y resumen automáticos De autor Profesional AC “manual” Embebido en el propio documento Externo al documento Metadatos Metaetiquetas Microformatos Metadatos Etiquetado social Normalizados Sin Normalizar

40 Microformatos Intentan ser útiles principalmente a las personas y en segundo lugar a las máquinas; para ello aprovechan características de [X]HTML para añadir información semántica en una sección de código [X]HTML. Análisis de contenido “de autor” en la Web 2.0. Los microformatos ofrecen soluciones sencillas a problemas de representación y arquitectura de información concretos en la Web (p. ej.: cómo codificar la información personal de una tarjeta de visita, cómo codificar un evento o cómo ayudar a Technorati a “catalogar” mejor los artículos de las bitácoras. Ejemplo: <a ref=“ rel=”tag”>metadatos </a>

41 Microformatos: ¿cómo? [X]HTML actual Aprovechando los atributos "rel" y "rev" de los vínculos (elementos "a" y "link")... ... y especialmente los atributos "class" e "id" de muchos elementos de [X]HTML

42 Qué microformatos existen
hCard: tarjetas de visita hCalendar: eventos rel-tag: palabras clave para etiquetar post XFN: especifica las relaciones personales ... más, en...

43 Microformatos Operator (add-on Firefox y Flock) - Descarga

44 Se han escrito especificaciones. Existen aplicaciones para generarlos.
Se puede destacar Se han escrito especificaciones. Existen aplicaciones para generarlos. Integrado en Wordpress (XFN). Usuarios-creadores publican microformatos. Existen aplicaciones que se "alimentan" de microformatos y son muy útiles OJO Leer artículo en E-LIS sobre microformatos:

45 La información expresada en microformatos
Y lo más importante La información expresada en microformatos está pensada para las personas... ... y las máquinas (robots y aplicaciones) también pueden encontrarla, extraerla, procesarla y reutilizarla. Conclusión: los microformatos han conseguido en poco tiempo, objetivos de la Web Semántica en contextos concretos, ... Y FUNCIONAN

46 Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos
Febrero 2009 Intentos de normalización del etiquetado social: geotagging, dctagging, etc. Eva Méndez. Universidad Carlos III de Madrid

47 Geotagging Se refiere a la indización geográfica  proceso de añadir metadatos geográficos a DLOs, por ejemplo, sitios Web o elementos de servicios Web 2.0 (p. ej. Imágenes en Flickr) Normalmente las geotags son datos que consignan las coordenadas de longitud y latitud y los nombres de los lugares. Ver: Ver:

48 Geotagging: parte de la geocodificación
La geocodificación es un proceso más complejo que el geotagging que incluye también la capacidad de integrar de manera consistente, metadatos geográficos en la información básica (p. ej. Metadatos EXIF) La geocodificación también puede realizarse tomando códigos o identificadores de lugar que no estén basados en sus coordenadas, p. ej., el código postal, y asociarlos a las coordenadas para crear sistemas de recuperación de información por lugar, más potentes e “inteligentes” La indización geográfica en la Web 2.0 (geocodificación) tiene un gran potencial, por ejemplo, se pueden buscar imágenes tomadas cerca de un lugar específico, o fundamentar un buscador geográfico basado en la long y lat

49 Codificación del etiquetado geográfico
Metadatos [head de HTML] <meta name="geo.position" content=" ; "> <meta name="geo.placename" content="Rockwood Rural Municipality, Manitoba, Canada"> <meta name="geo.region" content="ca-mb"> Microformatos [XHTML] <span class='geo'> <span class='latitude'> </span>; <span class='longitude'> </span> </span>

50 DCTagging De igual forma que el geotagging, el DCtagging se refiere a la utilización de códigos estandarizados –en este caso, DC (Dublin Core)– para normalizar o matizar el etiquetado en servicios de la web social (web 2.0). Se refiere a la utilización del estándar DC de elementos de metadatos no sólo para codificar las materias (DC.Subject) sino para hacer una descripción integral del recurso que se describe (p. ej. Un bookmark en del.ici.us, una foto en flickr, etc.) P. ej. dc:creator=Eva Méndez  me permitirá encontrar entre mis fotos, las fotos que yo he hecho, mientras que dc:subject=Eva Méndez  las fotos en las que yo aparezco, o dc:publisher=Eva Méndez  aquellas que publico aunque no sea el autor. Ver:

51 Ejemplo de “Machine tags”
Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 Eva Méndez. Universidad Carlos III de Madrid

52 Reflexiones sobre el valor de los “Vocabularios”
Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 Reflexiones sobre el valor de los “Vocabularios” Eva Méndez. Universidad Carlos III de Madrid

53 Tradicionalmente: Vocabularios
Vocabularios controlados (terminología confusa): Listas de encabezamientos de materia: tradicionalmente en bibliotecas para indizar las materias de los libros u otros materiales bibliotecarios Tesauros: utilizado en los servicios de indización y resumen especializado para asignar materias a los artículos de revista y otros materiales especializados en un área determinada (p. ej. Medicina, arquitectura, etc.) Taxonomías: clasificación de diferentes organismos basados en categorías taxonómicas unívocas procedentes de la biología. Desde el punto de vista tradicional es un vocabulario controlado formado sólo por descriptores relacionados por jerarquía/polijerarquía

54 Actualmente: Vocabularios
“Vocabulario” se ha convertido en una denominación genérica para hablar de estructuras o conjuntos de elementos normalizados en Internet. Según la comunidad que utilice el término “vocabulario”, tendrá un significado: En el ámbito de los estándares de metadatos. Vocabulario: conjunto de elementos descriptivos y de propiedades En el ámbito de la SW: se ha formalizado la noción de "ontología“ como sinónimo de vocabulario Los usuarios de KOS, los vocabularios son: estructuras de "espacio-valor" como los tesauros clasificaciones de materia En entornos corporativos se habla sin embargo de: "taxonomías“.

55 Vocabularios para el A de contenido.
Listas de términos Ficheros de autoridad, glosarios, Gazetteers, Diccionarios Sistemas de clasificación o categorización Encabezamientos de materia Schemes de clasificación y Taxonomías Visión electrónica de la DDC, taxonomías científicas o empresariales. Schemes de Relaciones Tesauros Redes Semánticas (ej. WordNet) Ontologías Ver:

56 Vocabularios Web Servicios terminológicos
Búsqueda por conceptos Schemes registrados (ontologías, tesauros) Conceptos/términos en servidores de Taxonomías Soportar sistemas de interrogación Búsqueda en colecciones Búsquedas cruzadas (interoperabilidad) Búsqueda por navegación (visualización e interfaces basados en sistemas de organización del conocimiento) Indización y clasificación automáticas Extracción de términos. Soporte a la recuperación multilingüe usando “vocabularios”

57 Tipificación de Vocabularios para la SW
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Vocabularios de base léxica: WordNet SKOS Vocabularios de base lógica: Ontologías Topic Maps Tipificación de NKOS (Network Knowledge Organization Systems/Services) para la Web Semántica y sus estándares Eva Méndez. Universidad Carlos III de Madrid

58 NKOS: Vocabularios (documentación)
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Ontologías Redes semánticas Tesauros Grupos de relaciones: Altamente estructurado Esquemas de clasificación Taxonomías Esquemas de categorización Clasificación & Categorización: Encabezamientos de materia Anillos de sinónimos Ficheros de autoridad Glosarios Diccionarios Débilmente estructurado Listas de términos: Listados Lenguaje Natural Lenguaje controlado Eva Méndez. Universidad Carlos III de Madrid

59 Redes semánticas Se basan en relaciones léxicas (semejantes a las que se pueden dar en un tesauro) pero de mayor profundidad. Son básicas las relaciones de hiponimia y meronimia Hiponimia: relación semántica de género-especie (hiperónimo/hipónimo/cohipónimo). Meronimia: relación semántica entre una unidad léxica que denota una parte y lo que denota el correspondiente todo Representación de las relaciones léxico-semánticas entre los conceptos (acepciones) de la lengua relaciones taxonómicas: clase/subclase sinónimos, antónimos, etc. otras relaciones: parte-de, clase/miembro, etc.

60 Redes semánticas: WordNet
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 WordNet Red/taxonomía semántica/léxica del inglés, formada por conceptos agrupados en conjuntos de sinónimos. ES un diccionario semántico designado como una Red, en parte porque representa palabras y conceptos como un sistema interrelacionado Permite la indización conceptual de base léxica. Otros proyectos: Análisis de las definiciones, metalenguaje lexicográfico. Extracción y explotación de la información implícita: razonamiento, inferencia. a semantic dictionary that was designed as a network, partly because representing words and concepts as an interrelated system seems to be consistent with evidence for the way speakers organize their mental lexicons Eva Méndez. Universidad Carlos III de Madrid

61 WordNet Léxico informático multipropósito.
Base de datos que contiene una red semántica del inglés formada por conceptos con relaciones semánticas. Desarrollada por George Miller y su grupo de investigación. Universidad de Princeton (1993). Utiliza un modelo semántico relacional y una base de datos también relacional. Es básicamente una base de datos de términos y relaciones entre términos. Ha sido elaborada desde el punto de vista de la Psicolingüística. Está considerada como la red semántica del inglés (o de cualquier otra lengua) más completa que existe. Contempla 5 categorías gramaticales: sustantivos, verbos, adjetivos, adverbios, elementos funcionales.

62 WordNet (original): http://wordnet.princeton.edu/
Los elementos primitivos de WordNet (1.5, ahora está en la versión 3.0) son tres: Words (palabras, strings) Meanings (significados, synsets): conjuntos de sinónimos, representados por un número identificador). Relationships (relaciones, punteros relacionales). Otros elementos: Categorías gramaticales, Esquemas de subcategorización verbal Marcadores sintácticos para adjetivos

63 Redes Semánticas http://wordnetweb.princeton.edu/perl/webwn
WordNet (consulta Online) Versión 3.0: EuroWordNet: GlobalWordNet:

64 Futuro: WordNet y SW SUMO (Suggested Upper Merged Ontology):
WordNet es una base de datos semántica utilizada en muchos proyectos. El gran reto es convertir WordNet en una gran ontología, esto es, convertir un vocabulario de base léxica, en un vocabulario de base lógica. Existen algunos proyectos al respecto: SUMO (Suggested Upper Merged Ontology): Un grupo de trabajo en el W3C para convertir wordNets (léxicos) en ontologías a través de OWL/RDF: WordNet en RDF Schema y OWL Un trabajo muy interesante de construcción de ontologías sobre WordNet es el de la FAO: AOS (Servicio de Ontología Agraria: versión en español de este trabajo):

65 SW, RDF y representación de tesauros
El reto para los tesauros en la SW es que se publiquen los Sistemas de Organización del Conocimiento en una forma legible por máquina. Qué mejor forma que… RDF: Resource Description Framework: estándar flexible para describir recursos para la Web Es un estándar extensible (como XML pero aplicado netamente a metainformación) Utilizado en combinación con otros estándares. Sirve para potenciar la Interoperabilidad.

66 SKOS es un vocabulario RDF
RDF y SKOS SKOS es un vocabulario RDF Un vocabulario RDF es un conjunto de términos RDF para describir “algo” en RDF. Algunos ejemplos de vocabularios RDF: DC, cuando constituye un schema RDF para representar propiedades (metadatos descriptivos). FOAF (Friend of A Friend), otro vocabulario RDF para representar las propiedades de las personas en las Redes Sociales. SKOS, es también un vocabulario RDF

67 Crear Tesauros/Vocabularios para la SW
Fuente: Mondeca

68 SKOS: Un vocabulario RDF
Sirve para crear Sistemas de Organización del Conocimiento “orientados al lenguaje” Tesauros Glosarios Vocabularios controlados (listas de autoridad, etc.) Terminologías Y… no está muy claro, para: Esquemas de clasificación Taxonomías Directorios Web (esquemas para definir categorías de WebLogs)

69 Clasificación de estándares para la construcción de Vocabularios en el contexto-e
De diseño (ej. Z39.19, IFLA Guidelines) ISO 25964: Thesauri and interoperability with other vocabularies Part 1: Thesauri for information retrieval Part 2: Interoperability with other vocabularies De estructura (ej. SKOS, Zthes) Pero también… De identificación de conceptos, términos y vocabularios (URIs/URLs, Persistent ID) Protocolos, perfiles y APIs (SKOS-API, WordMap, Zthes) Otros estándares Estándares de base (marcado, metadatos, etc.) Estándares de traducción, localización y tecnologías del lenguaje (openTag) Estándares para el manejo de corpus ISO TC37 Terminología  Ver: Standards for Content Creation and Globalization

70 SKOS-Core: http://www.w3.org/2004/02/skos/
Definición: SKOS Core es un vocabulario que sirve para hacer descripciones RDF de Sistemas de Organización del Conocimiento (KOS) de orientación lingüística, como por ejemplo: Tesauros, Glosarios, Vocabularios Controlados, Taxonomías, Esquemas de clasificación (schemes). Especificaciones: SKOS Primer: Quick Guide to Publishing a Thesaurus on the Semantic Web: Guía (SKOS Core-2005): SKOS 2009: Vocabulario SKOS:

71 Características de las relaciones en SKOS
Concepto Término preferido (descriptor) Término alternativo (no descriptor) Nota Definición, alcance, nota histórica, etc. Relación Semántica Fuente: Alistair Milles

72 SKOS: Características
Extensibilidad: Permite crear propiedades específicas como subpropiedades Se pueden etiquetar propiedades según las necesidades del usuario: Por ejemplo, nombres propios, científicos, etc. También se pueden establecer Relaciones Semánticas según el usuario: Por ejemplo: BroaderGeneric, BroaderInstantive … PartOf. Gran interoperabilidad: se pueden crear aplicaciones especializadas / adaptadas pero que sigan siendo interoperables con otras aplicaciones más genéricas (interoperabilidad semántica de tesauros sin perder especificidad técnica)

73 SKOS : otras características
Permite poner conceptos en múltiples esquemas (schemes) de conceptos: Schemes virtuales (“Views”) Reutilización de schemes Relaciones entre schemes Crear “super-schemes”

74 Propuestas de SKOS 5 clases: Classes CollectableProperty Collection Concept ConceptScheme OrderedCollection 26 Propiedades: altLabel altSymbol broader changeNote definition editorialNote example hasTopConcept hiddenLabel historyNote inScheme isPrimarySubjectOf isSubjectOf member memberList narrower prefLabel prefSymbol primarySubject privateNote publicNote related scopeNote semanticRelation subject subjectIndicator

75 Ejemplo: Term: Economic cooperation Used For: Economic co-operation
Tomamos un término del UK Archival Thesaurus Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration European economic cooperation European industrial cooperation Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries.

76 Ejemplo: en SKOS se representaría...
<rdf:RDF xmlns:rdf=" xmlns:rdfs=" xmlns:skos=" <skos:Concept rdf:about=" <skos:prefLabel>Economic cooperation</skos:prefLabel> <skos:altLabel>Economic co-operation</skos:altLabel> <skos:scopeNote>Includes cooperative measures in banking, trade, industry etc., between and among countries.</skos:scopeNote> <skos:inScheme rdf:resource=" <skos:broader rdf:resource=" <skos:narrower rdf:resource=" <skos:narrower rdf:resource=" <skos:narrower rdf:resource=" <skos:narrower rdf:resource=" <skos:related rdf:resource=" </skos:Concept> </rdf:RDF>

77 Desarrollo actual de SKOS (W3C)
Existen distintos grupos de trabajo: W3C Semantic Web Best Practises & Deployment Working Group (SWBPD-WG) Grupo de Trabajo de Tesauros (Thesaurus Task Force) Coordinado por Alistair Miles y & Dan Brickley Se encargan de crear estrategias para representar contenidos de tesauros utilizando RDF y OWL Especificaciones SKOS:

78 SKOS Extensions y Mapping
Las extensiones de SKOS son un conjunto de términos que extienden el vocabulario SKOS-Core de tal forma que pueda soportar algunas de las características más básicas de los vocabularios documentales, sobre todo, de los tesauros. SKOS Mapping es otro vocabulario RDF para describir las interrelaciones (mapeos) entre distintos esquemas de conceptos (schemes) SKOS mapping y extensions, confluyen en una Especificación (Recomendación Agosto 2009):

79 Tesauros en SKOS GEMET (General Multilingual Environmental Thesaurus): UKAT (UK Archival Thesaurus): GCL (Government Category List): APAIS (Australian Public Affairs Information Service): AGROVOC (FAO), MeSH, etc.  KEA (Keyphrase Extraction Algorithm)

80 Vocabularios de base lógica
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Vocabularios de base lógica Ontologías y Topic maps Eva Méndez. Universidad Carlos III de Madrid

81 Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Ontologías Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Gruber (1993) [Borst (1997)]: Especificación sistemática [formal] de una conceptualización [compartida] Una ontología es una herramienta conceptual que define un vocabulario común para compartir información dentro de un determinado dominio 80’s: IA. para compartir y reutilizar conocimiento 90’s: Ingeniería Web (ingeniería ontológica): descripciones semánticas explícitas de recursos conceptualización significa modelo abstracto de un fenómeno, que puede ser visto como un conjunto de reglas informales que restringen su estructura, que por lo general se expresa como un conjunto de conceptos (entidades, atributos,procesos), sus definiciones e interrelaciones; formal implica una organización teórica de términos y relaciones usados como herramienta para el análisis de los conceptos de un dominio; compartida significa que captura un conocimiento consensual que es aceptado por una comunidad; explícita se refiere a la especificación de los conceptos y a las restricciones sobre éstos Eva Méndez. Universidad Carlos III de Madrid

82 Ontologías Son conjuntos de... Su objetivo es: Necesitan…
... Conceptos o clases (términos que evocan conceptos) … Atributos (características de esos objetos) ... relaciones entre los términos (conceptos), ... que describen un dominio de aplicación concreto. Su objetivo es: Creación de un diccionario de términos compartidos y comprensibles para diferentes aplicaciones y/o comunidades que permita la interoperabilidad. Cualificar los términos para que representen conceptos Necesitan… “Responsabilidad ontológica” Formalización

83 Ontologías: Estándares
SHOE (Simple HTML Ontology Extensions) OIL (Ontology Inference Layer) DAML(DARPA Agent Markup Language) ( DAML+OIL RDF ( OWL (Web Ontology Language)

84 Ontologías: Estándares
OWL (Web Ontology Language): 6 recomendaciones del W3C (10 febrero 2004) OWL Web Ontology Language Overview OWL Web Ontology Language Guide OWL Web Ontology Language Reference OWL Web Ontology Language Semantics and Abstract Syntax OWL Web Ontology Language Test Cases OWL Web Ontology Language Use Cases and Requirements + 2 Notas: Presentación de la sintaxis en XML y analizador de OWL en RDF/XML

85 Elementos de una ontología
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Axioma (modelado de verdades) / statements Clase o tipo (conjunto de objetos) - Subclases Instancias (miembros de una clase) Relaciones Propiedades o slots (protégé) Frame (clase + instancias + relaciones) Conceptualización (conceptos, relaciones, propiedades y restricciones) Taxonomía (conceptos organizados jerárquicamente) Vocabulario (conjunto de términos/palabras + su formalización en un dominio) Axioma: Elementos que permiten el modelado de verdades que se cumplen siempre en la realidad. Los axiomas pueden ser estructurales y/o no estructurales. Un axioma estructural establece condiciones relacionadas con la jerarquía de la ontología, conceptos y atributos definidos. Ejemplo: el concepto A no es una clase de A. Un axioma no estructural establece relaciones entre atributos de un concepto y son específicos de un dominio. Ejemplo: la relación F=m*a, que debe cumplirse siempre entre los atributos F (fuerza), m (masa) y a (aceleración) de un determinado concepto. • Clase o tipo: Una clase es un conjunto de objetos (físicos, tareas, funciones...). Cada objeto en una clase es una instancia de esa clase. Desde el punto de vista de la lógica los objetos de una clase se pueden describir especificando las propiedades que éstos deben satisfacer para pertenecer a esa clase. Las clases son la base de la descripción del conocimiento en las ontologías ya que describen los conceptos del dominio. Una clase puede ser dividida en subclases, las cuales representarán conceptos más específicos que la clase a la que pertenecen. Una clase cuyos componentes son clases, se denomina superclase o metaclase. • Instancias o individuos: Son objetos, miembros de una clase, que no pueden ser divididos sin perder su estructura y características funcionales. Pueden ser agrupados en clases. • Relaciones: Se establecen entre conceptos de una ontología para representar las interacciones entre éstos. Definidas por lo general como el producto cartesiano de n conjuntos: R: C1 x C2 x …x Cn. Algunas de las relaciones mas utilizadas son: o Instancia de: Asocian objetos a clases. o Relaciones temporales: Implican precedencia en el tiempo. o Relaciones topológicas: Establecen conexiones espaciales entre conceptos. • Propiedades o slots: Los objetos se describen por medio de un conjunto de características o atributos que son almacenados en los slots. Éstos almacenan diferentes clases de valores. Las especificaciones, rangos y restricciones sobre estos valores se denominan características o facetas. Para una clase dada, los slots y las restricciones sobre ellos son heredados por las subclases y las instancias de la clase. • Frame: Un objeto que incluye clases, instancias y relaciones. • Conceptualización: Conjunto de conceptos, relaciones, objetos y restricciones que caracterizan un domino. • Taxonomía: Conjunto de conceptos organizados jerárquicamente. Las taxonomías definen las relaciones entre los conceptos, pero no los atributos de éstos. • Vocabulario: Conjunto de palabras con una explicación y documentación que persigue la universalidad y el formalismo en el contexto de un dominio. Eva Méndez. Universidad Carlos III de Madrid

86 Ontologías (metodología y fases)
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Varias metodologías (MethONTOLOGY): Especificación Conceptualización Adquisición de conocimiento Integración Implantación Evaluación Documentación Especificación. Se desarrolla un documento que contenga la meta de la ontología, nivel de granularidad, alcance, propósito... Se identificar los términos a ser representados, sus características y relaciones. Conceptualización. Se organiza el conjunto de términos y sus características en una representación intermedia que el desarrollador de la ontología y los expertos puedan entender. En este paso se construye un glosario de términos, diagramas de relaciones binarias, diccionario de conceptos, tablas de atributos instancias, tablas de atributos clases, tabla de axiomas lógicos, tablas de constantes, tablas de instancias. 3. Adquisición de conocimiento. Este paso se lleva a cabo de manera independiente en la metodología. Su ejecución puede coincidir con otros pasos. Por lo general la adquisición de conocimiento se realiza en tres etapas: reuniones preliminares con los expertos, análisis y revisión de la bibliografía asociada al dominio, y una vez que se tiene un conocimiento base se refina y detalla el conocimiento hasta completar la ontología. 4. Integración. Se identifican las ontologías candidatas a ser reutilizadas en la ontología que se está construyendo, incorporando aquellas piezas de conocimiento que sean de utilidad. 5. Implantación. Consiste en la codificación del modelo conceptual en un modelo codificado en lenguaje ontolingua. 6. Evaluación. Se realiza un juicio técnico a la ontología, al ambiente de software asociado y a la documentación con respecto a un esquema de referencia en cada paso de la metodología. El esquema de referencia puede ser: requisitos de especificación, preguntas de competencias y/o el mundo real. 7. Documentación. Se detallar clara y exhaustivamente cada paso completado y los productos generados. Eva Méndez. Universidad Carlos III de Madrid

87 OWL (Web Ontology Language)
SKOS Core / OWL OWL (Web Ontology Language) Recomendación del W3C (ver tema 6) Para construir vocabularios de base lógica Basado en una pontente inferencia (leyes de inferencia heredadas de OIL). Semántica mucho más precisa. SKOS Core complementa a OWL Es posterior a OWL, todavía no REC. Para construir vocabularios de báse lingüística. Menor potencia de inferencia semántica Semántica menos precisa, pero más flexible (orientada al término lingüístico).

88 Vocabularios de base lógica: Topic Maps
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Motivación: necesidad de mezclar índices (Newcomb, Pepper) Dificultades del grupo de Davenport para mezclar índices de diferentes conjuntos de documentos electrónicos Estándar ISO (paradigma de topic maps) para describir estructuras de conocimiento y asociarlas con los recursos de información XTM (XML Topic Maps: En el fondo es otra manera de caracterizar metadatos Conferencia Topic Maps 2009 (Oslo, Marzo) Eva Méndez. Universidad Carlos III de Madrid

89 Topic Maps: Definición
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Modelo de datos que permite representar estructuras de conocimiento de un dominio específico en forma de red semántica, y al mismo tiempo asociar dichas estructuras con recursos de información heterogénea. Eva Méndez. Universidad Carlos III de Madrid

90 Topic Maps y RDF Le Grand (2002) están destinados a ser complementarios. Diferencia es que TM es independiente de que existan recursos informativos o no, permitiendo en ocasiones una navegación entre conceptos. RDF está más centrado en la descripción de recursos informativos y no trata la semántica de las relaciones entre metadatos.

91 “Otros vocabularios”: FOAF
Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 “Otros vocabularios”: FOAF (sorry en inglés  Eva Méndez. Universidad Carlos III de Madrid

92 Why FOAF for this talk? TR: Is there an existing application that shows how the Semantic Web can form such connections? B-L: If you want to play with the Semantic Web, you can make a friend-of-a-friend file. In a FOAF file [the data component of a personal home page, formatted in a standardized way], you can publish stuff about yourself, your organization, your publication, places, or photographs. You can have a pointer that says this is a photograph about me and other data about the photograph, such as who else is in it. Tim B. Lee Interview at: Technology Review

93 FOAF: A Simple SW Application
Stands for "Friend Of A Friend“. Creators: Dan Brikley and Libby Miller (more people joined… FOAF-conference) Is a vocabulary defined using RDF schema (RDFS) and OWL Information distributed and extensible FOAF files (pages) and vocabulary (a dictionary of terms –50--). RDF markup for “Person”, “mbox”, “homepage”, “workplaceHomepage”, “schoolHomepage”, “knows”, etc. (personal properties). Provides structured links in a (semantic) Web to other FOAF files. It attempts to avoid data protection concerns.

94 RDF relationships in FOAF
The formal model behind the Semantic Web is based on simple tuples, which relation is defined by one URI. Eva knows Jane UC3M works at Jane Eva Research x DC.Creator 001919… Has phone no.

95 How can I say in FOAF “I am Eva and I work at UC3M and I know Jane who works at SILS and her FOAF profile is [over here] and here is the title of the research we are doing together.” And: This is my photo ( And here are some other photos, with info on the people and objects depicted in them. If I use FOAF extensions: “I speak Spanish. I am Gemini. I’m friends with Danbri. Here is my calendar in RDF. I like Mediterranean food”.

96 My (ej.) FOAF file <foaf:Person>
<foaf:name>Eva Mendez</foaf:name> <foaf:gender>female</foaf:gender> <foaf:title>Dr</foaf:title> <foaf:givenname>Eva</foaf:givenname> <foaf:family_name>Mendez</foaf:family_name> <foaf:mbox_sha1sum>cf2fd069302feb63fa7f20bd82</foaf:mbox_sha1sum> <foaf:homepage rdf:resource=" <foaf:weblog rdf:resource=" <foaf:knows> <foaf:Person rdf:nodeID=“janeg"> <foaf:name>Jane Greenberg</foaf:name> <foaf:homepage rdf:resource=“ /> <rdfs:seeAlso rdf:resource=" </foaf:Person> </foaf:knows> I have invented some information ...

97 Some tools: Creating FOAF
FOAF-A-MATIC (by Leigh Dodds):

98 Some tools: Visualizing FOAF
FOAFNAUT (by Jim Ley)

99 COMMUNITIES / SERVICES using/export FOAF:
Some tools: Using FOAF COMMUNITIES / SERVICES using/export FOAF: LiveJournal: Videntity: MyOpera: Ecademy: eConozco: Others… [your community / net]?

100 FOAF: Inspiring Vocabularies and tools
FOAF Speaks, reads, writes (habla, lee, escribe). By Inkel: An extension of FOAF elements To give information about the languages speaked by the people implied in a FOAF description. DOAP: by Ed Dumbill Description Of A Project RDF vocabulary for describing Open Source Programs. Viewer (DOAPer Firefox Extension): FLICKRGRAPH:

101 FOAF: Inspiring Vocabularies and tools
FLICKRGRAPH: It worked!

102 4. Discusión sobre el futuro de la Web Semántica, Web 3
4. Discusión sobre el futuro de la Web Semántica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semánticas

103 La Clave: INTEROPERABILIDAD
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Keynote word for the work we’re doing 3 main aspects of interoperability - Human and political; - technical and semantic; - users and usability Eva Méndez. Universidad Carlos III de Madrid

104 Aspectos de la interoperabilidad
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Tecnología Semántica Política Y Humana La interoperabilidad es conectar gente, datos, información en distintos contextos Usuarios y Usabilidad Keynote word for the work we’re doing 3 main aspects of interoperability - Human and political; - technical and semantic; - users and usability Eva Méndez. Universidad Carlos III de Madrid

105 Bibliotecas Digitales Semánticas: Ejs.
Biblioteca Aperta de Milano:

106 Bibliotecas Digitales Semánticas: Ejs.
VideoActive:

107 Bibliotecas Digitales Semánticas: Ejs.
Europeana:


Descargar ppt "Introducción a la Web Semántica (Curso en Buenos Aires. SIU)"

Presentaciones similares


Anuncios Google