Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación Introducción a la Web Semántica: vocabularios, tecnologías y estándares 30/Oct/2009 Eva Méndez. Universidad Carlos III de Madrid
Esta presentación es vuestra en: http://www.bib.uc3m.es/~mendez/SW-ARGENTINA Presentaciones Recursos Programa Bibliografía
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Contenidos / Programa Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica. La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW),etc. Web Semántica, Servicios Web y la Recuperación de información en la WWW. Estándares para la Web y estándares para la Web Semántica: RDF/XML Conceptos clave en la SW: metadatos, ontologías, agentes, etc. Ejemplos y casos de uso de la Web Semántica. Buscadores semánticos Búsqueda de ontologías, vocabularios y reutilización de ontologías Algunas aplicaciones para trabajar con la Web Semántica: Creación de ontologías y tesauros SKOSificados (Protégé, ThManager), creación de perfiles FOAF, etc. Estándares y Tecnologías para la Representación del Conocimiento en la Web Semántica. RDF y Metadatos: DCMI-DCAM RDF y Tesauros: SKOS RDF y Ontologías: OWL RDF y Redes sociales: FOAF Microformatos: Web Semántica en minúsculas Discusión sobre el futuro de la Web Semántica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semánticas. Eva Méndez. Universidad Carlos III de Madrid
Estándares para la Web y estándares para la Web Semántica: RDF/XML Conceptos clave en la SW: metadatos, ontologías, agentes, etc
SW: Definición tradicional (IA, informática) “La Web Semántica es una extensión de la actual Web en la que a la información disponible se le otorga (anota o marca con) una semántica bien definida. Está basada en la idea de proporcionar en la Web datos definidos y enlazados, permitiendo que aplicaciones heterogéneas descubran, integren, razonen, utilicen la información presente en la web.” Fuente: Asun Gómez, basado en: Hendler, J., Berners-Lee, T., and Miller, E. http://www.w3.org/2002/07/swint.html Ontologías Anotación
SW: una visión desde la Documentación No es otra versión de la Web: es la Web. Implica crear una interfaz común a todos los conceptos y bases de conocimiento terminológico en la Web. Sistema de información de acceso integrado de datos, términos y conceptos (=información). Aunar distintos recursos que existen en diferentes sistemas o servicios de información digital basados en Web (diccionarios, tesauros, ontologías, esquemas de clasificación, etc): NKOS (Network Knowledge Organization Systems/Services). Facilitar la búsqueda por materias y la ampliación temática CBU (Control Bibliográfico Universal) CWU (Control Web Universal) Semantic Web (global knowledge exchange).
SW implica... Lenguajes formales como: (DAML+OIL), RDF, OWL, etc. Metadatos y esquemas de metadatos. Ontologías: tanto específicas de un dominio, como ontologías de alto nivel de tal forma que se proporcionen relaciones entre ontologías para la recuperación, el intercambio y la integración de la información interdisciplinar en la Web.
SW implica... Un amplio esquema conceptual que pueda mantener todas los tipos de información semántica y especificar las relaciones entre ellos. Normalmente esto se conoce como “ontologías” pero veremos cómo se pueden crear schemes conceptuales y otros vocabularios para representar los conceptos implicados en un sistema de información. Definición de servicios para interactuar con el sistema: Protocolos y tecnologías que permitan tanto al usuario (humano) como al ordenador (máquina) interpretar la información e interactuar.
SW: algo más que XML Semántica Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Significados legibles por máquina (codificar la “semántica de mundo”). XML (eXtended Markup Language) ante la semántica. Estándar de representación, metalenguaje para el intercambio de datos/información en la web. Desde un punto de vista estrictamente informático: XML no añade semántica. Por ello, necesita además: metadatos y ontologías (semántica). Eva Méndez. Universidad Carlos III de Madrid
Procesamiento automático SW implica... Semántica Metadatos Ontologías Descripciones Lógica Motores de inferencia semántica Procesamiento automático
La Web Semántica y Servicios Web Semánticos (SW+WS) DAML-S, OWL-S WSMO Se describen utilizando el vocabulario de una ontología y se expresan en algún lenguaje de marcado semántico UDDI, WSDL, SOAP WS Dinámica URI, HTML, HTTP WWW RDF(S), OWL Web Semántica Estática Riqueza semántica
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Basado en: Tim Berners Lee, 2000: http://www.w3.org/2000/Talks/0906-xmlweb-tbl/slide9-0.html Octubre 2009 Aplicaciones de la Web Semántica (Web 3.0, Bases de conocimiento, Aplicaciones de negocio) SPARQL Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Basado en: Tim Berners Lee, 2000: http://www.w3.org/2000/Talks/0906-xmlweb-tbl/slide9-0.html Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Fuente: http://bnode.org/media/2009/07/08/semantic_web_technology_stack.png Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Fueente: Semantic Web Activities: http://swa.cefriel.it/ Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
Aproximación a los principales estándares RDF: Resource Description Framework es el lenguaje principal de la Web Semántica para definir DATOS. Los datos se enlazan como grafos utilizando triples. Los triples consisten en sujeto-predicado-objeto identificados únicamente por un URI. RDFS: RDF Schema es el lenguaje de modelado de datos para RDF (crear vocabularios) OWL: Web Ontology Language es un lenguaje de modelado de datos avanzado para RDF.
Aproximación a los principales estándares SPARQL: Simple Protocol and RDF Query Language (protocolo y lenguaje de interrogación para RDF) RIF: Rule Interchange Format GRDDL: Gleaning Resource Descriptions from Dialects of Languages, para transformar XML y XHTML a RDF SAWSDL: Semantic Annotations for Web Service Definitions (WSDL) típicamente utilizado en modelizaciones RDF y OWL. RDFa: RDF Atributes, para insertar datos estructurados en RDF páginas XHTML
RDF, el estándar clave/principal Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 RDF es un estándar propuesto por el W3C para definir la arquitectura necesaria para soportar metadatos (descripciones) sobre recursos web. Es la aplicación XML recomendada por el consorcio para codificar, intercambiar y reutilizar metadatos estructurados. RDF es una base para procesar metadatos; proporciona interoperabilidad entre aplicaciones que intercambian información legible por máquina en la Web. Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) RDF: Definición Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 RDF destaca por la facilidad para permitir un procesamiento legible por máquina de representaciones de recursos Web. RDF hereda todos los conceptos de XML que permiten especificar propiedades de los elementos (por ejemplo, los espacios de nombre o namespaces). Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) RDF: Características Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Basado en XML Es una Infraestructura de Descripción de recursos. RDF propone un modelo de datos coherente y lenguaje de esquema (RDFS) para definir vocabularios. Componentes de RDF: Un modelo de datos formal. Una sintaxis para intercambiar datos. Un esquema. Una sintaxis legible por máquina del esquema. Protocolos de interrogación. http://www.w3.org/RDF Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Componentes de RDF Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Modelo RDF: asocia tipos de propiedades (atributos) con sus valores. Esquema RDF (RDFS) proporciona los mecanismos para crear vocabularios y relacionar propiedades y recursos. Namespaces XML: identifica cada tipo de propiedad de forma unívoca. Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) RDF: Modelo de datos Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 El modelo de datos que propone RDF consiste en tres tipos de objetos: Recursos Tipos de propiedades Descripciones Recurso VALOR TIPO DE PROPIEDAD Propiedad / descripción Eva Méndez. Universidad Carlos III de Madrid
RDF: Modelo basado en declaraciones Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 El modelo de datos de RDF está basado, en declaraciones, afirmaciones o aserciones (statements). Una afirmación / sentencia es un predicado de n componentes. Los valores pueden ser: strings, fechas y URIs. SUJETO (recurso) PREDICADO (tipo de propiedad) OBJETO (valor) S, P, O Eva Méndez. Universidad Carlos III de Madrid
RDF: Representación gráfica Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 AUTOR Explicando RDF Title DC: EVA “Eva Méndez” Creator “emendez@bib.uc3m.es” “Eva Méndez” “UC3M” BIB:Email BIB:Aff BIB:Name uc3m Eva Méndez. Universidad Carlos III de Madrid
RDF: Propiedades (contenedores) Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 <?xml version="1.0"?> <RDF xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:DC="http://purl.org/metadata/dublin_core/"> <Bag ID="pages"> <li resource="http://foo.org/foo.html" /> <li resource="http://bar.org/bar.html" /> </Bag> <Description aboutEach="#pages"> <DC:Creator>Ora Lassila</DC:Creator> </Description> </RDF> Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Ejemplo RDF-sintaxis Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 <RDF:RDF> <RDF: Description about= ”http://www.bib.uc3m.es/~mendez/rdf.htm”> <Title> Explicando RDF</Title> <Author>Eva Méndez </Author> </RDF: Description> </RDF:RDF> SELIALIZADA <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.0/"> <rdf:Description rdf:about="http://www.bib.uc3m.es/~mendez/rdf.htm" dc:creator=”Eva Méndez" dc:title=”Explicando RDF" dc:date=“2005-04-12" /> </rdf:RDF> ABREVIADA Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) RDF: Esquema Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Cualquier URI de namespace que se usa en RDF debe apuntar a un esquema para el vocabulario. El esquema en RDF describe la semántica y la sintaxis permitida. Se ha convertido en un vocabulario RDF para describir otros vocabularios RDF, por ejemplo SKOS. http://www.w3.org/TR/rdf-schema/ Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) RDF: Esquema Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Recurso rdfs:Literal Propiedad rdf:type rdf:subClassOf rdfs:subPropertyOf rdfs:comment rdfs:label rdfs:seeAlso rdfs:isDefinedBy ConstraintProperty rdfs:range rdfs:domain Clase rdfs:Resource rdfs:Class rdf:Property rdfs:ConstraitProperty Eva Méndez. Universidad Carlos III de Madrid
Validador RDF http://www.w3.org/RDF/Validator/
Buscadores semánticos 2. Ejemplos y casos de uso de la Web Semántica Buscadores semánticos Búsqueda de ontologías, vocabularios y reutilización de ontologías Algunas aplicaciones para trabajar con la Web Semántica
La Web semántica… funciona… Mmmm, bueno, empieza a funcionar y a tener casos de uso
Navegadores y extensiones: “ver” la SW Tabulator http://www.w3.org/2005/ajar/tab RDF Browser: http://demo.openlinksw.com/DAV/JS/rdfbrowser/index.html Disco - Hyperdata Browser: http://www4.wiwiss.fu-berlin.de/bizer/ng4j/disco/ LENA: http://www.uni-koblenz-landau.de/koblenz/fb4/institute/IFI/AGStaab/Research/systeme/lena Marbles: http://wiki.dbpedia.org/Marbles?v=71e Piggy Bank: http://simile.mit.edu/wiki/Piggy_Bank
Buscadores: “buscar” la SW Falcons: http://iws.seu.edu.cn/services/falcons/objectsearch/index.jsp Sindice: http://sindice.com Watson: http://watson.kmi.open.ac.uk/WatsonWUI Lexxe: http://www.lexxe.com/ MicroSearch (Yahoo): http://www.yr-bcn.es/demos/microsearch/search.do?p=Peter+Mika&y=Search&fr=lo SWSE: http://www.swse.org Semantic WebSearch: http://www.semanticwebsearch.com/query URI Search: http://dev.uriqr.com Hakia: http://www.hakia.com Worio: http://www.worio.com Wolframalpha: http://www.wolframalpha.com PowerSet: http://www.powerset.com
Buscadores: “buscar” la SW Yahoo indexa microformatos (Marzo de 2008): hCard, hCalendar, hReview, hAtom, XFN, Dublin Core, Creative Commons, FOAF, GeoRSS, MediaRSS, RDFa y eRDF
Buscadores: “buscar” la SW http://search.yahoo.com
Buscadores de ontologías / vocabularios SWoogle: http://swoogle.umbc.edu
Una aplicación en español-ar: TemaTres Ver ejemplos: http://www.r020.com.ar/tematres/#ej
3. Estándares y Tecnologías para la Representación del Conocimiento en la Web Semántica. Microformatos: la Web Semántica “en minúsculas” RDF y Metadatos: DCMI-DCAM RDF y Tesauros: SKOS RDF y Ontologías: OWL RDF y Redes sociales: FOAF
Añadir semántica al Doc Digital DLO AC Automático: Indización y resumen automáticos De autor Profesional AC “manual” Embebido en el propio documento Externo al documento Metadatos Metaetiquetas Microformatos Metadatos Etiquetado social Normalizados Sin Normalizar
Microformatos Intentan ser útiles principalmente a las personas y en segundo lugar a las máquinas; para ello aprovechan características de [X]HTML para añadir información semántica en una sección de código [X]HTML. Análisis de contenido “de autor” en la Web 2.0. Los microformatos ofrecen soluciones sencillas a problemas de representación y arquitectura de información concretos en la Web (p. ej.: cómo codificar la información personal de una tarjeta de visita, cómo codificar un evento o cómo ayudar a Technorati a “catalogar” mejor los artículos de las bitácoras. Ejemplo: <a ref=“http://technorati.com/tag/metadatos” rel=”tag”>metadatos </a>
Microformatos: ¿cómo? [X]HTML actual Aprovechando los atributos "rel" y "rev" de los vínculos (elementos "a" y "link")... ... y especialmente los atributos "class" e "id" de muchos elementos de [X]HTML
Qué microformatos existen hCard: tarjetas de visita hCalendar: eventos rel-tag: palabras clave para etiquetar post XFN: especifica las relaciones personales ... más, en... http://microformats.org
Microformatos Operator (add-on Firefox y Flock) - Descarga
Se han escrito especificaciones. Existen aplicaciones para generarlos. Se puede destacar Se han escrito especificaciones. Existen aplicaciones para generarlos. Integrado en Wordpress (XFN). Usuarios-creadores publican microformatos. Existen aplicaciones que se "alimentan" de microformatos y son muy útiles OJO Leer artículo en E-LIS sobre microformatos: http://eprints.rclis.org/9786/1/h545611761780347.pdf
La información expresada en microformatos Y lo más importante La información expresada en microformatos está pensada para las personas... ... y las máquinas (robots y aplicaciones) también pueden encontrarla, extraerla, procesarla y reutilizarla. Conclusión: los microformatos han conseguido en poco tiempo, objetivos de la Web Semántica en contextos concretos, ... Y FUNCIONAN
Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 Intentos de normalización del etiquetado social: geotagging, dctagging, etc. Eva Méndez. Universidad Carlos III de Madrid
Geotagging Se refiere a la indización geográfica proceso de añadir metadatos geográficos a DLOs, por ejemplo, sitios Web o elementos de servicios Web 2.0 (p. ej. Imágenes en Flickr) Normalmente las geotags son datos que consignan las coordenadas de longitud y latitud y los nombres de los lugares. Ver: http://geotags.com/geo/geotags2.html Ver: http://www.geobloggers.com
Geotagging: parte de la geocodificación La geocodificación es un proceso más complejo que el geotagging que incluye también la capacidad de integrar de manera consistente, metadatos geográficos en la información básica (p. ej. Metadatos EXIF) La geocodificación también puede realizarse tomando códigos o identificadores de lugar que no estén basados en sus coordenadas, p. ej., el código postal, y asociarlos a las coordenadas para crear sistemas de recuperación de información por lugar, más potentes e “inteligentes” La indización geográfica en la Web 2.0 (geocodificación) tiene un gran potencial, por ejemplo, se pueden buscar imágenes tomadas cerca de un lugar específico, o fundamentar un buscador geográfico basado en la long y lat
Codificación del etiquetado geográfico Metadatos [head de HTML] <meta name="geo.position" content="50.167958;-97.133185"> <meta name="geo.placename" content="Rockwood Rural Municipality, Manitoba, Canada"> <meta name="geo.region" content="ca-mb"> Microformatos [XHTML] <span class='geo'> <span class='latitude'>50.167958</span>; <span class='longitude'>-97.133185</span> </span>
DCTagging De igual forma que el geotagging, el DCtagging se refiere a la utilización de códigos estandarizados –en este caso, DC (Dublin Core)– para normalizar o matizar el etiquetado en servicios de la web social (web 2.0). Se refiere a la utilización del estándar DC de elementos de metadatos no sólo para codificar las materias (DC.Subject) sino para hacer una descripción integral del recurso que se describe (p. ej. Un bookmark en del.ici.us, una foto en flickr, etc.) P. ej. dc:creator=Eva Méndez me permitirá encontrar entre mis fotos, las fotos que yo he hecho, mientras que dc:subject=Eva Méndez las fotos en las que yo aparezco, o dc:publisher=Eva Méndez aquellas que publico aunque no sea el autor. Ver: http://efoundations.typepad.com/efoundations/2006/10/dctagged.html
Ejemplo de “Machine tags” Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 Eva Méndez. Universidad Carlos III de Madrid
Reflexiones sobre el valor de los “Vocabularios” Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 Reflexiones sobre el valor de los “Vocabularios” Eva Méndez. Universidad Carlos III de Madrid
Tradicionalmente: Vocabularios Vocabularios controlados (terminología confusa): Listas de encabezamientos de materia: tradicionalmente en bibliotecas para indizar las materias de los libros u otros materiales bibliotecarios Tesauros: utilizado en los servicios de indización y resumen especializado para asignar materias a los artículos de revista y otros materiales especializados en un área determinada (p. ej. Medicina, arquitectura, etc.) Taxonomías: clasificación de diferentes organismos basados en categorías taxonómicas unívocas procedentes de la biología. Desde el punto de vista tradicional es un vocabulario controlado formado sólo por descriptores relacionados por jerarquía/polijerarquía
Actualmente: Vocabularios “Vocabulario” se ha convertido en una denominación genérica para hablar de estructuras o conjuntos de elementos normalizados en Internet. Según la comunidad que utilice el término “vocabulario”, tendrá un significado: En el ámbito de los estándares de metadatos. Vocabulario: conjunto de elementos descriptivos y de propiedades En el ámbito de la SW: se ha formalizado la noción de "ontología“ como sinónimo de vocabulario Los usuarios de KOS, los vocabularios son: estructuras de "espacio-valor" como los tesauros clasificaciones de materia En entornos corporativos se habla sin embargo de: "taxonomías“.
Vocabularios para el A de contenido. Listas de términos Ficheros de autoridad, glosarios, Gazetteers, Diccionarios Sistemas de clasificación o categorización Encabezamientos de materia Schemes de clasificación y Taxonomías Visión electrónica de la DDC, taxonomías científicas o empresariales. Schemes de Relaciones Tesauros Redes Semánticas (ej. WordNet) Ontologías Ver: http://nkos.slis.kent.edu/KOS_taxonomy.htm
Vocabularios Web Servicios terminológicos Búsqueda por conceptos Schemes registrados (ontologías, tesauros) Conceptos/términos en servidores de Taxonomías Soportar sistemas de interrogación Búsqueda en colecciones Búsquedas cruzadas (interoperabilidad) Búsqueda por navegación (visualización e interfaces basados en sistemas de organización del conocimiento) Indización y clasificación automáticas Extracción de términos. Soporte a la recuperación multilingüe usando “vocabularios”
Tipificación de Vocabularios para la SW Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Vocabularios de base léxica: WordNet SKOS Vocabularios de base lógica: Ontologías Topic Maps Tipificación de NKOS (Network Knowledge Organization Systems/Services) para la Web Semántica y sus estándares Eva Méndez. Universidad Carlos III de Madrid
NKOS: Vocabularios (documentación) Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Ontologías Redes semánticas Tesauros Grupos de relaciones: Altamente estructurado Esquemas de clasificación Taxonomías Esquemas de categorización Clasificación & Categorización: Encabezamientos de materia Anillos de sinónimos Ficheros de autoridad Glosarios Diccionarios Débilmente estructurado Listas de términos: Listados Lenguaje Natural Lenguaje controlado Eva Méndez. Universidad Carlos III de Madrid
Redes semánticas Se basan en relaciones léxicas (semejantes a las que se pueden dar en un tesauro) pero de mayor profundidad. Son básicas las relaciones de hiponimia y meronimia Hiponimia: relación semántica de género-especie (hiperónimo/hipónimo/cohipónimo). Meronimia: relación semántica entre una unidad léxica que denota una parte y lo que denota el correspondiente todo Representación de las relaciones léxico-semánticas entre los conceptos (acepciones) de la lengua relaciones taxonómicas: clase/subclase sinónimos, antónimos, etc. otras relaciones: parte-de, clase/miembro, etc.
Redes semánticas: WordNet Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 WordNet Red/taxonomía semántica/léxica del inglés, formada por conceptos agrupados en conjuntos de sinónimos. ES un diccionario semántico designado como una Red, en parte porque representa palabras y conceptos como un sistema interrelacionado Permite la indización conceptual de base léxica. Otros proyectos: Análisis de las definiciones, metalenguaje lexicográfico. Extracción y explotación de la información implícita: razonamiento, inferencia. a semantic dictionary that was designed as a network, partly because representing words and concepts as an interrelated system seems to be consistent with evidence for the way speakers organize their mental lexicons Eva Méndez. Universidad Carlos III de Madrid
WordNet Léxico informático multipropósito. Base de datos que contiene una red semántica del inglés formada por conceptos con relaciones semánticas. Desarrollada por George Miller y su grupo de investigación. Universidad de Princeton (1993). Utiliza un modelo semántico relacional y una base de datos también relacional. Es básicamente una base de datos de términos y relaciones entre términos. Ha sido elaborada desde el punto de vista de la Psicolingüística. Está considerada como la red semántica del inglés (o de cualquier otra lengua) más completa que existe. Contempla 5 categorías gramaticales: sustantivos, verbos, adjetivos, adverbios, elementos funcionales.
WordNet (original): http://wordnet.princeton.edu/ Los elementos primitivos de WordNet (1.5, ahora está en la versión 3.0) son tres: Words (palabras, strings) Meanings (significados, synsets): conjuntos de sinónimos, representados por un número identificador). Relationships (relaciones, punteros relacionales). Otros elementos: Categorías gramaticales, Esquemas de subcategorización verbal Marcadores sintácticos para adjetivos
Redes Semánticas http://wordnetweb.princeton.edu/perl/webwn WordNet (consulta Online) Versión 3.0: http://wordnetweb.princeton.edu/perl/webwn EuroWordNet: http://www.illc.uva.nl/EuroWordNet GlobalWordNet: http://www.globalwordnet.org
Futuro: WordNet y SW SUMO (Suggested Upper Merged Ontology): WordNet es una base de datos semántica utilizada en muchos proyectos. El gran reto es convertir WordNet en una gran ontología, esto es, convertir un vocabulario de base léxica, en un vocabulario de base lógica. Existen algunos proyectos al respecto: SUMO (Suggested Upper Merged Ontology): http://ontology.teknowledge.com http://suo.ieee.org Un grupo de trabajo en el W3C para convertir wordNets (léxicos) en ontologías a través de OWL/RDF: http://www.w3.org/2001/sw/BestPractices/WNET/tf.html WordNet en RDF Schema y OWL Un trabajo muy interesante de construcción de ontologías sobre WordNet es el de la FAO: AOS (Servicio de Ontología Agraria: versión en español de este trabajo): http://www.fao.org/agris/aos/aos_es/default.htm
SW, RDF y representación de tesauros El reto para los tesauros en la SW es que se publiquen los Sistemas de Organización del Conocimiento en una forma legible por máquina. Qué mejor forma que… RDF: Resource Description Framework: estándar flexible para describir recursos para la Web Es un estándar extensible (como XML pero aplicado netamente a metainformación) Utilizado en combinación con otros estándares. Sirve para potenciar la Interoperabilidad.
SKOS es un vocabulario RDF RDF y SKOS SKOS es un vocabulario RDF Un vocabulario RDF es un conjunto de términos RDF para describir “algo” en RDF. Algunos ejemplos de vocabularios RDF: DC, cuando constituye un schema RDF para representar propiedades (metadatos descriptivos). FOAF (Friend of A Friend), otro vocabulario RDF para representar las propiedades de las personas en las Redes Sociales. SKOS, es también un vocabulario RDF
Crear Tesauros/Vocabularios para la SW Fuente: Mondeca http://www.mondeca.com/index.php/en/intelligent_topic_manager/applications/itm_t3_terminology_thesaurus_taxonomy_metadata_dictionary
SKOS: Un vocabulario RDF Sirve para crear Sistemas de Organización del Conocimiento “orientados al lenguaje” Tesauros Glosarios Vocabularios controlados (listas de autoridad, etc.) Terminologías Y… no está muy claro, para: Esquemas de clasificación Taxonomías Directorios Web (esquemas para definir categorías de WebLogs)
Clasificación de estándares para la construcción de Vocabularios en el contexto-e De diseño (ej. Z39.19, IFLA Guidelines) ISO 25964: Thesauri and interoperability with other vocabularies Part 1: Thesauri for information retrieval Part 2: Interoperability with other vocabularies De estructura (ej. SKOS, Zthes) Pero también… De identificación de conceptos, términos y vocabularios (URIs/URLs, Persistent ID) Protocolos, perfiles y APIs (SKOS-API, WordMap, Zthes) Otros estándares Estándares de base (marcado, metadatos, etc.) Estándares de traducción, localización y tecnologías del lenguaje (openTag) Estándares para el manejo de corpus ISO TC37 Terminología Ver: Standards for Content Creation and Globalization
SKOS-Core: http://www.w3.org/2004/02/skos/ Definición: SKOS Core es un vocabulario que sirve para hacer descripciones RDF de Sistemas de Organización del Conocimiento (KOS) de orientación lingüística, como por ejemplo: Tesauros, Glosarios, Vocabularios Controlados, Taxonomías, Esquemas de clasificación (schemes). Especificaciones: SKOS Primer: Quick Guide to Publishing a Thesaurus on the Semantic Web: http://www.w3.org/2004/03/thes-tf/primer/ Guía (SKOS Core-2005): http://www.w3.org/2001/sw/Europe/reports/thes/1.0/guide/ SKOS 2009: http://www.w3.org/TR/swbp-skos-core-guide/ Vocabulario SKOS: http://www.w3.org/2004/02/skos/
Características de las relaciones en SKOS Concepto Término preferido (descriptor) Término alternativo (no descriptor) Nota Definición, alcance, nota histórica, etc. Relación Semántica Fuente: Alistair Milles
SKOS: Características Extensibilidad: Permite crear propiedades específicas como subpropiedades Se pueden etiquetar propiedades según las necesidades del usuario: Por ejemplo, nombres propios, científicos, etc. También se pueden establecer Relaciones Semánticas según el usuario: Por ejemplo: BroaderGeneric, BroaderInstantive … PartOf. Gran interoperabilidad: se pueden crear aplicaciones especializadas / adaptadas pero que sigan siendo interoperables con otras aplicaciones más genéricas (interoperabilidad semántica de tesauros sin perder especificidad técnica)
SKOS : otras características Permite poner conceptos en múltiples esquemas (schemes) de conceptos: Schemes virtuales (“Views”) Reutilización de schemes Relaciones entre schemes Crear “super-schemes”
Propuestas de SKOS 5 clases: Classes CollectableProperty Collection Concept ConceptScheme OrderedCollection 26 Propiedades: altLabel altSymbol broader changeNote definition editorialNote example hasTopConcept hiddenLabel historyNote inScheme isPrimarySubjectOf isSubjectOf member memberList narrower prefLabel prefSymbol primarySubject privateNote publicNote related scopeNote semanticRelation subject subjectIndicator
Ejemplo: Term: Economic cooperation Used For: Economic co-operation Tomamos un término del UK Archival Thesaurus Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration European economic cooperation European industrial cooperation Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries. http://www.ukat.org.uk/thesaurus/term.php?i=1750
Ejemplo: en SKOS se representaría... <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750"> <skos:prefLabel>Economic cooperation</skos:prefLabel> <skos:altLabel>Economic co-operation</skos:altLabel> <skos:scopeNote>Includes cooperative measures in banking, trade, industry etc., between and among countries.</skos:scopeNote> <skos:inScheme rdf:resource="http://www.ukat.org.uk/thesaurus"/> <skos:broader rdf:resource="http://www.ukat.org.uk/thesaurus/concept/4382"/> <skos:narrower rdf:resource="http://www.ukat.org.uk/thesaurus/concept/2108"/> <skos:narrower rdf:resource="http://www.ukat.org.uk/thesaurus/concept/9505"/> <skos:narrower rdf:resource="http://www.ukat.org.uk/thesaurus/concept/15053"/> <skos:narrower rdf:resource="http://www.ukat.org.uk/thesaurus/concept/18987"/> <skos:related rdf:resource="http://www.ukat.org.uk/thesaurus/concept/3250"/> </skos:Concept> </rdf:RDF>
Desarrollo actual de SKOS (W3C) Existen distintos grupos de trabajo: W3C Semantic Web Best Practises & Deployment Working Group (SWBPD-WG) Grupo de Trabajo de Tesauros (Thesaurus Task Force) Coordinado por Alistair Miles y & Dan Brickley Se encargan de crear estrategias para representar contenidos de tesauros utilizando RDF y OWL Especificaciones SKOS: http://www.w3.org/2004/02/skos/
SKOS Extensions y Mapping Las extensiones de SKOS son un conjunto de términos que extienden el vocabulario SKOS-Core de tal forma que pueda soportar algunas de las características más básicas de los vocabularios documentales, sobre todo, de los tesauros. SKOS Mapping es otro vocabulario RDF para describir las interrelaciones (mapeos) entre distintos esquemas de conceptos (schemes) SKOS mapping y extensions, confluyen en una Especificación (Recomendación Agosto 2009): http://www.w3.org/TR/skos-reference/
Tesauros en SKOS GEMET (General Multilingual Environmental Thesaurus): http://www.eionet.europa.eu/gemet/rdf UKAT (UK Archival Thesaurus): http://www.ukat.org.uk/downloads/data.php GCL (Government Category List): http://isegserv.itd.rl.ac.uk/skos/gcl/ APAIS (Australian Public Affairs Information Service): http://isegserv.itd.rl.ac.uk/skos/apais/ AGROVOC (FAO), MeSH, etc. KEA (Keyphrase Extraction Algorithm) http://www.nzdl.org/Kea/download.html
Vocabularios de base lógica Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Vocabularios de base lógica Ontologías y Topic maps Eva Méndez. Universidad Carlos III de Madrid
Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Ontologías Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Gruber (1993) [Borst (1997)]: Especificación sistemática [formal] de una conceptualización [compartida] Una ontología es una herramienta conceptual que define un vocabulario común para compartir información dentro de un determinado dominio 80’s: IA. para compartir y reutilizar conocimiento 90’s: Ingeniería Web (ingeniería ontológica): descripciones semánticas explícitas de recursos conceptualización significa modelo abstracto de un fenómeno, que puede ser visto como un conjunto de reglas informales que restringen su estructura, que por lo general se expresa como un conjunto de conceptos (entidades, atributos,procesos), sus definiciones e interrelaciones; formal implica una organización teórica de términos y relaciones usados como herramienta para el análisis de los conceptos de un dominio; compartida significa que captura un conocimiento consensual que es aceptado por una comunidad; explícita se refiere a la especificación de los conceptos y a las restricciones sobre éstos Eva Méndez. Universidad Carlos III de Madrid
Ontologías Son conjuntos de... Su objetivo es: Necesitan… ... Conceptos o clases (términos que evocan conceptos) … Atributos (características de esos objetos) ... relaciones entre los términos (conceptos), ... que describen un dominio de aplicación concreto. Su objetivo es: Creación de un diccionario de términos compartidos y comprensibles para diferentes aplicaciones y/o comunidades que permita la interoperabilidad. Cualificar los términos para que representen conceptos Necesitan… “Responsabilidad ontológica” Formalización
Ontologías: Estándares SHOE (Simple HTML Ontology Extensions) http://www.cs.umd.edu/projects/plus/SHOE/ OIL (Ontology Inference Layer) DAML(DARPA Agent Markup Language) (http://www.daml.org), DAML+OIL RDF (http://www.w3.org/RDF/), OWL (Web Ontology Language)
Ontologías: Estándares OWL (Web Ontology Language): http://www.w3.org/2001/sw/WebOnt/: 6 recomendaciones del W3C (10 febrero 2004) OWL Web Ontology Language Overview OWL Web Ontology Language Guide OWL Web Ontology Language Reference OWL Web Ontology Language Semantics and Abstract Syntax OWL Web Ontology Language Test Cases OWL Web Ontology Language Use Cases and Requirements + 2 Notas: Presentación de la sintaxis en XML y analizador de OWL en RDF/XML
Elementos de una ontología Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Axioma (modelado de verdades) / statements Clase o tipo (conjunto de objetos) - Subclases Instancias (miembros de una clase) Relaciones Propiedades o slots (protégé) Frame (clase + instancias + relaciones) Conceptualización (conceptos, relaciones, propiedades y restricciones) Taxonomía (conceptos organizados jerárquicamente) Vocabulario (conjunto de términos/palabras + su formalización en un dominio) Axioma: Elementos que permiten el modelado de verdades que se cumplen siempre en la realidad. Los axiomas pueden ser estructurales y/o no estructurales. Un axioma estructural establece condiciones relacionadas con la jerarquía de la ontología, conceptos y atributos definidos. Ejemplo: el concepto A no es una clase de A. Un axioma no estructural establece relaciones entre atributos de un concepto y son específicos de un dominio. Ejemplo: la relación F=m*a, que debe cumplirse siempre entre los atributos F (fuerza), m (masa) y a (aceleración) de un determinado concepto. • Clase o tipo: Una clase es un conjunto de objetos (físicos, tareas, funciones...). Cada objeto en una clase es una instancia de esa clase. Desde el punto de vista de la lógica los objetos de una clase se pueden describir especificando las propiedades que éstos deben satisfacer para pertenecer a esa clase. Las clases son la base de la descripción del conocimiento en las ontologías ya que describen los conceptos del dominio. Una clase puede ser dividida en subclases, las cuales representarán conceptos más específicos que la clase a la que pertenecen. Una clase cuyos componentes son clases, se denomina superclase o metaclase. • Instancias o individuos: Son objetos, miembros de una clase, que no pueden ser divididos sin perder su estructura y características funcionales. Pueden ser agrupados en clases. • Relaciones: Se establecen entre conceptos de una ontología para representar las interacciones entre éstos. Definidas por lo general como el producto cartesiano de n conjuntos: R: C1 x C2 x …x Cn. Algunas de las relaciones mas utilizadas son: o Instancia de: Asocian objetos a clases. o Relaciones temporales: Implican precedencia en el tiempo. o Relaciones topológicas: Establecen conexiones espaciales entre conceptos. • Propiedades o slots: Los objetos se describen por medio de un conjunto de características o atributos que son almacenados en los slots. Éstos almacenan diferentes clases de valores. Las especificaciones, rangos y restricciones sobre estos valores se denominan características o facetas. Para una clase dada, los slots y las restricciones sobre ellos son heredados por las subclases y las instancias de la clase. • Frame: Un objeto que incluye clases, instancias y relaciones. • Conceptualización: Conjunto de conceptos, relaciones, objetos y restricciones que caracterizan un domino. • Taxonomía: Conjunto de conceptos organizados jerárquicamente. Las taxonomías definen las relaciones entre los conceptos, pero no los atributos de éstos. • Vocabulario: Conjunto de palabras con una explicación y documentación que persigue la universalidad y el formalismo en el contexto de un dominio. Eva Méndez. Universidad Carlos III de Madrid
Ontologías (metodología y fases) Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Varias metodologías (MethONTOLOGY): Especificación Conceptualización Adquisición de conocimiento Integración Implantación Evaluación Documentación Especificación. Se desarrolla un documento que contenga la meta de la ontología, nivel de granularidad, alcance, propósito... Se identificar los términos a ser representados, sus características y relaciones. Conceptualización. Se organiza el conjunto de términos y sus características en una representación intermedia que el desarrollador de la ontología y los expertos puedan entender. En este paso se construye un glosario de términos, diagramas de relaciones binarias, diccionario de conceptos, tablas de atributos instancias, tablas de atributos clases, tabla de axiomas lógicos, tablas de constantes, tablas de instancias. 3. Adquisición de conocimiento. Este paso se lleva a cabo de manera independiente en la metodología. Su ejecución puede coincidir con otros pasos. Por lo general la adquisición de conocimiento se realiza en tres etapas: reuniones preliminares con los expertos, análisis y revisión de la bibliografía asociada al dominio, y una vez que se tiene un conocimiento base se refina y detalla el conocimiento hasta completar la ontología. 4. Integración. Se identifican las ontologías candidatas a ser reutilizadas en la ontología que se está construyendo, incorporando aquellas piezas de conocimiento que sean de utilidad. 5. Implantación. Consiste en la codificación del modelo conceptual en un modelo codificado en lenguaje ontolingua. 6. Evaluación. Se realiza un juicio técnico a la ontología, al ambiente de software asociado y a la documentación con respecto a un esquema de referencia en cada paso de la metodología. El esquema de referencia puede ser: requisitos de especificación, preguntas de competencias y/o el mundo real. 7. Documentación. Se detallar clara y exhaustivamente cada paso completado y los productos generados. Eva Méndez. Universidad Carlos III de Madrid
OWL (Web Ontology Language) SKOS Core / OWL OWL (Web Ontology Language) Recomendación del W3C (ver tema 6) Para construir vocabularios de base lógica Basado en una pontente inferencia (leyes de inferencia heredadas de OIL). Semántica mucho más precisa. SKOS Core complementa a OWL Es posterior a OWL, todavía no REC. Para construir vocabularios de báse lingüística. Menor potencia de inferencia semántica Semántica menos precisa, pero más flexible (orientada al término lingüístico).
Vocabularios de base lógica: Topic Maps Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Motivación: necesidad de mezclar índices (Newcomb, Pepper) Dificultades del grupo de Davenport para mezclar índices de diferentes conjuntos de documentos electrónicos Estándar ISO 13250-2003 (paradigma de topic maps) para describir estructuras de conocimiento y asociarlas con los recursos de información XTM (XML Topic Maps: http://www.topicmaps.org/xtm) En el fondo es otra manera de caracterizar metadatos Conferencia Topic Maps 2009 (Oslo, 18-19 Marzo) Eva Méndez. Universidad Carlos III de Madrid
Topic Maps: Definición Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Modelo de datos que permite representar estructuras de conocimiento de un dominio específico en forma de red semántica, y al mismo tiempo asociar dichas estructuras con recursos de información heterogénea. Eva Méndez. Universidad Carlos III de Madrid
Topic Maps y RDF Le Grand (2002) están destinados a ser complementarios. Diferencia es que TM es independiente de que existan recursos informativos o no, permitiendo en ocasiones una navegación entre conceptos. RDF está más centrado en la descripción de recursos informativos y no trata la semántica de las relaciones entre metadatos.
“Otros vocabularios”: FOAF Tema 4 (UD2): La condensación de contenidos de los documentos electrónicos Febrero 2009 “Otros vocabularios”: FOAF (sorry en inglés Eva Méndez. Universidad Carlos III de Madrid
Why FOAF for this talk? TR: Is there an existing application that shows how the Semantic Web can form such connections? B-L: If you want to play with the Semantic Web, you can make a friend-of-a-friend file. In a FOAF file [the data component of a personal home page, formatted in a standardized way], you can publish stuff about yourself, your organization, your publication, places, or photographs. You can have a pointer that says this is a photograph about me and other data about the photograph, such as who else is in it. Tim B. Lee Interview at: Technology Review http://www.technologyreview.com/InfoTech/wtr_13784,258,p2.html
FOAF: A Simple SW Application Stands for "Friend Of A Friend“. Creators: Dan Brikley and Libby Miller (more people joined… FOAF-conference) Is a vocabulary defined using RDF schema (RDFS) and OWL Information distributed and extensible FOAF files (pages) and vocabulary (a dictionary of terms –50--). RDF markup for “Person”, “mbox”, “homepage”, “workplaceHomepage”, “schoolHomepage”, “knows”, etc. (personal properties). Provides structured links in a (semantic) Web to other FOAF files. It attempts to avoid data protection concerns.
RDF relationships in FOAF The formal model behind the Semantic Web is based on simple tuples, which relation is defined by one URI. Eva knows Jane UC3M works at Jane Eva Research x DC.Creator 001919… Has phone no.
How can I say in FOAF “I am Eva and I work at UC3M and I know Jane who works at SILS and her FOAF profile is [over here] and here is the title of the research we are doing together.” And: This is my photo (http://www.bib.uc3m.es/~mendez/images/yo.jpg). And here are some other photos, with info on the people and objects depicted in them. If I use FOAF extensions: “I speak Spanish. I am Gemini. I’m friends with Danbri. Here is my calendar in RDF. I like Mediterranean food”.
My (ej.) FOAF file <foaf:Person> <foaf:name>Eva Mendez</foaf:name> <foaf:gender>female</foaf:gender> <foaf:title>Dr</foaf:title> <foaf:givenname>Eva</foaf:givenname> <foaf:family_name>Mendez</foaf:family_name> <foaf:mbox_sha1sum>cf2fd069302feb63fa7f20bd82</foaf:mbox_sha1sum> <foaf:homepage rdf:resource="http://www.bib.uc3m.es/~mendez"/> <foaf:weblog rdf:resource="http://www.evamendez.com/blog/"/> <foaf:knows> <foaf:Person rdf:nodeID=“janeg"> <foaf:name>Jane Greenberg</foaf:name> <foaf:homepage rdf:resource=“http://ils.unc.edu/%7Ejaneg/” /> <rdfs:seeAlso rdf:resource="http://ils.unc.edu/%7Ejaneg/janefoaf.rdf"/> </foaf:Person> </foaf:knows> I have invented some information ...
Some tools: Creating FOAF FOAF-A-MATIC (by Leigh Dodds): http://www.ldodds.com/foaf/foaf-a-matic.html
Some tools: Visualizing FOAF FOAFNAUT (by Jim Ley) http://www.foafnaut.org/
COMMUNITIES / SERVICES using/export FOAF: Some tools: Using FOAF COMMUNITIES / SERVICES using/export FOAF: LiveJournal: http://www.livejournal.com/ Videntity: http://videntity.org/ MyOpera: http://my.opera.com/community/ Ecademy: http://www.ecademy.com/ eConozco: http://www.econozco.com/ Others… [your community / net]?
FOAF: Inspiring Vocabularies and tools FOAF Speaks, reads, writes (habla, lee, escribe). By Inkel: http://f14web.com.ar/inkel/rdf/schemas/lang/index.en.html An extension of FOAF elements To give information about the languages speaked by the people implied in a FOAF description. DOAP: http://usefulinc.com/doap by Ed Dumbill Description Of A Project RDF vocabulary for describing Open Source Programs. Viewer (DOAPer Firefox Extension): http://crschmidt.net/doap/doaper.html FLICKRGRAPH: http://www.marumushi.com/apps/flickrgraph/
FOAF: Inspiring Vocabularies and tools FLICKRGRAPH: http://www.marumushi.com/apps/flickrgraph/ It worked!
4. Discusión sobre el futuro de la Web Semántica, Web 3 4. Discusión sobre el futuro de la Web Semántica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semánticas
La Clave: INTEROPERABILIDAD Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Keynote word for the work we’re doing 3 main aspects of interoperability - Human and political; - technical and semantic; - users and usability Eva Méndez. Universidad Carlos III de Madrid
Aspectos de la interoperabilidad Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Tecnología Semántica Política Y Humana La interoperabilidad es conectar gente, datos, información en distintos contextos Usuarios y Usabilidad Keynote word for the work we’re doing 3 main aspects of interoperability - Human and political; - technical and semantic; - users and usability Eva Méndez. Universidad Carlos III de Madrid
Bibliotecas Digitales Semánticas: Ejs. Biblioteca Aperta de Milano: http://bami.cilea.it
Bibliotecas Digitales Semánticas: Ejs. VideoActive: http://www.videoactive.eu
Bibliotecas Digitales Semánticas: Ejs. Europeana: http://www.europeana.eu