29/02/2007 Introducción a la web semántica Jorge García Ochoa de Aspuru bardok EN gmail PUNTO com
2 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
3 /42 29/02/2007 Introducción ● Problemas de la web de hoy – Basada en documentos ● Reformulación de ésta por su propio creador – Basada en los datos y sus relaciones ● Tecnologías y estándares en las que se fundamenta ● Un ejemplo práctico ● Líneas de futuro y conclusiones
4 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
5 /42 29/02/2007 De la web de hoy... ● La web de hoy: – Basada en documentos legibles para personas ● Las personas procesan, buscan, interpretan, transforman, utilizan... la información ● Enlaces en lenguaje natural – Una máquina no puede “razonar” sobre esta información ● Ambigüedades, dependencia de contexto – Ejemplo: buscar “Jaguar” en un buscador ● ¿Animal? ¿Coche?
6 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
7 /42 29/02/ a la web del mañana ● Reformulada por Tim Berners-Lee ● La web actual + metadatos que la enriquezcan ● Descripción de los conceptos y las relaciones entre ellos – A) Concepto “Jaguar” famila felinos – B) Concepto “Jaguar” marcha de coche – Las páginas de (A) estarían etiquetadas con (A): ya no hay ambigüedades ● Al buscar “Jaguar felino” no habría ambigüedad – Tampoco al buscar “Jaguar animal” ● El sistema conoce la relación entre “felino” y “animal”, sabe que no nos referimos al coche
8 /42 29/02/ a la web del mañana ● si buscamos “monotrema” actualmente – sólo páginas que contienen la palabra ● si buscamos “monotrema” en un buscador semántico: – ornitorrincos – equidnas –... – Pero esto son ejemplos tontos ● El potencial es mucho mayor: – Agente que navega por webs de clinicas dentales para concertarnos una cita según nuestra agenda – ¿Ciencia ficción? Las bases ya están aquí...
9 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
10 /42 29/02/2007 Tecnologías de la web semántica ● El pilar de la web semántica: RDF – Resource Description Framework – Afirmaciones acerca de un objeto ● Ternas de tipo: (sujeto,predicado,objeto) ● Un ejemplo: – (persona01235,nombre,jorge) – (persona01235, ,bardokENgmailPUNTOcom) – Un documento RDF forma un grafo ● Los conceptos aparecen relacionados a través de los predicados
11 /42 29/02/2007 Tecnologías de la web semántica ● Los sujetos de las ternas: URIs – identifican al elemento al que se refieren unívocamente ● Los objetos de las ternas: URIs o datos primitivos ● Ejemplo: – ( creador, – ( nombre, "jorge") – ( , "bardokENgmailPUNTOcom")
12 /42 29/02/2007 Tecnologías de la web semántica
13 /42 29/02/2007 Tecnologías de la web semántica – La manera más habitual de trabajar con RDF: ● XML/RDF – Hay otras más sencillas, no XML <RDF xmlns=" xmlns:s=" Jorge bardokENgmailPUNTOcom
14 /42 29/02/2007 Tecnologías de la web semántica ● Problema: – “nombre”, “ ”, “creador”: ● No tienen semántica definida ● Sólo un agente especializado puede trabajar con dichos conceptos – No entendería que el “creador” de una página y el “creator” de otra son lo mismo – Para añadir más semántica, sobre RDF se crea RDF Schema
15 /42 29/02/2007 Tecnologías de la web semántica ● RDF Schema – Se construye sobre RDF – Añade clases, subclases, propiedades ● Similar a la programación orientada a objetos ● Creamos grandes grupos, en los que más adelante insertamos individuos ● Ejemplo: clase animal y subclase caballo:
16 /42 29/02/2007 Tecnologías de la web semántica – Podemos asignar una propiedad “nombre” a los animales: ● Implícitamente, también la tendrán los caballos – Podemos crear individuos: – RDF Schema: más semántica, pero hay más... Lassie
17 /42 29/02/2007 Tecnologías de la web semántica ● OWL: Ontology Web Language – Permite definir ontologías ● Documento o fichero que define de manera formal relaciones entre términos ● Relaciones estandarizadas: – cualquier agente que entienda el estándar entiende la semántica de las relaciones – puede razonar sobre ellas – Extiende RDF Schema proporcionando: ● equivalencias (clases, propiedades), propiedades inversas, transitividad, mayor control de cardinalidades...
18 /42 29/02/2007 Tecnologías de la web semántica – Ejemplo de propiedad transitiva: ● Si afirmamos que: – (es_secuela,tipo,propiedadtransitiva) – (es_secuela,dominio,libro) – (es_secuela,rango,libro) – (el retorno del rey,es_secuela,las dos torres) – (las dos torres,es_secuela,la comunidad del anillo) ● Implicitamente también afirmamos: – (el retorno del rey,es_secuela,la comunidad del anillo)
19 /42 29/02/2007 Tecnologías de la web semántica ● Si también definimos: – (es_precuela,tipo,propiedadtransitiva) – (es_precuela,rango,libro) – (es_precuela,dominio,libro) – (es_precuela,inversa_de,es_secuela) ● Sin necesidad de aportar más información: – (la comunidad del anillo,es_precuela,las dos torres) – (la comunidad del anillo,es_precuela,el retorno del rey) – (las dos torres,es_precuela,el retorno del rey) – Es sólo un ejemplo básico ● La posibilidad de definir toda esa información sin necesidad de escribirla: potencia expresiva
20 /42 29/02/2007 Tecnologías de la web semántica – Grafo A: explícito, pero grafo B: implícito
21 /42 29/02/2007 Tecnologías de la web semántica – Ejemplo más completo: – – – Tres tipos de OWL ● Lite, DL, Full – ordenados de menor a mayor capacidad expresiva – OWL DL es el mayor subconjunto de OWL Full para el que actualmente se puede asegurar la existencia de un proceso de razonamiento decidible para un razonador OWL [
22 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
23 /42 29/02/2007 Herramientas ● Para editar ontologías reales no las escribimos a mano: – Editores de ontologías – Dentro del software libre: Protégé ● es el más conocido ● ● Desarrollado en Java ● Mozilla Public License Version 1.1
24 /42 29/02/2007 Herramientas ● Existen frameworks para trabajar con RDF, RDF Schema y OWL a nivel de programación – JENA: uno de los más conocidos ● ● Framework para Java ● Desarrollado inicialmente por HP ● Código abierto (licencia similar Apache/BSD) ● Proporciona: – RDF API, OWL API, SPARQL API – Leer y escribir RDF en RDF/XML, N3 y N-Triples – Almacenamiento en memoria y persistente
25 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
26 /42 29/02/2007 Un ejemplo práctico ● Compartiendo información... – Ejemplo realizado con JENA y Protégé ● Situación ficticia de compartición de información por dos bibliotecas ● Ambas usan tecnologías de web semántica
27 /42 29/02/2007 Un ejemplo práctico – Grafo de información utilizada por la biblioteca A
28 /42 29/02/2007 Un ejemplo práctico – Se ha realizado un programa usando JENA ● Utiliza la ontología definida para la biblioteca A ● La ubicación de las ontologías y los datos se establece en un fichero de configuración – Si cambia su nombre o ubicación, no necesitamos modificar el programa – La biblioteca A ha llegado a un acuerdo con la biblioteca B para intercambiar información ● Trabajan con una ontología diferente
29 /42 29/02/2007 Un ejemplo práctico – Grafo de información utilizada por la biblioteca B
30 /42 29/02/2007 Un ejemplo práctico – El grafo es diferente... ● diferente información... ● ¿con un enfoque tradicional? – Servicios web... – Transformación de los datos de un formato a otro... – En general: modificación de los programas originales ● con un enfoque semántico – decir a la aplicación que cargue también las ontologías de la otra biblioteca – definir una pequeña ontología que establezca equivalencias – Mucho más sencillo interoperar
31 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
32 /42 29/02/2007 El futuro ● Consultas semánticas: SPARQL – SPARQL Protocol And RDF Query Language – lenguaje de consultas sobre ternas RDF – obtener la información contenida en los grafos ● Servicios web semánticos – WSMO (Web Service Modeling Ontology) – descripciones semánticas de servicios web – composición automática de servicios
33 /42 29/02/2007 El futuro ● Modelos de reglas – SWRL (Semantic Web Rule Language) – Se construye sobre OWL – permite crear predicados del tipo: ● (?x,padre,?y) ^ (?x,hermano,?z) -> (?z,tio,?y) – inferencias sobre modelos de información contenidos en ontologías ● no hay necesidad de realizar modificaciones sobre las mismas.
34 /42 29/02/2007 El futuro ● Reutilización de ontologías – Creación de ontologías “universales” que no tengan que reinventarse cada vez, sino sólo utilizarse ● Ej.: Dublin Core Metadata Initiative – Proporcionar información descriptiva sobre cualquier recurso – contenido del recurso – propiedad intelectual – instanciación del recurso ● Sólo es posible en campos de conocimiento “estático”
35 /42 29/02/2007 El futuro ● Reutilización de modelos de negocio – Nuevos modelos de ingeniería del software: – modelos que se utilizan a la hora de realizar sistemas de información: ● realmente reutilizables ● independientes de lenguajes de programación ● independientes de plataformas utilizadas – son los llamados MDA ● Model-Driven Architectures – linea de investigación para combinar MDA y Web semántica
36 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
37 /42 29/02/2007 Conclusiones ● Web semántica: – potente herramienta a la hora de crear nuevas aplicaciones dentro de la ingeniería informática ● mayor autonomía a la hora de razonar ● encontrar información de utilidad ● proporcionar mayores niveles de interoperabilidad ● permitir realizar aplicaciones más fiables, de un modo más rápido, gracias a la reutilización de modelos de negocio semánticos que han podido ser probados y mejorados
38 /42 29/02/2007 Conclusiones – Potencia de razonamiento de la web semántica utilizada en: ● medicina ● biología ● bioquímica ● estudio de proteínas, interacción de compuestos con diferentes enfermedades, apoyo en el diagnóstico de enfermedades y sus tratamientos, etc.
39 /42 29/02/2007 Conclusiones ● Está tardando en despegar: – hace falta más investigación – enriquecer con semántica información disponible es una tarea difícil y costosa ● Ejemplo: etiquetar las webs en buscadores: – es necesario avanzar en otras áreas, como procesamiento del lenguaje natural – Realizar webs etiquetadas con OWL y siguiendo estándares ● complejo, hoy por hoy ni se cumplen estándares – hay gente que piensa que una web está bien hecha si se ve en Internet Explorer...
40 /42 29/02/2007 Conclusiones ● Muchos los que que la web semántica siga adelante – el esfuerzo puede merecer la pena – nueva "revolución" del procesamiento de la información ● ya sucedió a principios de los 90, cuando Tim Berners- Lee sentó las bases de lo que hoy constituye la World Wide Web
41 /42 29/02/2007 Índice ● Introducción ● De la web de hoy... ●... a la web del mañana ● Tecnologías de la web semántica ● Herramientas ● Un ejemplo práctico ● El futuro ● Conclusiones ● Preguntas
42 /42 29/02/2007 Preguntas Introducción a la web semántica Jorge García Ochoa de Aspuru bardok EN gmail PUNTO com