SEMANTIC WEB TOOL Nicolás Amador Griñolo Agustín Domínguez Alvera Universidad de Huelva Versión 1.02
Índice Origen Motivación Enfoques Herramientas Funcionalidades Presentación práctica Novedades versión 1.02 Futuras ampliaciones Conclusiones Cuestiones
Origen
Motivación I
Motivación II Dotar a las webs de semántica que describa su contenido, significado y relación de los datos que poseen Añadir información adicional (meta información) a los contenidos actuales de la Web y a los de nueva creación
Enfoques Dos enfoques: Extracción de características Anotación externa Aplicación de técnicas de minería de datos Anotación externa La meta información no se almacena dentro de la misma página Almacenamiento en repositorios OWL (Ontology Web Language)
Herramientas Java Eclipse Protégé Weka APIs: XULRunner, Mozilla-Interfaces, SWT, JFace, TagSoup, XQEngine, …
Funcionalidades Navegación Web Interacción gráfica con el DOM (Document Object Model) Consultas XPATH Búsqueda de patrones Anotaciones semánticas Exportación de información Soporte para plugins …
Presentación práctica
Búsqueda de patrones I Patrón Ejemplo <p> <b> <i> texto </i> </b> </p> Ejemplo <html> … <p> <b> <i> texto </i> </b> </p> Patrón encontrado
Búsqueda de patrones II Patrón <p> <b> <i> texto </i> </b> </p> Ejemplo <html> … <p> <b> <u> texto </u> </b> </p> Patrón no encontrado
Búsqueda de patrones III <pattern> <name>Test.xml</name> <structure> <FONT> <A>text</A> text </FONT> </structure> </pattern> Nombre Estructura
Plugins I
Plugins II
Ficheros OWL I Se generan dos ficheros de salida: Referido al contenido anotado Referido a las rutas xpointer del contenido anotado Ambos ficheros son completos
Ficheros OWL II Identificadores generados por la aplicación <Autor rdf:about="Autor#1"> <nombre rdf:datatype="http://www.w3.org/2001/XMLSchema#string”> José Luis Álvarez Macías </nombre> </Autor> <Publicacion rdf:about="Publicacion#2"> Applying Data Mining to Software Development Projects: A Case Study <tieneAutor rdf:resource="Autor#1"/> </Publicacion> Contenido de la anotación Identificadores generados por la aplicación
XPointer de las anotaciones Ficheros OWL III <Autor rdf:about="Autor#1"> <rdfs:comment rdf:datatype="http://www.w3.org/2001/XMLSchema#string"> http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/m/Mac=iacute=as:Jos=eacute=_Luis_=Aacute=lvarez.html #xpointer(string-range(/HTML/BODY/P/TABLE/TBODY/TR[1]/TD[2]#/2,2,24)) </rdfs:comment> <nombre rdf:datatype="http://www.w3.org/2001/XMLSchema#string"> </nombre> </Autor> <Publicacion rdf:about="Publicacion#2"> #xpointer(string-range(/HTML/BODY/P/TABLE/TBODY/TR[1]/TD[2]#/6,2,90)) #xpointer(string-range(/HTML/BODY/P/TABLE/TBODY/TR[1]/TD[2]#/6,2,67)) <tieneAutor rdf:resource="Autor#1"/> </Publicacion> XPointer de las anotaciones
XPointer Pueden estar referidos a un fichero remoto o a un fichero local Fichero remoto http://www.google.es/#xpointer(string-range(/HTML/BODY/CENTER/FONT#/1,0,18)) Fichero local /Test/Google.html#xpointer(string-range(/HTML/BODY/CENTER/FONT#/1,0,18)) URL Path relativo XPATH + Inicio+ Offset
Novedades versión 1.02 La opción “File Save” guarda el contenido actualizado de la página en todo momento. Nuevo Formato XPointer: 'URL'#xpointer(string-range('RutaXPath','Origen','Desplazamiento')) Rutas relativas para anotar ficheros locales (Ejemplo: docs\page1.html) Ahora se generan dos ficheros de salida; Uno con el contenido anotado y otro con los XPointers relativos a ese contenido. Permite seguir trabajando con el formato “antiguo”. Corrección de errores.
Futuras ampliaciones Nuevos formatos de exportación Mejoras en las operaciones de anotación: Anotaciones no continuas Edición manual de ficheros OWL Búsqueda + Anotación Mejorar precisión
Conclusiones Proyecto innovador Punto de partida para otros proyectos con objetivo común: Web Semántica Proyecto más cercano al campo de la investigación que al actual tejido empresarial
Cuestiones
Información de contacto Fin de la presentación ¡Gracias por asistir! Información de contacto nicolas.amador@alu.uhu.es agustin.dominguez@alu.uhu.es