De la Web Sintáctica a la Web Semántica

Slides:



Advertisements
Presentaciones similares
Ciencia Lluís Codina UPF Taula de Nova Recerca. Departament de Comunicació Octubre 2009 v 1.5.
Advertisements

Generación y Extracción Automática de Metadatos:
UD 4:Instalación y administración de servicios Web Introducción Jorge De Nova Segundo.
Plataformas y revistas científicas de acceso abierto en Chile
Lluís Codina Universitat Pompeu Fabra GRUPO DIGIDOC Octubre 2011 (v2) Web 2.0, 3.0 y Web Semántica: impacto en los sistemas de información.
Lluís Codina Universidad Pompeu Fabra Septiembre 2007 Posicionamiento de Páginas Web: Análisis y Evaluación Curso "Biblioteca Virtual en Ciencias de la.
Lluís Codina I C ONGRESO I NTERNACIONAL DE C IBERPERIODISMO Y W EB 2.0 Bilbao, Noviembre 2009 (v1.1) ¿Web 2.0, Web 3.0 o Web Semántica? El impacto en los.
Lluís Codina (UPF) Primeres Jornades sobre Gestió de la Informació Científica, Barcelona IEC Abril 2012 (JGIC-2012) Web 3.0, Web Semántica y Sistemas de.
Lluís Codina IX E NCUENTRO DE P ROFESORES DE P ERIODISMO E SPECIALIZADO IECE/UPF Barcelona, Junio 2009 (v2) Sistemas de Información Especializados y el.
Lluís Codina UPF/IDEC Abril 2008 Posicionamiento Web Tercera parte: análisis y Métodos.
Enero 2007Seminario DigiDoc Web Semántica y Sistemas de Información Documental Lluís Codina UPF. Seminario DigiDoc Curso Seminario DigiDoc.
Lluís Codina Seminario DigiDoc Octubre 2007
LLUÍS CODINA UPF SEMINARIO DIGIDOC, ABRIL 2007 Scirus, Live y Scholar: Motores de Búsqueda para usos Académicos.
Lluís Codina UPF/IDEC Octubre 2010 Posicionamiento Web Cuarta parte: Análisis y Métodos - 2.
Marzo 2005Jornadas sobre Documentos Digitales - La Web Semántica: Perspectivas para la Documentación. L. Codina UPF 1 La Web Semántica Perspectivas para.
CSS Rogelio Ferreira Escutia. 2 Hojas de estilo cascada, mayo 2010 Definición La hojas de estilo en cascada (en inglés.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
Nau Gran dHivern Intr. a la creación y gestión de páginas web Introducción a la web.
CREACIÓN DE PÁGINAS WEB CON SHAREPOINT DESIGNER 2007 (Sesión 1) Ricardo Ferrís Castell ( ) Departament D Informàtica.
Herramientas informáticas
Tema 6. Evaluación de SRIs
Internet y tecnologías web
THE WORLD WIDE WEB La World Wide Web es una red de ordenadores alrededor de todo el mundo. Todos los ordenadores en la red (web) se pueden comunicar entre.
Cómo cargar contenidos en un curso en Moodle
Resource Description Framework CI-2413 Desarrollo de Aplicaciones para Internet.
7ª Jornada sobre la Biblioteca Digital Universitaria JBDU2009 "La biblioteca universitaria en la web" 5 y 6 de noviembre de 2009 Biblioteca Central de.
Uso de metadatos Dublín Core en sistemas de información en España
La web semántica y su impacto en la recuperación de información
INTRODUCCION A CSS.
Fotografía Es el proceso de grabar imágenes fijas sobre una superficie de material sensible a la luz basándose en el principio de la cámara oscura, en.
Ontologías y Bases de Datos
Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
INTELIGENCIA ARTIFICIAL
XXI Reunión del Foro de Directores y Responsables de Unidades de Información Documental Julio/2005 La explotación cooperativa de contenidos en el contexto.
Lenguajes de Ontologías Gustavo Núñez, Alvaro Rodriguez, Oscar Sena.
TEMA 3: ACCESIBILIDAD A LOS SITIOS WEB
WCS: WEB COVERAGE SERVICE
JBDU º Jornada sobre la Biblioteca Digital Universitaria Los desafíos de la web social La Biblioteca Digital Universitaria en la Web Semántica.
profesor: Luigi Ceccaroni
Características generales de un servicio Web.
Base de Datos Relacional.
© Manuel ColladoHerramientas software-1 Herramientas software Clasificación. Integración de herramientas.
Escuela Politécnica Del Ejército
Estrategias de Búsqueda
La recolección de metadatos y su aplicación en España Xavier Agenjo Francisca Hernández FESABID ª Jornadas Españolas de Documentación.
Introducción al desarrollo de proyectos RIA.
Desarrollo de un sistema de clasificación de recursos electrónicos en el ámbito de la lógica matemática” Autor: Antonio Sarasa Cabezuelo Directora: María.
Web Semántica M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Aplicando las Pautas ¡¡Comprendiéndolas!!. El espíritu “El poder de la Web está en su universalidad. Que todo el mundo pueda acceder, a pesar de la discapacidad,
Lenguaje de Marcado.
 El primer navegador Web incluía un lenguaje de estilo interno que utilizaba dicho navegador para mostrar las páginas HTML.  Sin embargo estos primeros.
Por Diego Lozada.  La visión de la Inteligencia Artificial: La Web semántica es un conjunto de iniciativas destinadas a promover una futura Web cuyas.
Tecnologías web. Es el método más común de intercambio de información en la world wide web, el método mediante el cual se transfieren las páginas web.
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Pensar Relacionalmente: Bases de Datos Relacionales (una visión.
Introducción a XML por Joel Candia C Universidad Técnica Federico Santa María Departamento de Electrónica ELO-330 Programación de Sistemas.
Guía fácil del RSS.
CONCEPTOS. Una página web es un documento creado en formato HTML (Hypertext Markup Language) que es parte de un grupo de documentos hipertexto o recursos.
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
WEB SEMÁNTICA.
III. DESARROLLO DE SISTEMAS.. Podemos definir el desarrollo de sistemas informáticos como el proceso mediante el cual el conocimiento humano y el uso.
WEB 2.0 sitios web que facilitan el compartir información, la interoperabilidad, el diseño centrado en el usuario y la colaboración en la World Wide.
Lenguaje de Programación Web Dinámico Multiplataforma Estándar abierto y accesible Elementos nuevos Retrocompatible Nueva filosofía de trabajo Impulsado.
UNITEC NEGOCIOS ELECTRÓNICOS ”DESARROLLO DE SOFTWARE ”
Punto 1 – Introducción al servicio Juan Luis Cano.
HTML.
CAMINANDO HACIA LA WEB SEMÁNTICA Jesualdo Tomás Fernández Breis Universidad de Murcia Taller sobre estándares Web W3C- 11 de noviembre de.
2.1 Conocer la terminología básica del software para diseñar una página Web
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
TÓPICOS SELECTOS DE TI WEB SEMÁNTICA GRUPO: ITIC- 411 UNIVERSIDAD TECNOLOGICA DE NEZAHUALC Ó YOTL ENERO 2012.
Transcripción de la presentación:

De la Web Sintáctica a la Web Semántica Lluís Codina (UPF) www.lluiscodina.com 4ª Jornada de Usabilidad en Sistemas de Información Digital Barcelona, Mayo 2007

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital Qué es la Web Semántica Un conjunto de normas (recomendaciones) del W3C La visión: una Web cuyo contenido puedan interpretar los ordenadores (¿Inteligencia Artificial?) La motivación: Una infraestructura para el comercio electrónico y los servicios web Un subproducto: ¿Una infraestructura para la gestión del conocimiento? Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Definiciones de la Web Semántica (1) W3C: The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries (…). It is based on the Resource Description Framework (RDF) Wikipedia: La Web semántica es la idea de añadir metadatos semánticos a la World Wide Web Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Definiciones de la Web Semántica (2) W3C: La Web Semántica es una Web extendida, dotada de mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida. Al dotar a la Web de más significado y, por lo tanto, de más semántica, se pueden obtener soluciones a problemas habituales en la búsqueda de información. Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

El síndrome del elefante o las (al menos) tres almas de la WS La visión de la Inteligencia Artificial (IA) > Ontologías La visión de la bases de datos (SGBD) o “del procesamiento robusto” > XML + Metadatos La visión de los servicios: la web semántica no es “solo” para encontrar información Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Una contradicción esencial El punto común: una web que permita razonar a los ordenadores, realizar inferencias y tomar decisiones. El problema esencial: Los ordenadores son máquinas sintácticas y la mera sintaxis no produce semántica. Dicho de otro modo: La hipótesis del sistema de símbolos físicos (A. Newell y Herbert A. Simon ) vs. La hipótesis de la habitación china (John Searle) Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Componentes principales de la WS XML: marcado semántico RDF: sistema común para expresar metadatos OWL: sistema común para expresar ontologías Agentes de usuario: para unir todo lo anterior al servicio del internauta Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Infraestructura necesaria Servidores y sitios web: Con marcados semántico vía XML (p.e. XHTML) Con metadatos Eventualmente: con ontologías asociadas Agentes de usuario: Navegadores no “tolerantes” Capaces de interpretar metadatos Capaces de interpretar ontologías o de invocar las aplicaciones necesarias Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

XML XML: lenguaje para definir lenguajes con etiquetas semánticas (y no de presentación). Ejemplo: <autor>Umberto Eco</autor> vs. <b>Umberto Eco</b> XML Schema: Especificación para asignar tipos de datos, dominios, rangos de valores y restricciones a las etiquetas XML Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital RDF Resource Description Framework: W3C: The Resource Description Framework (RDF) integrates a variety of applications from library catalogs and world-wide directories to syndication and aggregation of news, software, and content to personal collections of music, photos, and events using XML as an interchange syntax. The RDF specifications provide a lightweight ontology system to support the exchange of knowledge on the Web Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital RDF - Metadatos RDF: Un sistema de descripción de entidades (recursos) con una base lógico/lingüística RDF relaciona recursos con propiedades y valores Proporciona un sistema común de expresión de metadatos Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital Ejemplo RDF En modo nativo (gráfico): Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

En modo serializado (RDF/XML) … <rdf:Description rdf:about=“http://w3.org/”> <dc:title>World Wide Web Consortium</dc:title> <rdf:Description> Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital RDF vs SGBD Modelo RDF: Un recurso (sujeto) tiene una propiedad (predicado) con un determinado valor (objeto) Ejemplo: El libro ID123 tiene un título y el valor del título es Romeo y Julieta Equivale a: Una entidad (registro) tiene un atributo (campo) con un determinado contenido (valor) O bien: Recurso=Fila; Propiedad=Columna; Valor=Valor Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital OWL OWL: Web Ontology Language OWL builds on RDF and RDF Schema and adds more vocabulary for describing properties and classes: among others, relations between classes (e.g. disjointness), cardinality (e.g. "exactly one"), equality, richer typing of properties, characteristics of properties (e.g. symmetry), and enumerated classes. Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital OWL - Objetivos OWL (…) add the following capabilities to ontologies: Ability to be distributed across many systems Scalability to Web needs Compatibility with Web standards for accessibility and internationalization Openess and extensiblility Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Otra forma de verlo: la WS como una base de datos Cada unidad significativa de texto (palabra, frase, oración, párrafo, página) está delimitada (marcada) mediante etiquetas XML (cada unidad es un elemento) Cada elemento tiene asociado un tipo de dato (vía schemas) Cada documento, como un todo, contiene (o está asociado a) un conjunto de metadatos. Incluso puede tener metadatos a nivel de elemento (vía RDFa) Resultado: la Web como una gran base de datos descentralizada, distribuida y no coordinada (registros formados por campos + diccionario de datos + descriptores) Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

La WS realmente existente: aplicaciones XML Suites ofimáticas SGBD Editores de sitios web Navegadores Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Ejemplos de software/iniciativas para la WS XML Altova XML Spy Altova Semantic Works Amaya/Anotea Metadatos Dublin Core RDF Protégé Smore Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital ¿Dónde está la WS? No está: En los motores de búsqueda actuales (evitan expresamente los metadatos) En bases de datos (p.e. no está en Scirus, ni en ISI, etc.) En la mayor parte de la web “real” Empieza a estar: En los sitios web que usan estándares de manera estricta y aplican marcados semántico En algunos repositorios (e-prints, pre-prints, etc.) En un reducido (pero selecto) número de sitios web relacionados con la Administración y/o con iniciativas de carácter científico o cultural Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Conclusiones (1): ¿Qué está aportando la WS? Actualmente: Un nuevo formato universal de datos: XML Una fuerte impulso al uso de estándares Web y un redescubrimiento del marcado semántico (HTML y HTML 5) Un renovado debate sobre el uso, definición y alcance de los metadatos Un nuevo formato universal para expresar metadatos: RDF con aplicación a tesauros y lenguajes documentales En el futuro: ¿Servidores de ontologías? ¿Nuevos sistemas de búsqueda y acceso a la información? ¿Una nueva generación de repositorios, bibliotecas digitales y sistemas de información? Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

Conclusiones (2): Paradojas Una web más alejada del público: Hay que tener conocimientos más técnicos para desarrollar páginas web: Declaraciones DOCTYPE, CSS, elementos depreciados, separación de contenido, y formato, etc. Resultado: es necesario conocer más detalles en lugar de que queden ocultos, contradiciendo la evolución “natural” de la informática Nuevos estándares no estándares: HTML 5 > un HTML que no es del W3C Microformatos > metadatos que no son del W3C Mayores dificultades para desarrollar sitios Web: Se deben añadir metadatos a nivel de sitio, página y elemento Marcado semántico: mayor número de elementos, etiquetas y atributos Falta de actores con alicientes claros: ¿A quién beneficia aplicar los estándares de la WS? Algunos problemas que afronta la WS están solucionados por otras vías (p.e. el análisis de enlaces) Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital ¿Qué podemos hacer? El objetivo de la Web Semántica es magnífico. Es la reedición para el Siglo XXI del proyecto del Acceso Universal al Conocimiento. Propuestas: Dar soporte al uso de estándares del W3C (XML, XHTML) > Nuevas páginas o nuevos sitios + Conversión retrospectiva de los ya existentes Utilizar el marcado semántico ya disponible en (X)HTML, tanto en forma de elementos (address) como de atributos (title) Usar aplicaciones y modelos de datos que utilicen XML Expresar metadatos mediante RDF (RDFa, RDF/DC, etc.) Concebir las ontologías como nueva frontera de la semántica documental, estudiar sus posibilidades y, eventualmente, promocionar su aplicación Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital

L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital Referencias D. Fensel et. al. Spinning the semantic web. Cambridge: MIT, 2005 G. Antonou; F.v. Harmelen. A semantic web primer. Cambridge: MIT, 2004 L. W. Lacy. OWL: Representing information using the Web Ontology Language. Ann Arbor: Trafford, 2004 D. R. Miller; K. S. Clarke. Putting XML to work in the library. Chicago: ALA, 2004 J. Tramullas (coord.) Tendencias en documentación digital. Gijón: TREA, 2006 Mayo 2007 L. Codina - 4ª Jornada d'Usabilitat en Sistemes d'Informació Digital