Semantic Web: Orígenes, Tendencias y Perspectivas Dr. Héctor G. Ceballos CIIA 2012
Resumen La Web Semántica surge de la incapacidad de la web tradicional para explotar toda la información que se encuentra disponible en ella. Pasar de una web de documentos a una web de datos se convierte ahora en la meta dorada de la iniciativa de Tim Berners Lee y que es liderada actualmente por el World Wide Web Consortium (W3C). Sin embargo la tarea no era fácil y el título de Web 2.0 le es arrebatado por las comunidades en línea que crean dinámicamente su propio contenido. Sin embargo la apuesta por la semántica no decae, sino que se reconfigura en este nuevo escenario. Por ejemplo, Facebook y Google confían en que las búsquedas semánticas pueden ayudar a los usuarios a encontrar lo que realmente quieren, y a dirigir mejor sus campañas de publicidad por supuesto. La Wikipedia concentra una gran cantidad de conocimiento que eventualmente se constituirá en un repositorio de información semánticamente estructurada. Y las compañías que desarrollan sistemas de información y bases de datos empresariales también están pendientes de esta tecnología: de alguna manera habrá que migrar la información actual. Sin embargo aún hay varios pendientes antes de que la Tecnología Semántica alcance su plena madurez. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 2
Contenido El origen de la Web Semántica Tendencias Tecnología Semántica Aplicaciones actuales Perspectivas 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 3
El origen de la Web Semántica ¿Qué es? W3C Lenguajes y protocolos 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 4
¿Qué es la Web Semántica? En el año 2000, Tim Berners Lee propone una nueva versión del Web: Una web entendible por personas y por máquinas. Una Web de datos, no sólo de documentos Información anotada con etiquetas, ligas o estructuras complejas. Que permitan encontrar inequívocamente lo que se busca. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 5
World Wide Web Consortium Define los estándares para describir y relacionar contenidos. La actividad de W3C se define alrededor de Grupos de Trabajo temáticos ( Working Groups ) compuestos por miembros de la académicos y de la industria. Estos grupos generan recomendaciones que se adoptan como estándares de facto. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 6
Tecnologías, estándares, formatos y lenguajes Definir propiedades y relaciones en la información. Conectar componentes web. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 7
Ontologías (OWL) Recursos identificados por URIs (RDF) Clases y propiedades Herencia (taxonomía de clases) Restricciones de clases y de propiedades. Ej. Propiedades transitivas (part-of) Individuos descritos en términos de tripletas: Modelado de dominios específicos. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 8
Tendencias Semántica suave Redes sociales y social tagging. Estandarización de vocabularios 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 9
Semántica suave Es prácticamente imposible anotar todo el contenido actual de la web. Contextos semánticos: relaciones probabilísticas entre términos. Mesa – Silla – Librero: Mueblería (85%) Mesa – Platillo – Mesero: Restaurante (90%) ¿Volver a la incertidumbre? 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 10
Redes Sociales La información es directa o indirectamente etiquetada por los usuarios. Ej. Personas, lugares y fechas en fotos de Facebook. Cantantes y canciones en YouTube. Identificadores de personas y temas (#) en Twitter. Los comentarios más valiosos son elegidos por la comunidad (Likes). Resultado: jugosas ganancias en publicidad. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 11
Social tagging Ha sido el primer paso para etiquetar contenido masiva y colectivamente. Wisdom of the crowds Folksonomies : sistema colectivo de etiquetas (Tags). Sinónimos, homónimos, polisemia Linked data : Ligas entre tags identificados por URIs. ¿Qué significan la ligas? 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 12
¿Una nueva torre de Babel? Múltiples ontologías de dominio. Fragmentación, falta de portabilidad de datos, limitada interoperabilidad. Estandarización de vocabularios por sectores. Ej. Biomedicina: The Gene Ontology Mapeo de ontologías. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 13
Tecnología Semántica Editores, Generación de vocabulario, Visualización y análisis, Mapeo, Almacenamiento masivo, Razonadores, Suites de integración 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 14
Editores 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 15 Altova SemanticWorks
Generación de vocabulario 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 16 AlchemyAPI
Visualización y análisis 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 17 Cytoscape
Mapeo de ontologías 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 18 Agreementmaker
Almacenamiento Masivo 27/Abr/ OpenLink Virtuoso
Inferencia Razonadores de Conceptos Sistemas de lógica de Primer Orden Pellet, Racer Pro, etc. Aproximaciones probabilísticas Redes Bayesianas, Lógica Difusa Extracción y razonamiento modular Large Knowledge Collider (LarKC). 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 20
Suites de integración 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 21 TopBraid Suite
Aplicaciones actuales SAPHIRE, BioPortal, DBPedia, Metadata 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 22
SAPPHIRE The University of Texas Health Science Center at Houston (2004). Monitoreo y evaluación de situaciones de riesgo en salud pública. Integración de información de hospitales del área de Houston. Control de epidemias después de Katrina. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 23
BioPortal 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 24 Stanford University School of Medicine National Center for Biomedical Ontology (2005) Investigación biomédica y práctica clínica 18.1 Millones
DBPedia Free University of Berlin and University of Leipzig (2007) Anotación de Wikipedia: Linked data + RDF 3.64 M de cosas anotadas 1.83 consistentes 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 25
Microdata – Rich snippets Google, Yahoo y Bing (2011) Vocabularios estándar para anotar páginas: schema.org (Microformats)schema.org Clases y propiedades de Personas, Lugares, Eventos, Organizaciones, etc. Google está empezando a explotar los microdatos: Rich snippets. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 26
Perspectivas 10 años de desarrollo por delante En organizaciones grandes Aplicaciones futuras Jugadores clave 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 27
10 años de desarrollo Hype Cycle for Web and User Interaction Technologies, 2011 (Gartner) 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 28
En organizaciones grandes Extraer conocimiento de su propiedad intelectual. Representación de conocimiento y datos no estructurados. Análisis de investigaciones previas para aprender a partir de la experiencia. Administración de conocimiento. Proveer acceso a memorias corporativas para la toma de decisiones. Organizaciones inteligentes. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 29
Aplicaciones futuras Interoperabilidad entre aplicaciones y sitios web. Ej. Reservaciones de vuelos y hoteles. Descubrimiento automático de conocimiento. Ej. identificar patrones de consumo. Encontrar resultados relevantes en un contexto dado. Ej. Comida vegetariana en una ciudad que visito. Búsqueda semántica de información. Ej. Películas filmadas después de 1990 y nominadas al Oscar. 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 30
Empresas clave 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 31 (Gartner, 2011)
Tecnología Semántica para Organizaciones Inteligentes Tecnológico de Monterrey (2012) Líneas de investigación: Memorias Corporativas de Investigación Colaboración en Redes de Investigación Integración y auditoría autonómica de información 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 32
Preguntas y comentarios Dr. Héctor G. Ceballos 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 33
Buzzwords Academia Description Logics Ontologies Knowledge Engineering Knowledge Management Empresas Semantic Web Conceptual models Unstructured data RDF Stores Corporate memory 27/Abr/2012 Semantic Web: Orígenes, Tendencias y Perspectivas 34