Web Of Data y los Repositorios Institucionales Consorcio SIU – Módulo Bibliotecas Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves.

Slides:



Advertisements
Presentaciones similares
LOS SISTEMAS NACIONALES DE CIENTÍFICO-TECNOLÓGICA
Advertisements

Escribir aquí el título de la WQ
Estadísticas en Moodle
Publicaciones científicas apoyadas con tecnologías de información Jorge Walters Gastelu Marzo de 2004 Santiago, Chile.
Diferencia Entre Blogs y Websites Christian O. Rodríguez Méndez 8 de abril de 2010.
Cómo usar los mapas conceptuales en el entrenamiento NECOBELAC
Herramientas informáticas
CUPS Configuración y Uso de Paquetes de Software
Bibliotecas Virtuales
La web semántica y su impacto en la recuperación de información
Patricia Muñoz Palma Directora Programa de Información Científica
El poder de las redes. Sociedad de la información El acelerado ritmo de apropiación social de las tecnologías de la información proceso de alfabetización.
IDES - 20 de Noviembre Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano.
Mag. Gabriela Cabrera, Lic. Anibal Carro, Lic. Patricia Schiaffino
Introducción a la Web Semántica (Curso en Buenos Aires. SIU)
Características generales de un servicio Web.
Cualquier sitio web puede ser utilizado en un momento determinado como medio para llevar a cabo ciertos aprendizajes, por ejemplo se pueden aprender cosas.
WEBQuest OBJETOS VIRTUALES DE APRENDIZAJE
Autor: Antonio Sarasa Cabezuelo Directora: María Antonia Huertas.
Nuevos roles de la biblioteca en la edición, difusión y acceso al libro académico y científico digital CLACSO Consejo Latinoamericano de Ciencias Sociales.
Ma. Antonieta Rodríguez CED-CELE. Contenido  eXe - Learning  Recursos didácticos para ambientes web.
DIALNET. Un portal de difusión de la producción científica hispana Zaragoza. 15 diciembre 2006.
Aplicando las Pautas ¡¡Comprendiéndolas!!. El espíritu “El poder de la Web está en su universalidad. Que todo el mundo pueda acceder, a pesar de la discapacidad,
Quién es Quién: "La biblioteca universitaria y los servicios de apoyo a la docencia y la investigación" 29 de octubre de 2010 Cor-Ciencia: plataforma digital.
¿Qué es la Alfabetización Informacional (Alfin)?
PAGINA WEB Kelly Hernández Santiago Aranzazu 11:c Carlos Fernández.
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
V Jornada Temas Actuales en Bibliotecología Biblioteca del Centro Médico de Mar del Plata Viernes 31 de Octubre de 2014 Vocabularios controlados y procesos.
DATA WAREHOUSE Equipo 9.
1. ¿QUÉ ES LA INTERNET? INTERNET ES UN CONJUNTO DESCENTRALIZADO DE REDES DE COMUNICACIÓN INTERCONECTADAS QUE UTILIZAN LA FAMILIA DE PROTOCOLOS TCP/IP,
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales de Aprendizaje.
Servidores Conceptos Generales.
Sebastián Bedoya Cortés Andrés Zapata Restrepo 11°A 2013 WEB QUEST.
Proyecto ARAI Nº 029 "Fortalecimiento Institucional del Sistema de Bibliotecas de la UBA (SISBI) para la prestación de servicios a terceros" Sistema de.
Hecho por: Alejandra Restrepo. Juan Felipe Aguirre. Grado: 11/A Profesor: Carlos Fernández Medellín 2013.
JOHAN ALEJANDRO SALAZAR MANUELA OCHOA 11 C  Una página web es un documento electrónico diseñado para el World Wide Web (Internet) que contiene.
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales Aprendizaje Red.
Qué es una página web: Una página web es un documento electrónico diseñado para el World Wide Web (Internet) que contiene algún tipo de información como.
Sebastián Franco Henao
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales de Aprendizaje.
ART 480 Seminario de Artes Visuales PRESENTACIÓN STATUS PROYECTO HACU - Walmart.
EDWIN ACOSTA PINILLA DIEGO FERNANDO CASTRO JHON SEBASTIAN CASTRO.
28 de Agosto de 2012 Las TIC en el nivel inicial posibilidades y desafíos.
Using e-technology in production, proofing and printing, and in marketing and promotion Jorge Walters Gastelu Metodologías y Tecnologías de Información.
RODRIGO SALAZAR QUÉ ES EDUCAR BAJO LA ÓPTICA CONSTRUCTIVISTA.
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
CRISTIAN MATEO NOREÑA MELIZA OSPINA MORENO 11 C TECNOLOGIA INFORMATICA LA SALLE DE CAMPOAMOR 2013.
Muchas de las investigaciones sobre el comportamiento de los usuarios de la Web que se están realizando en poblaciones de personas nacidas posteriormente.
MIME EXTENSIONES DE CORREO INTERNET MULTIPROPÓSITO. SERIE DE ESPECIFICACIONES DIRIGIDAS AL INTERCAMBIO TRANSPARENTE DE TODO TIPO DE ARCHIVOS A TRAVÉS DE.
WEB SEMÁNTICA.
CARRERA DE OBSERVACIÓN JORGE YULIAN FLOREZ. ¿QUÉ ES LA INTERNET? INTERCONEXIÓN DE REDES INFORMÁTICAS QUE PERMITE A LOS ORDENADORES O COMPUTADORAS CONECTADAS.
PRESENTACION DE INTERNET CARLOS MARIO RODRIGUEZ DOCENTE DE MATEMATICAS INSTITUCION NORMAL DE ENVIGADO.
Cruz Estrada Nayeli Berenice Deyanira
Juan Pablo Arango Tatiana Zapata L 11C IE LA SALLE DE CAMPOAMOR.
Microsoft Power Point Tema: “Como manejo del Power Point como herramienta estudiantil”.
DIRECCIONES URL Las siglas URL corresponden a las palabras inglesas Universal Resource Locator, que en español viene a significar algo así como "Localizador.
WEB 2.0 sitios web que facilitan el compartir información, la interoperabilidad, el diseño centrado en el usuario y la colaboración en la World Wide.
GUÍA DE USO Acceso A través de las PC habilitadas por IP El acceso a la Biblioteca Electrónica de Ciencia y Tecnología.
Presentación  Nombre del sitio.  Título de la página.  Qué información puede anticiparse de ellos  Es una web oficial? Autor  Es identificable?
Análisis de una web semántica Pablo López Escobés Tecnologías emergentes en sistemas telemáticos MUI-TIC Noviembre 2009.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
11.- REDES SOCIALES VIRTUALES
REVISTAS Y LA INTERNET Jornada de Gestión y Difusión de Revistas Académicas y Científicas Vía Internet Bogota, Noviembre 13 de 2007.
TICS EN LAS UNIVERSIDADES DE ARGENTINA. Las TIC en la Educación La problemática que nos ocupa, las modalidades del proceso de difusión de las Tecnologías.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
/20 1 Registro e Identificadores Alejandra Sánchez Maganto.
Repositorio Institucional de Tesis
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Presentación De UML Lenguaje estándar para escribir planos de software Se usa para visualizar, especificar, construir y documentar los artefactos de un.
Jornada de Trabajo Intercambio de Experiencias de Educación a Distancia para el Desarrollo Profesional Docente Santiago de Chile 24 y 25 de septiembre.
Transcripción de la presentación:

Web Of Data y los Repositorios Institucionales Consorcio SIU – Módulo Bibliotecas Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011

Un poco de Historia (reciente) Se puede situar en el año 2010 la expansión del movimiento Open Data consistente en la puesta a disposición de la sociedad, de manera libre, de datos procedentes de diferentes organizaciones, fundamentalmente del ámbito de la Administración Pública o de aquellos proyectos que han sido financiados con dinero público o creados por una institución pública. Los datos proporcionados suelen tratan sobre diferentes temáticas (médicos, geográficos, metereológicos, sobre biodiversidad, relativos a servicios públicos, etc.). El objetivo de exponer los datos a la sociedad, es aumentar los resultados que se pueden extraer de ellos. De esta forma cualquier persona u organización puede construir en base a esos datos una nueva idea, que produzca nuevos datos, conocimientos o incluso servicios. Se trata de abrir una puerta a la innovación y al conocimiento así como ofrecer nuevas oportunidades de negocio. Por otro lado, en el caso de la Administración Pública, el movimiento Open Data viene a apoyar la tendencia Open Government, por la transparencia sobre la gestión pública y el fomento de la interoperabilidad entre Administraciones.

Portal Open Data Euskadi

¿Y para que puede servir?

Aspectos conceptuales El proceso de liberación de los datos, dado que el objetivo es que pueda reusarse, debe hacerse de acuerdo a pautas que faciliten su procesamiento informático e interoperabilidad. Se liberan datos públicos y no sensibles. Algunos ejemplos? –Inversión pública. Compras, proveedores –Meteorología –Datos geoespaciales –Datos censales consolidados ProcesamientoAplicaciones

La principal diferencia entre la web del hipertexto (1.0 y 2.0) y la web semántica es que mientras la primera vincula páginas o documentos en html, la segunda aboga por ir más allá del concepto documento y enlaza datos estructurados. Web Of Data = Web semántica = Web La web semántica trata de dos cosas: Por un lado, formatos comunes para la integración y combinación de datos provenientes de diversas fuentes, mientras que la Web original se concentró principalmente en el intercambio de documentos. También se trata de lenguaje para el registro de cómo los datos se relacionan con los objetos del mundo real. Esto permite a una persona o una máquina, comenzar en una base de datos, y luego moverse a través de una serie interminable de bases de datos... Web Semántica

RDF Resource Description Framework. El RDF es un esquema para definir e intercambiar metadatos, que se ocupa de la semántica y permite, mediante relaciones de clasificación, crear una jerarquía de conceptos de un dominio. Es el modelo que establece el formato de datos que permite al usuario crear lenguajes entendibles para las computadoras de manera que estas puedan procesar y clasificar semánticamente la información. Como su nombre lo indica (Marco de descripción de recursos) su principal objetivo es la descripción de los recursos en Internet, es decir, una imagen, un documento, una animación, una película, un autor, etc. pueden ser descriptas en término de propiedades y reconocibles unívocamente a través del URI, RDA

(más) RDF Se basa en la idea de declarar recursos usando la expresión en la forma sujeto-predicado-objeto. Esta expresión es conocida en la terminología RDF como tripla o triplete. Una tripla RDF contiene tres componentes, todos con referencia en un URI: – sujeto, una referencia URI, una persona, o un nodo, es el ente al cual nos referimos; – predicado es la propiedad o relación que se desea establecer acerca del sujeto; – objeto es el valor de la propiedad o del otro recurso con el que se establece la relación.

Sujeto Propiedades Objeto

Linked Open Data (2007) 4 reglas básicas 1. usar URIs (uniform resource identifiers) identificando los recursos de forma unívoca 2. usar URIs http para que la gente pueda acceder a la información del recurso. 3. ofrecer información sobre los recursos usando RDF. 4. incluir enlaces a otros URIs, facilitando el vínculo entre distintos datos distribuidos en la web.

Un ejemplo (hipótético) posible aplicable a los RI Registro OAI con esteroides RDF Datos académicos de sus autores (ej: CV) Proyectos de investigación financiados en una disciplina BDD Terminológica Específica RDF Patentes para esa disciplina Publicaciones en editores comerciales Datos geoespaciales

Elemento que faltaba: SPARQL SPARQL permite realizar consultas “semánticas” recorriendo las diferentes relaciones establecidas en los grafos. Así, usando SPARQL, podría querer obtener: “…todas las publicaciones en RI, que tengan al menos dos disciplinas que hayan sido financiadas en el último año y cuyos autores tengan afiliación a universidades del norte del país…”

Más de SPARQL. Comparativo.

Data cloud (Nube de datos) Diagrama de todas las fuentes de datos disponibls y sus relaciones. A mayor cantidad de relaciones entre los datos, que resulten procesables, mayor complejidad posible de implementar en las consultas y en los cruces de los mismos a realizar. Dataset Fuente de información que se mide en número de triplas RDF que publican datos. Algunas publican una interfaz SPARQL, otras no.

2007

2008

2009

2011

Leyendo un poco la nube Hay absolutamente de todo, desde datos de programas de TV, radio, hasta información de Censos en diversos países, estadísticas de turismo en Zaragoza, pasando por fuentes de artículos científicos como PubMed o fuentes terminológicas como Agrovoc. Hay (casi) nula presencia de Latinoamérica en el cloud (por ahora).

DBPedia (I) Hemos visto que en los 3 años analizados, el centro de la nube reside en DBPedia…Pero que es DBPedia? DBpedia is a community effort to extract structured information from Wikipedia and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia, and to link other data sets on the Web to Wikipedia data. We hope this will make it easier for the amazing amount of information in Wikipedia to be used in new and interesting ways, and that it might inspire new mechanisms for navigating, linking and improving the encyclopaedia itself. Otra vez… RDF

DBPedia (II) Podríamos decir (sucintamente) que DBPedia entonces es la versión RDFizada de la Wikipedia. …We are happy to announce the release of DBpedia 3.7. The new release is based on Wikipedia dumps dating from late July 2011.The new DBpedia data set describes more than 3.64 million things, of which 1.83 million are classified in a consistent ontology, including 416,000 persons, 526,000 places, 106,000 music albums, 60,000 films, 17,500 video games, 169,000 organizations, 183,000 species and 5,400 diseases. The DBpedia data set features labels and abstracts for 3.64 million things in up to 97 different languages; 2,724,000 links to images and 6,300,000 links to external web pages; 6,200,000 external links into other RDF datasets, and 740,000 Wikipedia categories. The dataset consists of 1 billion pieces of information (RDF triples) out of which 385 million were extracted from the English edition of Wikipedia and roughly 665 million were extracted from other language editions and links to external datasets. Si, Otra vez… RDF

Nuestro contexto. Antecedentes SIU (I) Organizamos en el año 2009 un seminario dictado por la Dra Eva Méndez que trató sobre la web semántica. En la misma, se puede ver que muchos de los temas de esta presentación, fueron desarrollados… El módulo Bibliotecas del Consorcio SIU viene colaborando en un proyecto de investigación UNNOBA-SIU aplicable a Guaraní 3, para la expresión de competencias educativas, a través del posible uso de ontologías.

BDU 2 Desde fines de 2009 el Consorcio SIU administra la Base de Datos Unificada 2, la cual es un Service Provider de OAI-PMH (cosechador) sobre los Repositorios Institucionales argentinos. La misma cuenta con alrededor de registros / metadatos obtenidos de 18 repositorios nacionales. Se ha participado en las iniciativas generadas por el MINCyT, particularmente en el Sistema Nacional de Repositorios Digitales.

¿Como se podrían integrar los RI al cloud? OAI2LOD Server. Experiencia Como experiencia inicial hemos querido consumir servicios de DBPedia como recurso terminológico para encontrar términos relacionados con una expresión de consulta. Se podrían consumir las imágenes de composición química de drogas, artículos relacionados de PubMed o IEEE, se podrían utilizar otros recursos terminológicos tales como Agrovoc, y muchos etc.

Conclusiones Esta presentación ha recorrido dos ejes principales: El movimiento Open Data como complementario del Acceso Abierto y la Web Semántica o web 3.0 o Web of data. Hemos visto que ambos temas están fuertemente relacionados. Dado el impresionante crecimiento que el Data Cloud manifiesta año a año y a su vez la mayor cantidad de relaciones entre cada Dataset, es que se pueden construir aplicaciones que interrelaciones y recorran el grafo cada vez mas complejas y eficientes. Eso tendrá una relación directa con la percepción del usuario sobre el comportamiento de las aplicaciones pudiendo relacionar datos y responder a consultas que serán percibidas como “más inteligentes”.

Conclusiones (II) Los Repositorios Institucionales son una fuente de información sumamente rica, sea como punto de entrada para relacionar con otras fuentes o incluso como fuente de información primaria (potencial dataset). Las interfaces de búsqueda deben hacer uso de estas posibilidades. El desafío es ocultar la complejidad de SPARQL, trabajar sobre aproximaciones que permitan escalar y recorrer un número rico de grafos y relaciones. Definitivamente las aplicaciones de consulta de información, deben dar paso a convertirse en aplicaciones para el descubrimiento de nuevo conocimiento.

¿Preguntas? Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/PAHO Jueves 27 de Octubre de 2011

Agradecimientos Dra. Eva Méndez por las correcciones y ayuda conceptual. Lic. Sandra Raiher por la asistencia sobre bibliografía relevante. Bib. Paola Azrilevich del MINCyT y equipo OPS/ARG por ayudarnos a salvar la distancia geográfica en esta exposición.

Lic.Luján Gurmendi Directora Ejecutiva Consorcio SIU Isabel Piñeiro Coordinadora Módulo Bibliotecas Consorcio SIU Emiliano Marmonti Informático Módulo Bibliotecas Consorcio SIU Jornada del Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011

Muchas gracias por su atención. Jornada del Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011