La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Departamento de Lenguajes y Sistemas Informáticos Sindicación de contenidos web: RSS Curso de formación del Departamento de Lenguajes y Sistemas Informáticos.

Presentaciones similares


Presentación del tema: "Departamento de Lenguajes y Sistemas Informáticos Sindicación de contenidos web: RSS Curso de formación del Departamento de Lenguajes y Sistemas Informáticos."— Transcripción de la presentación:

1 Departamento de Lenguajes y Sistemas Informáticos Sindicación de contenidos web: RSS Curso de formación del Departamento de Lenguajes y Sistemas Informáticos de la Universidad de Alicante para el Departamento de Formación de la Excelentísima Diputación Provincial de Alicante

2 Introducción

3 La necesidad de información Internet nos proporciona una ingente cantidad de información. Cada vez nos interesa conseguir más información: síndrome de bulimia. Tenemos que ir en busca de esa información hasta sus fuentes.

4 En busca de la información Tenemos que gastar tiempo en ir a buscarla. Tenemos recordar donde está la fuente. Sólo vamos a fuentes conocidas también hay que salir a la caza de nuevas fuentes.

5 La metáfora del agua En la Antigüedad los seres humanos iban en busca de agua a las fuentes. En la Modernidad casi todos tenemos agua corriente en casa. PREGUNTA: ¿Por qué tenemos que salir a buscar la información en lugar de canalizarla hasta nuestra casa?

6 Gestionar la información Cada vez recibimos un mayor flujo entrante de información: Si no gestionamos bien ese flujo se convertirá en una inundación. Si no gestionamos bien ese flujo se convertirá en una inundación. La información hay que: Filtrarla. Filtrarla. Organizarla. Organizarla. Expurgarla. Expurgarla. Priorizarla, etc. Priorizarla, etc.

7 Controlando la información:Feeds y agregadores. Feed : canal o suministro controlado de información. Agregador: Herramienta software que recoge y presenta de forma conjunta diversos feeds. Herramienta software que recoge y presenta de forma conjunta diversos feeds. Puede ser local (escritorio) o remota (servidor web). Puede ser local (escritorio) o remota (servidor web). Consumidor: puede ser un individuo o un sistema software que recoge y distribuye feeds.

8 Tareas de un consumidor defeeds Descubir feeds: Dado un sitio web encotrar su feed asociado. Dado un sitio web encotrar su feed asociado. Descargarse le información asociada: Obtener la información (documentos) asociados al feed (de forma selectiva). Obtener la información (documentos) asociados al feed (de forma selectiva). Analizar el documento RSS: Determinar la estructura de la información. Determinar la estructura de la información. Interpretar los datos: Determinar la semántica asociada de componentes. Determinar la semántica asociada de componentes. Procesar y almacenar los datos: Hacer algo útil con los datos obtenidos. Hacer algo útil con los datos obtenidos.

9 Tecnologías de base HTTP: Protocolo de transporte orientado a texto. Protocolo de transporte orientado a texto.HTML: Lenguaje de presentación. Lenguaje de presentación.XML: Metalenguaje de codificación. Metalenguaje de codificación.

10 Evolución del RSS

11 Historia del RSS Los precursores: MCF, Netscape Channels y Microsoft CDF. MCF, Netscape Channels y Microsoft CDF. Nace RSS (0.91) El cisma: RSS 1.0 RSS 1.0 RSS 0.92, 0.93, 0.94 RSS 0.92, 0.93, 0.94 RSS 2.0 RSS 2.0Atom

12 RSS 2.0 RSS 2.0 sigue la línea de RSS 0.91, 0.92, 0.93 y 0.94 (pero incompatible hacia atrás). La documentación técnica de los anteriores no es muy buena, por lo que hay muchos feeds mal- formados. Vamos a centrarnos en como construir buenos documentos RSS 2.0

13 Estructura básica RSS 2.0 El elemento principal (raíz) de un documento RSS 2.0: … … tiene como único elemento hijo canal, que contiene toda la información y meta-información: tiene como único elemento hijo canal, que contiene toda la información y meta-información: tiene 3 elementos hijo obligatorios y 16 opcionales. tiene 3 elementos hijo obligatorios y 16 opcionales.

14 Elementos obligatorios del canal title: Es el nombre del feed. En muchos casos tiene el mismo nombre que su sitio web o servicio web. Es el nombre del feed. En muchos casos tiene el mismo nombre que su sitio web o servicio web. link: Una URL que apunta a al recurso asociado que cumple con el esquema estándar de URI. Una URL que apunta a al recurso asociado que cumple con el esquema estándar de URI. description: Una breve descripción del canal. Una breve descripción del canal.

15 Elementos opcionales del canal-1 language : El idioma con el que está escrito el feed. Se debe usar el sistema estándar de abervaturas: FRC-1766 El idioma con el que está escrito el feed. Se debe usar el sistema estándar de abervaturas: FRC-1766 copyright: Una nota de derechos de autor del contenido. Una nota de derechos de autor del contenido. managingEditor: El e-mail del responsable de gestión del servicio. El e-mail del responsable de gestión del servicio. webMaster: EL e-mail de la persona responsable de las cuestiones técnicas del servicio. EL e-mail de la persona responsable de las cuestiones técnicas del servicio.

16 elementos opcionales-2 elementos opcionales-2 pubDate : Fecha de publicación del contenido del canal. Debe estar en el formato estándar definido por: RFC-822 Fecha de publicación del contenido del canal. Debe estar en el formato estándar definido por: RFC-822 lastBuildDate: Fecha de última actualización del contenido: RFC-822 Fecha de última actualización del contenido: RFC-822 Nota: Nota: pubDate tiene el sentido de una fecha futura de cuando se debe publicar el contenido. pubDate tiene el sentido de una fecha futura de cuando se debe publicar el contenido. lastBuildDate: tiene el sentido de una fecha pasada, en la que se actualizó por última vez el contenido.

17 elementos opcionales-3 elementos opcionales-3 category : Es una clasificación temática del contenido en una taxonomía. Contiene un atributo opcional domain para contextualizar la taxonomía. Es una clasificación temática del contenido en una taxonomía. Contiene un atributo opcional domain para contextualizar la taxonomía. generator: Indica que programa creó el fichero RSS. Indica que programa creó el fichero RSS. docs: Una URL que debe apuntar a donde se encuentra la documentación técnica del estándar: Una URL que debe apuntar a donde se encuentra la documentación técnica del estándar:<docs>http://blogs.law.harvard.edu/tech/rss<docs/>

18 elementos opcionales-4 elementos opcionales-4 cloud: Es un elemento raramente usado. Sirva para especificar servicios de Publicación/Subscripción. Es un elemento raramente usado. Sirva para especificar servicios de Publicación/Subscripción. ttl (Time-to-Live): Número mínimo de minutos que debe esperar el programa de agregación para recargar el feed. Número mínimo de minutos que debe esperar el programa de agregación para recargar el feed. image: Describe una imagen que acompaña al feed. Describe una imagen que acompaña al feed. rating: Catalogación PICS para el feed. Catalogación PICS para el feed.

19 Elemento Elemento RSS 2.0 puede tener un número indeterminado de. Contiene la información fundamental del feed. No es obligatorio que exista uno, pero un feed sin ninguno no tiene mucho sentido (Raro,¿no?). Todos los hijo de son opcionales, salvo que debe tener un o.

20 elementos elementos title, link, description, category, pubDate: Significado análogo que para Significado análogo que para author: El e-mail del autor del contenido del item. El e-mail del autor del contenido del item. comments: La URL de un documento de comentarios para el item. La URL de un documento de comentarios para el item. enclosure: Describe un fichero que pueda ir asociado al item. Describe un fichero que pueda ir asociado al item. guid: Identificador Unico Global (para dicho item). Identificador Unico Global (para dicho item). source (url): El nombre u la dirección web del sitio de donde proviene el item El nombre u la dirección web del sitio de donde proviene el item

21 Ejemplo RSS 2.0 <channel> Un feed simple Un feed simple <link>http://www.ua.es/index.html<link/> Un canal RSS hipotético Un canal RSS hipotético <item> Noticias de la UA Noticias de la UA <link>http://www.ua.es/Noticias/noticia_005.html<link/> Noticias generales Noticias generales <category>Cultura<category/>

22 Ejemplo RSS 2.0 – cont. Vicerrectorado Extensión Univ. Vicerrectorado Extensión Univ. 02/02/06 20:00:00 GMT 02/02/06 20:00:00 GMT <item/><item>…<item/><channel/><rss/>

23 Módulos Los módulos son un mecanismo que tiene RSS para introducir elementos nuevos. De esta forma se puede extender la expresividad del esquema sin modificar el estándar. De esta forma se puede extender la expresividad del esquema sin modificar el estándar. Cada uno puede construir su propio módulo para sus contenidos particulares. La mayoría de los agregadores los ignorarán, pero tus propias aplicaciones pueden sacar partido ellos. La mayoría de los agregadores los ignorarán, pero tus propias aplicaciones pueden sacar partido ellos. Los módulos están basados en el mecanismo de espacios de nombres (namespaces).

24 Ejemplo de módulo http://www.dlsi.ua.es/pps/ModuloPPS …<pps:enlaceImp>http://www.w3.org<pps:enlaceImp/>…<rss/> El significado de ese nuevo elemento del canal depende completamente de nosotros. No es necesario que haya ningún documento en la dirección que indica el namespace, pero es una buena práctica situar allí algún documento de especificación.

25 RSS 1.0

26 El debate RDF El punto de discrepancia mayor para la ruptura entre las dos escuelas de desarrolladores RSS fue el diseño del mecanismo de módulos. Mientras RSS 0.9x se mantenía en una postura en contra, la línea Rss 1.0 esr completamente a favor.

27 Argumentos pro y contra PRO: El lenguaje RDF (una aplicación de XML) tiene mucha mayor expresividad y flexibilidad para la construcción y manejo de módulos que el simple mecanismo de anmespaces. El lenguaje RDF (una aplicación de XML) tiene mucha mayor expresividad y flexibilidad para la construcción y manejo de módulos que el simple mecanismo de anmespaces.CONTRA: La sintaxis de RDF es muy compleja y difícil de manejar. Es necesario estudiarla a fondo y dominarla (ser un experto). La sintaxis de RDF es muy compleja y difícil de manejar. Es necesario estudiarla a fondo y dominarla (ser un experto).

28 Metadatos en RSS 2.0

29 RSS 1.0

30 Dublin Core

31 Objetivos

32 Definiciones


Descargar ppt "Departamento de Lenguajes y Sistemas Informáticos Sindicación de contenidos web: RSS Curso de formación del Departamento de Lenguajes y Sistemas Informáticos."

Presentaciones similares


Anuncios Google