Empezar a trabajar con XML J.M. Morales-del-Castillo Título.

Slides:



Advertisements
Presentaciones similares
UD 4:Instalación y administración de servicios Web Introducción Jorge De Nova Segundo.
Advertisements

2000.Nov.17 Introducción a XML Erich Bühler
Preparación de documentos
El RSS es un formato basado en XML que permite encontrar aquella información que mejor se adapta a lo que el usuario desea, pero también ofrecerla de.
Repaso desde HTML a XHTML
CI-2413 Desarrollo de Aplicaciones para Internet
MANEJO DE DOCUMENTOS XML EN MHP Leire Urriza Oiz.
La web semántica y su impacto en la recuperación de información
Servicios Web.
INTRODUCCION A CSS.
DOM ( Document Object Model) Prof. Franklin Cedeño.
Conceptos Generales XML.
Lenguaje de Marcado Extensible XML
Programación Orientada a Objetos
Características generales de un servicio Web.
LENGUAJES DE MARCAS Y SISTEMAS DE GESTIÓN DE INFORMACIÓN
Introducción al desarrollo de proyectos RIA.
Al término de la clase, el alumno reconoce las ventajas de usar JAVASCRIPT para un proyecto web.
Desarrollo de un sistema de clasificación de recursos electrónicos en el ámbito de la lógica matemática” Autor: Antonio Sarasa Cabezuelo Directora: María.
1 Las hojas de estilo en cascada Las hojas de estilo en cascada (Cascading Style Sheets, CSS) son un lenguaje formal utilizado para definir la presentación.
UNIDAD I Conceptos Básicos.
Ing. Cleyver Vazquez Jijon
HTML/CSS Mi primera página.
Web Semántica M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
XBRL “El lenguaje que integra informes financieros, agentes y sistemas informáticos” Agosto 2006Cr. Marcelo Marchesoni.
Título Características y elementos fundamentales J.M. Morales-del-Castillo.
WORLD WIDE WEB Conceptos básicos.
Curso: XML, de los datos a la presentación Julio de 2005 CAPTIVA · eXtensible Stylesheet Language Formatting Objects.
Características y elementos fundamentales J.M. Morales-del-Castillo
Definition Type Document (DTD)
Sistemas de marcado.
Lenguaje de Marcado.
 El primer navegador Web incluía un lenguaje de estilo interno que utilizaba dicho navegador para mostrar las páginas HTML.  Sin embargo estos primeros.
Universidad Tecnologica Oteima DISEÑO DE MEDIOS Y MATERIALES MULTIMEDIOS Rigoberto Quintana M. Hojas de estilo en cascada.
Hyper Text Markup Language Área de Programación y Metodologías de Desarrollo de Software Departamento de Informática Universidad Nacional de San Luis.
Diseño de Páginas Web Unidad 7. 5 puntos imprescindibles 11. Conocer los grupos de trabajo que sobre la red tratan la accesibilidad y el intercambio de.
TIPOS DE SOFTWARE Se denomina software a un programa, equipamiento lógico o soporte lógico necesario para hacer posible la realización de una tarea con.
LENGUAJES DE PROGRAMACIÓN 8.3 PRINCIPALES LENGUAJES.
XHTML.
Curso: XML, de los datos a la presentación Julio de 2005 CAPTIVA · Introducción al mundo XML.
Tecnologías web. Es el método más común de intercambio de información en la world wide web, el método mediante el cual se transfieren las páginas web.
Herramientas informáticas
Introducción a XML por Joel Candia C Universidad Técnica Federico Santa María Departamento de Electrónica ELO-330 Programación de Sistemas.
Guía fácil del RSS.
XML. La vida antes de XML ► Comunicación ► Persistencia ► Armado de Documentos.
Tema 3: Estructura de los documentos XML, DTD Ricardo Eíto Brun Sevilla, de octubre 2002.
Servicio de sindicación
Gabriel Montañés León. RSS es el acrónimo de Really Simple Sindication (Sindicación Realmente Simple). Es un formato basado en el lenguaje XML que permite.
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
MIME EXTENSIONES DE CORREO INTERNET MULTIPROPÓSITO. SERIE DE ESPECIFICACIONES DIRIGIDAS AL INTERCAMBIO TRANSPARENTE DE TODO TIPO DE ARCHIVOS A TRAVÉS DE.
WEB SEMÁNTICA.
WORD WIDE WEB Nace a principios de los años 90 en Suiza. Su función es ordenar y distribuir la información que existe en internet. La World Wide Web se.
Desarrollo HTML, XHTML y CSS. Estructura de una página HTML Documento sin título.
¿Q UÉ ES XML? XML (eXtensible Markup Language)es un meta-lenguaje de codificación de información. Los programas que utilizan el formato XML pueden intercambiar.
WEB 2.0 sitios web que facilitan el compartir información, la interoperabilidad, el diseño centrado en el usuario y la colaboración en la World Wide.
HTML 5 Edgar Vázquez Ayala. Rolando Aarón Pérez Mandujano.
UD 9: “Instalación y administración de otros servicios de red e Internet” Servicio de sindicación Luis Alfonso Sánchez Brazales.
HTML HyperText Markup Language
Que es un navegador de Internet. Un navegador web o de Internet, es un programa que permite visualizar la información que contiene una página web (que.
UNIDAD 4: Introducción a la Lógica Computacional Objetivo : Interpretar y aplicar adecuadamente los fundamentos básicos de la estructura y funcionamiento.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
INTRODUCCIÓN AL HTML. VAMOS A HABLAR DE...HTML Conceptos del lenguaje Estructura para documentos Herramientas usadas para crear documentos Buenas prácticas.
TÓPICOS SELECTOS DE TI WEB SEMÁNTICA GRUPO: ITIC- 411 UNIVERSIDAD TECNOLOGICA DE NEZAHUALC Ó YOTL ENERO 2012.
Capitulo 3 y 4.   La accesibilidad web habla acerca de que tanta facilidad tienen las paginas de internet tanto para los consumidores en general como.
Web y Multimedia II Integrantes: Piero Álvarez Mayra Atience Jhonney Bermeo Johanna Cabrera Gabriela Cango.
GML Geography Markup Language
Texto Marcado genérico del texto El estándar HTML incluye numerosas etiquetas para marcar los contenidos de texto. No obstante, la infinita variedad de.
USB-Ingeniería de Sistemas Programación en Internet Agosto 2015 Introducción al Html.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
HTML.
Transcripción de la presentación:

Empezar a trabajar con XML J.M. Morales-del-Castillo Título

Internet y en especial la Web es uno de los mayores avances en la historia de la humanidad. La raíz del éxito de la Web radica en la idea de combinar documentos hipertextuales con una red global. La tecnología que subyace a esta idea es HTML, un lenguaje simple de etiquetado que abrió nuevas posibilidades para el acceso y recuperación de información. Su principal función es presentar información en la Web y por ello dispone de medios para definir la estructura espacial de los documentos (estilo de las fuentes y párrafos, integración de elementos multimedia, elementos con los que el usuario puede interactuar, etc). Título Introducción a XML (1)

No obstante, en determinados áreas surgió una necesidad creciente de documentos con información bien definida y estructurada que aportara un valor añadido al contenido del recurso. Se hacía necesario diseñar un lenguaje: 1.Capaz de definir algo más que la estructura de un documento. 2.Que fuera interpretable no solo por las personas sino también por máquinas. 3.Que fuera lo suficientemente flexible para poder describir multitud de áreas de interés de empresas, instituciones o particulares. Título Introducción a XML (2)

Ese lenguaje existía desde 1986: SGML (Standard Generalized Markup Language), un metalenguaje (un lenguaje descriptivo que permite definir otros lenguajes descriptivos) que, de hecho, es precursor tanto de HTML como de XML. Es demasiado general y complejo como para aplicarlo con éxito en un medio como la Web. En 1998 aparece XML (eXtensible Markup Language), un lenguaje que surge como una simplificación de SGML, claramente orientado a la Web, que elimina las principales barreras que impedían la implantación de SGML. Este estándar se ha extendido con éxito en los últimos años en diferentes ámbitos (la empresa y la industria, los ámbitos científico y tecnológico, etc.) en forma de vocabularios específicos (veremos ejemplos más adelante). Título Introducción a XML (3)

Es un lenguaje de etiquetado que permite establecer una estructuración lógica de la información independientemente de la forma en que esta se visualice (principal diferencia con HTML). Permite reutilizar un mismo contenido en diferentes plataformas. Título Qué es XML (y 4)

SIMILITUDES: Ambos son lenguajes de etiquetado. Tanto los documentos HTML como los XML son fáciles de interpretar y de crear con un simple editor de texto. DIFERENCIAS: XML sirve para describir contenidos mientras que HTML se utiliza para maquetar y presentar esos contenidos. No obstante, el futuro de la Web está en utilizar lenguajes de etiquetado basados en la sintaxis de XML (de hecho existe XHTML, una versión XML de HTML que acabará por sustituir a su predecesor). XML no es el sustituto de HTML ya que ambos están concebidos para desempeñar tareas diferentes. Título XML no es HTML (1)

Título XML no es HTML (2) HTML El capitán Alatriste Arturo Pérez-Reverte XML El capitán Alatriste Arturo Pérez-Reverte

A nosotros nos es fácil interpretar la información que contienen los documentos HTML, pero para una máquina no es posible determinar qué tipo de dato está procesando. –XML simplifica el intercambio de datos al ser un metalenguaje muy implantado en la Web –Permite un código más simple y compacto –Mejora el proceso de recuperación de información (reduciendo la ambigüedad de términos) Título XML no es HTML (3)

XML permite a cualquier individuo diseñar su propio conjunto de etiquetas para solucionar un problema concreto de representación de información. Esta flexibilidad, por otro lado, dificulta su utilidad al no existir un grado de consenso amplio entre la comunidad de usuarios con respecto a la utilización de un mismo vocabulario para resolver un mismo problema. Título XML no es HTML (4)

EJEMPLO Biblioteca A: Biblioteca B: Biblioteca C: Nosotros interpretamos que el contenido de cada etiqueta es el mismo, sin embargo un procesador XML identificará cada etiqueta como una etiqueta distinta. Existen diferentes soluciones para paliar este problema: crear aplicaciones que permitan traducir unos vocabularios en otros ó adoptar vocabularios ya diseñados por entidades de prestigio a modo de convención común de comunicación. Título XML no es HTML (y 5)

Es un estándar abierto definido por el W3C, independiente de plataforma y adoptado por la mayoría de empresas y distribuidores de software. XML utiliza UNICODE, un sistema de codificación multilingüe y universal de caracteres que permite el intercambio y visualización de documentos independientemente del alfabeto en el que esté escrito. La separación entre la representación formal y el contenido de los documentos permite reutilizar un mismo contenido para representar fragmentos de un documento de formas diferentes e incluso en diferentes plataformas (teléfonos móviles, PDA’s, ordenadores, etc.). Título Ventajas de usar XML (1)

Los documentos XML contienen metadatos (información autodescriptiva, información sobre la información) lo que los convierte en ricas fuentes de información. Es un metalenguaje orientado a la Web y al tratamiento de información, lo que garantiza integrar recursos de diferentes fuentes (tanto en el presente como en un futuro), como bases de datos, documentos textuales ó páginas web. Título Ventajas de usar XML (y 2)

XML ofrece al profesional de la información la posibilidad de disponer de una herramienta flexible y potente que permitirá ejercer el control necesario sobre la información para procurar una descripción, acceso, recuperación y filtrado más eficaces. La implantación generalizada del uso de metadatos supondrá una modificación en el proceso de catalogación en el que la gran mayoría de los recursos estarán ya “catalogados” en origen (según el contexto de trabajo). Título XML y la biblioteca (1)

Formatos de descripción como MARC se verán sustituidos por otros estándares de descripción de recursos mediante metadatos (como MODS ó MARC- XML). Herramientas tradicionales como los boletines de novedades o los tesauros podrán migrarse a la red usando vocabularios con sintaxis XML como RSS ó SKOS Core respectivamente. Para los sistemas de bibliotecas será más fácil compartir y reutilizar recursos. XML y la biblioteca (y 2)

Existen decenas de vocabularios basados en esta sintaxis que permiten explotar las posibilidades de XML pero con aplicaciones específicas para ámbitos de conocimiento determinados. Según Geroimenko, las diferentes especificaciones XML se pueden dividir en 3 grandes grupos: 1.Especificaciones para diseñar y crear lenguajes basados en XML (y sus correspondientes documentos) 2.Especificaciones para acceder, manipular, transformar y procesar documentos con sintaxis XML 3.Especificaciones para añadir semántica a los recursos Título Clasificación de las especificaciones XML

–XML: Siendo estrictos no podríamos decir que hemos etiquetado un documento con XML ya que como metalenguaje no nos ofrece un conjunto de etiquetas determinado. Lo correcto sería hablar de etiquetar un documento con *XML (vocabulario con sintaxis XML). –XML Namespaces: Especificación que permite evitar la colisión entre nombres de elementos definiendo una referencia URI y un prefijo determinado para identificar cada conjunto de etiquetas. De esta forma podríamos conjugar en un mismo documento varias etiquetas con un mismo nombre (por ejemplo, ). –XML Schema: Es un vocabulario que comienza a sustituir a las antiguas DTD’s. Permite crear y validar diferentes tipos de documentos XML, definiendo los tipos de elementos que puede incluir, la relación que existe entre ellos y el tipo de datos que puede contener. –XPath: Específico para especificar rutas dentro de documentos XML. –XLink: Permite definir enlaces complejos (bidireccionales, múltiples, etc.). Especificaciones para diseñar lenguajes basados en XML

–XSL (eXtensible Stylesheet Language): Se compone de XSL-T (Transformation) y XSL-FO (Formatting Objects). Permite transformar documentos XML en documentos XML intermedios y estos a su vez en cualquier tipo de documento (doc, pdf, txt, etc.). –XQuery: Lenguaje de interrogación para realizar consultas a modo de base de datos. –CSS: Lenguaje para definir hojas de estilo. –XHTML: Reformulación de HTML 4.0 usando sintaxis XML. –SVG (Scalable Vector Graphics): Sirve para definir gráficos vectoriales. –VoiceXML: Específico para aplicaciones de voz. Título Especificaciones para acceder, manipular, transformar y procesar documentos con sintaxis XML

–RDF (Resource Description Framework): Proporciona un modelo de datos que estructura la información en forma de tripletas sujeto-propiedad-objeto (identificadas unívocamente mediante referencias URI) que permite a los agentes software procesar la información e inferir nuevo conocimiento. –RDF Schema: Lenguaje de esquema semántico que define una serie de relaciones semánticas básicas entre los elementos de los documentos RDF. –OWL (Ontology Web Language): Extensión semántica de RDF Schema que permite definir ontologías web (entendidas como conceptualizaciones de un dominio donde se definen los diferentes conceptos que forman ese dominio y las relaciones que establecen entre ellos). –Topic Maps: Permiten crear redes semánticas entre las materias usadas para definir el contenido de documentos y proporciona los medios para visualizarlas gráficamente. –SKOS Core (Simple Knowledge Organisation System): Permite migrar de una forma sencilla tesauros y taxonomías a la Web. Título Especificaciones para añadir semántica a los recursos

La información se estructura en forma de árbol jerárquico en el que hay un elemento raíz del que surgen el resto de elementos a modo de ramas y hojas. Título Cómo se estructuran los documentos XML Elemento raíz Elemento 2 Elemento 1.1 Elemento 1 Elemento 3

Comienza y termina con el símbolo “?” Abre siempre los documentos XML. Indica que es un fichero XML y la versión de la especificación que utilizamos Permite indicar la codificación de datos que utilizamos (en nuestro caso usaremos el conjunto de caracteres Latin-1, aunque existen otras como UTF-8) Título Orden de procesamiento

Los documentos XML se estructuran en forma de árbol por lo que necesitan de un elemento raíz que contenga al resto de elementos que lo componen.... Título Elemento raíz

Se corresponden con los bloques de información que vamos a etiquetar. Vamos a distinguir 3 tipos de elementos: –Elementos con contenido –Elementos vacíos –Elementos que contienen otros elementos Título Elementos

Todo elemento estándar XML se caracteriza por tener una etiqueta de inicio, un contenido y una etiqueta de fin de elemento (al contrario que HTML). Contenido El nombre de las etiquetas de inicio y la de fin de elemento contienen la misma cadena de caracteres, con la salvedad de que el nombre de la etiqueta de fin de elemento está precedida por una barra inclinada que cierra el elemento. El contenido es una cadena de caracteres. Título Elementos con contenido

Pese a su nombre, los elementos vacíos contienen información pero en forma de modificadores o atributos. La barra de fin de elemento aparece en la misma etiqueta que abre el elemento. Título Elementos vacíos

Los elementos pueden contenerse unos a otros pero no solaparse. Hay que cerrar los elementos hijos antes de poder cerrar su elemento padre. Contenido Título Elementos que contienen otros elementos Contenido INCORRECTOCORRECTO

No obstante no se pueden emplear caracteres alfabéticos especiales como tildes, Ñ o Ç. Tampoco se pueden usar unos caracteres especiales reservados para el procesamiento de los ficheros XML: &, “, ‘,. En el contenido se puede usar cualquier carácter excepto los reservados. Título Caracteres permitidos y prohibidos &“‘<> &"&apos;<> Caracteres especiales reservados El nombre los elementos tiene que ser una cadena de caracteres alfanuméricos sin espacios (estos se pueden sustituir por guiones). Los nombres de los elementos son sensibles al uso de mayúsculas y minúsculas. · ·

Dentro de los elementos es posible definir atributos que contienen información adicional sobre el elemento. Su valor está entrecomillado y aparece tras un signo igual.... Las mismas reglas sintácticas definidas para el nombre y contenido de los elementos son aplicables a los atributos y su valor. Título Atributos

Es posible insertar comentarios dentro del código XML El comentario no será procesado por el intérprete XML como parte del árbol. Título Comentarios

Para evitar la colisión de términos de diferentes vocabularios es necesario definir lo que se denomina espacios de nombre. Los espacios de nombre definen un conjunto de etiquetas específico para diferenciarlo unívocamente de cualquier otro. Si en un documento solo vamos a utilizar un espacio de nombre no es necesario declararlo. Si usamos más de uno habrá que declararlos, pudiendo definir alguno de ellos como espacio de nombre por defecto. Título Espacios de nombre (1)

Para especificar un espacio de nombre necesitamos la orden xmlns, un prefijo breve a nuestra elección que identifique el conjunto de etiquetas y una URI (un identificador universal de recursos que no tiene por qué corresponderse con una dirección física real). Se declaran dentro de los elementos y tantos como sean necesarios: IMPORTANTE: Una declaración de espacio de nombre afecta solo a los elementos anidados dentro del elemento en el que se declara. Título Espacios de nombre (2)

Podemos definir un espacio de nombre por defecto. Basta con no añadir sufijo a la declaración. Por lo general, será el espacio de nombre del conjunto de etiquetas diseñado por nosotros <elemento_raiz xmlns=“ xmlns:carp=“ Aunque en documentos no validados (sin esquema o DTD) no es necesario siquiera definir el espacio de nombre por defecto. Con los espacios de nombre en un mismo documento podríamos usar dos etiquetas homónimas sin que haya colisión entre ellas: La Caixa Banco de madera de arce Título Espacios de nombre (y 3)

Sangrar los elementos contenidos en otros de forma que el código sea más legible. Los elementos con igual nivel de anidamiento deberán tener el mismo sangrado. Escribir el nombre de los elementos con la primera letra en mayúscula y el de los atributos en minúscula Buenas prácticas

Título Extensión La extensión de los ficheros XML es.xml

Título Siguiente módulo: Validación de XML con DTD’s © J.M. Morales-del-Castillo 2007