La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Empezar a trabajar con XML J.M. Morales-del-Castillo Título.

Presentaciones similares


Presentación del tema: "Empezar a trabajar con XML J.M. Morales-del-Castillo Título."— Transcripción de la presentación:

1 Empezar a trabajar con XML J.M. Morales-del-Castillo Título

2 Internet y en especial la Web es uno de los mayores avances en la historia de la humanidad. La raíz del éxito de la Web radica en la idea de combinar documentos hipertextuales con una red global. La tecnología que subyace a esta idea es HTML, un lenguaje simple de etiquetado que abrió nuevas posibilidades para el acceso y recuperación de información. Su principal función es presentar información en la Web y por ello dispone de medios para definir la estructura espacial de los documentos (estilo de las fuentes y párrafos, integración de elementos multimedia, elementos con los que el usuario puede interactuar, etc). Título Introducción a XML (1)

3 No obstante, en determinados áreas surgió una necesidad creciente de documentos con información bien definida y estructurada que aportara un valor añadido al contenido del recurso. Se hacía necesario diseñar un lenguaje: 1.Capaz de definir algo más que la estructura de un documento. 2.Que fuera interpretable no solo por las personas sino también por máquinas. 3.Que fuera lo suficientemente flexible para poder describir multitud de áreas de interés de empresas, instituciones o particulares. Título Introducción a XML (2)

4 Ese lenguaje existía desde 1986: SGML (Standard Generalized Markup Language), un metalenguaje (un lenguaje descriptivo que permite definir otros lenguajes descriptivos) que, de hecho, es precursor tanto de HTML como de XML. Es demasiado general y complejo como para aplicarlo con éxito en un medio como la Web. En 1998 aparece XML (eXtensible Markup Language), un lenguaje que surge como una simplificación de SGML, claramente orientado a la Web, que elimina las principales barreras que impedían la implantación de SGML. Este estándar se ha extendido con éxito en los últimos años en diferentes ámbitos (la empresa y la industria, los ámbitos científico y tecnológico, etc.) en forma de vocabularios específicos (veremos ejemplos más adelante). Título Introducción a XML (3)

5 Es un lenguaje de etiquetado que permite establecer una estructuración lógica de la información independientemente de la forma en que esta se visualice (principal diferencia con HTML). Permite reutilizar un mismo contenido en diferentes plataformas. Título Qué es XML (y 4)

6 SIMILITUDES: Ambos son lenguajes de etiquetado. Tanto los documentos HTML como los XML son fáciles de interpretar y de crear con un simple editor de texto. DIFERENCIAS: XML sirve para describir contenidos mientras que HTML se utiliza para maquetar y presentar esos contenidos. No obstante, el futuro de la Web está en utilizar lenguajes de etiquetado basados en la sintaxis de XML (de hecho existe XHTML, una versión XML de HTML que acabará por sustituir a su predecesor). XML no es el sustituto de HTML ya que ambos están concebidos para desempeñar tareas diferentes. Título XML no es HTML (1)

7 Título XML no es HTML (2) HTML El capitán Alatriste Arturo Pérez-Reverte XML El capitán Alatriste Arturo Pérez-Reverte

8 A nosotros nos es fácil interpretar la información que contienen los documentos HTML, pero para una máquina no es posible determinar qué tipo de dato está procesando. –XML simplifica el intercambio de datos al ser un metalenguaje muy implantado en la Web –Permite un código más simple y compacto –Mejora el proceso de recuperación de información (reduciendo la ambigüedad de términos) Título XML no es HTML (3)

9 XML permite a cualquier individuo diseñar su propio conjunto de etiquetas para solucionar un problema concreto de representación de información. Esta flexibilidad, por otro lado, dificulta su utilidad al no existir un grado de consenso amplio entre la comunidad de usuarios con respecto a la utilización de un mismo vocabulario para resolver un mismo problema. Título XML no es HTML (4)

10 EJEMPLO Biblioteca A: Biblioteca B: Biblioteca C: Nosotros interpretamos que el contenido de cada etiqueta es el mismo, sin embargo un procesador XML identificará cada etiqueta como una etiqueta distinta. Existen diferentes soluciones para paliar este problema: crear aplicaciones que permitan traducir unos vocabularios en otros ó adoptar vocabularios ya diseñados por entidades de prestigio a modo de convención común de comunicación. Título XML no es HTML (y 5)

11 Es un estándar abierto definido por el W3C, independiente de plataforma y adoptado por la mayoría de empresas y distribuidores de software. XML utiliza UNICODE, un sistema de codificación multilingüe y universal de caracteres que permite el intercambio y visualización de documentos independientemente del alfabeto en el que esté escrito. La separación entre la representación formal y el contenido de los documentos permite reutilizar un mismo contenido para representar fragmentos de un documento de formas diferentes e incluso en diferentes plataformas (teléfonos móviles, PDA’s, ordenadores, etc.). Título Ventajas de usar XML (1)

12 Los documentos XML contienen metadatos (información autodescriptiva, información sobre la información) lo que los convierte en ricas fuentes de información. Es un metalenguaje orientado a la Web y al tratamiento de información, lo que garantiza integrar recursos de diferentes fuentes (tanto en el presente como en un futuro), como bases de datos, documentos textuales ó páginas web. Título Ventajas de usar XML (y 2)

13 XML ofrece al profesional de la información la posibilidad de disponer de una herramienta flexible y potente que permitirá ejercer el control necesario sobre la información para procurar una descripción, acceso, recuperación y filtrado más eficaces. La implantación generalizada del uso de metadatos supondrá una modificación en el proceso de catalogación en el que la gran mayoría de los recursos estarán ya “catalogados” en origen (según el contexto de trabajo). Título XML y la biblioteca (1)

14 Formatos de descripción como MARC se verán sustituidos por otros estándares de descripción de recursos mediante metadatos (como MODS ó MARC- XML). Herramientas tradicionales como los boletines de novedades o los tesauros podrán migrarse a la red usando vocabularios con sintaxis XML como RSS ó SKOS Core respectivamente. Para los sistemas de bibliotecas será más fácil compartir y reutilizar recursos. XML y la biblioteca (y 2)

15 Existen decenas de vocabularios basados en esta sintaxis que permiten explotar las posibilidades de XML pero con aplicaciones específicas para ámbitos de conocimiento determinados. Según Geroimenko, las diferentes especificaciones XML se pueden dividir en 3 grandes grupos: 1.Especificaciones para diseñar y crear lenguajes basados en XML (y sus correspondientes documentos) 2.Especificaciones para acceder, manipular, transformar y procesar documentos con sintaxis XML 3.Especificaciones para añadir semántica a los recursos Título Clasificación de las especificaciones XML

16 –XML: Siendo estrictos no podríamos decir que hemos etiquetado un documento con XML ya que como metalenguaje no nos ofrece un conjunto de etiquetas determinado. Lo correcto sería hablar de etiquetar un documento con *XML (vocabulario con sintaxis XML). –XML Namespaces: Especificación que permite evitar la colisión entre nombres de elementos definiendo una referencia URI y un prefijo determinado para identificar cada conjunto de etiquetas. De esta forma podríamos conjugar en un mismo documento varias etiquetas con un mismo nombre (por ejemplo, ). –XML Schema: Es un vocabulario que comienza a sustituir a las antiguas DTD’s. Permite crear y validar diferentes tipos de documentos XML, definiendo los tipos de elementos que puede incluir, la relación que existe entre ellos y el tipo de datos que puede contener. –XPath: Específico para especificar rutas dentro de documentos XML. –XLink: Permite definir enlaces complejos (bidireccionales, múltiples, etc.). Especificaciones para diseñar lenguajes basados en XML

17 –XSL (eXtensible Stylesheet Language): Se compone de XSL-T (Transformation) y XSL-FO (Formatting Objects). Permite transformar documentos XML en documentos XML intermedios y estos a su vez en cualquier tipo de documento (doc, pdf, txt, etc.). –XQuery: Lenguaje de interrogación para realizar consultas a modo de base de datos. –CSS: Lenguaje para definir hojas de estilo. –XHTML: Reformulación de HTML 4.0 usando sintaxis XML. –SVG (Scalable Vector Graphics): Sirve para definir gráficos vectoriales. –VoiceXML: Específico para aplicaciones de voz. Título Especificaciones para acceder, manipular, transformar y procesar documentos con sintaxis XML

18 –RDF (Resource Description Framework): Proporciona un modelo de datos que estructura la información en forma de tripletas sujeto-propiedad-objeto (identificadas unívocamente mediante referencias URI) que permite a los agentes software procesar la información e inferir nuevo conocimiento. –RDF Schema: Lenguaje de esquema semántico que define una serie de relaciones semánticas básicas entre los elementos de los documentos RDF. –OWL (Ontology Web Language): Extensión semántica de RDF Schema que permite definir ontologías web (entendidas como conceptualizaciones de un dominio donde se definen los diferentes conceptos que forman ese dominio y las relaciones que establecen entre ellos). –Topic Maps: Permiten crear redes semánticas entre las materias usadas para definir el contenido de documentos y proporciona los medios para visualizarlas gráficamente. –SKOS Core (Simple Knowledge Organisation System): Permite migrar de una forma sencilla tesauros y taxonomías a la Web. Título Especificaciones para añadir semántica a los recursos

19 La información se estructura en forma de árbol jerárquico en el que hay un elemento raíz del que surgen el resto de elementos a modo de ramas y hojas. Título Cómo se estructuran los documentos XML Elemento raíz Elemento 2 Elemento 1.1 Elemento 1 Elemento 3

20 Comienza y termina con el símbolo “?” Abre siempre los documentos XML. Indica que es un fichero XML y la versión de la especificación que utilizamos Permite indicar la codificación de datos que utilizamos (en nuestro caso usaremos el conjunto de caracteres Latin-1, aunque existen otras como UTF-8) Título Orden de procesamiento

21 Los documentos XML se estructuran en forma de árbol por lo que necesitan de un elemento raíz que contenga al resto de elementos que lo componen.... Título Elemento raíz

22 Se corresponden con los bloques de información que vamos a etiquetar. Vamos a distinguir 3 tipos de elementos: –Elementos con contenido –Elementos vacíos –Elementos que contienen otros elementos Título Elementos

23 Todo elemento estándar XML se caracteriza por tener una etiqueta de inicio, un contenido y una etiqueta de fin de elemento (al contrario que HTML). Contenido El nombre de las etiquetas de inicio y la de fin de elemento contienen la misma cadena de caracteres, con la salvedad de que el nombre de la etiqueta de fin de elemento está precedida por una barra inclinada que cierra el elemento. El contenido es una cadena de caracteres. Título Elementos con contenido

24 Pese a su nombre, los elementos vacíos contienen información pero en forma de modificadores o atributos. La barra de fin de elemento aparece en la misma etiqueta que abre el elemento. Título Elementos vacíos

25 Los elementos pueden contenerse unos a otros pero no solaparse. Hay que cerrar los elementos hijos antes de poder cerrar su elemento padre. Contenido Título Elementos que contienen otros elementos Contenido INCORRECTOCORRECTO

26 No obstante no se pueden emplear caracteres alfabéticos especiales como tildes, Ñ o Ç. Tampoco se pueden usar unos caracteres especiales reservados para el procesamiento de los ficheros XML: &, “, ‘,. En el contenido se puede usar cualquier carácter excepto los reservados. Título Caracteres permitidos y prohibidos &“‘<> &"&apos;<> Caracteres especiales reservados El nombre los elementos tiene que ser una cadena de caracteres alfanuméricos sin espacios (estos se pueden sustituir por guiones). Los nombres de los elementos son sensibles al uso de mayúsculas y minúsculas. · ·

27 Dentro de los elementos es posible definir atributos que contienen información adicional sobre el elemento. Su valor está entrecomillado y aparece tras un signo igual.... Las mismas reglas sintácticas definidas para el nombre y contenido de los elementos son aplicables a los atributos y su valor. Título Atributos

28 Es posible insertar comentarios dentro del código XML El comentario no será procesado por el intérprete XML como parte del árbol. Título Comentarios

29 Para evitar la colisión de términos de diferentes vocabularios es necesario definir lo que se denomina espacios de nombre. Los espacios de nombre definen un conjunto de etiquetas específico para diferenciarlo unívocamente de cualquier otro. Si en un documento solo vamos a utilizar un espacio de nombre no es necesario declararlo. Si usamos más de uno habrá que declararlos, pudiendo definir alguno de ellos como espacio de nombre por defecto. Título Espacios de nombre (1)

30 Para especificar un espacio de nombre necesitamos la orden xmlns, un prefijo breve a nuestra elección que identifique el conjunto de etiquetas y una URI (un identificador universal de recursos que no tiene por qué corresponderse con una dirección física real). Se declaran dentro de los elementos y tantos como sean necesarios: IMPORTANTE: Una declaración de espacio de nombre afecta solo a los elementos anidados dentro del elemento en el que se declara. Título Espacios de nombre (2)

31 Podemos definir un espacio de nombre por defecto. Basta con no añadir sufijo a la declaración. Por lo general, será el espacio de nombre del conjunto de etiquetas diseñado por nosotros <elemento_raiz xmlns=“http://www.unaURI.com” xmlns:carp=“http://www.otro.org”> Aunque en documentos no validados (sin esquema o DTD) no es necesario siquiera definir el espacio de nombre por defecto. Con los espacios de nombre en un mismo documento podríamos usar dos etiquetas homónimas sin que haya colisión entre ellas: La Caixa Banco de madera de arce Título Espacios de nombre (y 3)

32 Sangrar los elementos contenidos en otros de forma que el código sea más legible. Los elementos con igual nivel de anidamiento deberán tener el mismo sangrado. Escribir el nombre de los elementos con la primera letra en mayúscula y el de los atributos en minúscula Buenas prácticas

33 Título Extensión La extensión de los ficheros XML es.xml

34 Título Siguiente módulo: Validación de XML con DTD’s © J.M. Morales-del-Castillo 2007


Descargar ppt "Empezar a trabajar con XML J.M. Morales-del-Castillo Título."

Presentaciones similares


Anuncios Google