La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Fernando Alonso Blázquez XML (eXtensible Mark-up Language) 27 de Mayo de 2004.

Presentaciones similares


Presentación del tema: "Fernando Alonso Blázquez XML (eXtensible Mark-up Language) 27 de Mayo de 2004."— Transcripción de la presentación:

1 Fernando Alonso Blázquez XML (eXtensible Mark-up Language) 27 de Mayo de 2004

2 Índice Introducción –¿Qué es XML? –Ventajas de XML Construyendo documentos XML –Estructura jerárquica de elementos –Algunas normas –El prólogo –Elementos –Atributos –Secciones CDATA –Comentarios SAX2 API

3 Introducción Webs de asignaturas de la Escuela –Informática 3Informática 3 Intercambio de Información B2B Almacenamiento de Información –Producción automática de Libros, Artículos, Manuales... Explotación de los Metadatos –Keywords, Indexing, Annotations, Interdocument linking...

4 ¿Qué es XML? Es un subconjunto de SGML (Standard Generalized Mark-up Language), simplificado y adaptado a Internet XML (eXtensible Mark-up Language) no es un lenguaje de marcado XML es un meta-lenguaje que permite definir lenguajes de marcado adecuados a usos determinados Antonio Muñoz Molina El Jinete Polaco 20

5 Ventajas de XML Procesable por humanos y por software Separa la información o el contenido de su presentación o formato Ideal para transacciones B2B Permite poderosas técnicas de extracción de información y data-mining Fácil análisis sintáctico

6 Construyendo documentos XML El elemento y sus atributos Antonio Muñoz Molina XML bien-formado (well-formed) –Cumple una serie de reglas descritas en la especificación oficial de XML v1.0 –World Wide Web Consortium (W3C) Nombre del elemento Nombre del atributo Valor del atributo Contenido del elemento Etiqueta de fin

7 Estructura jerárquica de elementos Los elementos deben seguir una estructura de árbol, es decir, estríctamente jeráquica Los elementos deben estar correctamente anidados Los elementos no se pueden superponer entre ellos Sólo puede haber un elemento raíz, en el que están contenidos todos los demás XML erróneo Topacio Jade

8 Estructura jerárquica de elementos mensaje remitente destinatario asunto: Informe de ventas texto nombre: Topacio Jade nombre: Esmeralda Turquesa parrafo: Ya esta acabado el informe. parrafo: Lo he dejado en el servidor del departamento.

9 Estructura jerárquica de elementos Topacio Jade Esmeralda Turquesa Informe de ventas Ya esta acabado el informe. Lo he dejado en el servidor del departamento.

10 Algunas normas Todas las etiquetas tienen que estar debidamente cerradas –etiqueta de cierre que se corresponda con la de apertura Las etiquetas sin contenido tienen una sintaxis especial Perro Vaca Perro Vaca Perro Vaca

11 Algunas normas Un nombre de elemento, atributo, entidad, etc., debe empezar siempre por una letra. Las letras XML (o xml o xMl,etc.) no pueden usarse como caracteres iniciales de un nombre de elemento, atributo, etc. XML es case-sensitive: El uso del espacio en blanco y los saltos de línea sólo se tienen en cuenta cuando aparecen en el valor de un atributo, o cuando se indica su significancia.

12 Marcado y datos Las construcciones como etiquetas, referencias de entidad y declaraciones se denominan marcas (mark-up) y son las partes que el analizador sintáctico (parser) espera comprender El resto del documento, que se encuentra entre las marcas, son los datos que resultan entendibles por las personas Marcas en un documento XML son aquellas que comienzan con En el caso de referencias de entidad, el carácter inicial es & y el final ;

13 El prólogo Es opcional La primera línea permite especificar: –La versión de XML (de momento sólo 1.0) –La codificación de carácter (US-ASCII, UTF-8, UTF-7, UCS-2, EUC-JP, Big5, ISO , etc.) La segunda línea define el tipo de documento, especificando qué DTD (Document Type Definitions) valida y define los datos que contiene

14 Elementos Elementos con contenido Elementos vacíos Fulano Mengánez Que no cunda el pánico

15 Atributos Manera de incorporar características o propiedades a los elementos Pueden estar marcados entre comillas simples () o dobles () Un concepto se puede representar de diversas formas: consistencia Micifú Persa Micifú

16 Entidades predefinidas En XML 1.0 se definen cinco entidades para representar caracteres especiales y que no se interpretan como marcado por el procesadr XML EntidadCaracter && << >> ' "

17 Secciones CDATA Construcción en XML que permite especificar datos, utilizando cualquier carácter, especial o no, sin que se interprete como marcado XML. La razón de esta construcción es que a veces es necesario para los autores de documentos XML, poder leerlo facilmente sin tener que descifrar los códigos de entidades. Especialmente cuando son muchas. <HTML> <HEAD><TITLE>Rock & ROLL</TITLE> </HEAD>

18 Comentarios Insertados en el documento XML Ignorados por el procesado de la información y las reproducciones del documento Tienen el mismo formato que en HTML –Comienzan por Se pueden introducir en cualquier lugar de la instancia o del prólogo, pero nunca dentro de las declaraciones, etiquetas u otros comentarios.

19 Fernando Alonso Blázquez DTD (Document Type Definition) 27 de Mayo de 2004

20 Índice Validación y definición de documentos –DTD: Document Type Definition Declaraciones de tipo Elemento –Modelos de contenido Declaraciones de lista de Atributos –Tipos de Atributos Declaración de Entidades

21 Document Type Definition (DTD) Es como definir nuestro propio lenguaje de marcado para una aplicación específica Define los tipos de elementos, atributos y entidades permitidas, y puede expresar algunas limitaciones para combinarlos Puede residir en un fichero externo y ser compartido por varios documentos XML. O bien puede estar contenido en el propio documento XML, como parte de su declaración de su prólogo. El documento XML que se ajusta a su DTD, se denomina valido bien-formado

22 Ejemplos de DTD Topacio Jade Minas de Moria, 13 Azanulbizar Khuzdul

23 Declaraciones de tipo Elemento Deben empezar con

24 Especificación de contenido EMPTY: No tiene contenido. ANY: Puede tener cualquier contenido. Es mejor no usarla y estructurar adecuadamente los documentos Mixed: Puede tener caracteres o una mezcla de caracteres y sub-elementos especificados Element: Sólo puede contener sub-elementos especificados

25 Modelos de contenido – sólo puede contener un – debe contener un elemento seguido de un elemento –La barra vertical | indica opción. El número de opciones no está limitado y se pueden agrupar usando paréntesis – debe contener un seguido de un o un

26 Modelos de contenido Indicador de frecuencia –Siguen directamente a un identificador general, una secuencia o una opción –No pueden ir precedidos por espacios en blanco IndicadorFrecuencia ?Opcional (0 ó 1 vez) * Opcional y repetible (0 ó más veces) +Necesario y repetible (1 ó más veces)

27 Declaración de lista de Atributos Atributos –Añaden información adicional a los elementos –Sólo se pueden especificar una vez y en cualquier orden –No pueden contener sub-atributos Declaración –Empiezan con

28 Declaración de lista de Atributos #REQUIRED: Es obligatorio especificar el atributo. No tiene valor por defecto. #IMPLIED: Se puede omitir el atributo, sin que se adopte automáticamente un valor por defecto

29 Tipos de Atributos Atributos CDATA (character data): Pueden contener casi cualquier cosa Atributos enumerados: Sólo pueden contener un valor de entre un número reducido de opciones

30 Tipos de Atributos Atributos ID e IDREF –El tipo ID permite que un atributo determinado tenga un nombre único que podrá ser referenciado por un atributo de otro elemento que sea de tipo IDREF –Permite implementar un sistema de hipervínculos en un documento XML

31 Declaración de Entidades La Entidades se utilizan para hacer referencia a objetos (ficheros, páginas Web, imágenes,...) que no deben ser analizados sintácticamente según las reglas de XML Se declaran mediante

32 Tipos de Entidades Las entidades pueden ser: –Internas – Externas –Analizadas o No analizadas –Generales o Parámetro Entidades generales internas: –Son básicamente abreviaturas definidas en la sección del DTD del documento XML –Son siempre entidades analizadas Durmiendo en clase, Topacio soñó con un &ovni;

33 Tipos de Entidades Entidades generales externas analizadas Entidades no analizadas Entidades parámetro Internas %elemento-alf; ]> Entidades parámetro Externas

34 Ejemplo de DTD Topacio Jade Esmeralda Turquesa


Descargar ppt "Fernando Alonso Blázquez XML (eXtensible Mark-up Language) 27 de Mayo de 2004."

Presentaciones similares


Anuncios Google