La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

2. Lenguajes de marcado: XML El lenguaje de marcado XML (eXtensible Mark-Up Language)

Presentaciones similares


Presentación del tema: "2. Lenguajes de marcado: XML El lenguaje de marcado XML (eXtensible Mark-Up Language)"— Transcripción de la presentación:

1 2. Lenguajes de marcado: XML El lenguaje de marcado XML (eXtensible Mark-Up Language)

2 Gema Bueno de la Fuente Contenido 2.1. Introducción 2.2. Marcado de documentos con XML –El documento XML –Marcado y notación de marca –Creación y visualización de documentos XML 2.3. Definiciones de Tipo de Documento (DTD) 2.4. Referencias y recursos Web 2.5. Bibliografía básica Tema 2. Lenguajes de marcado: XML Contenido

3 Gema Bueno de la Fuente Tema 2. Lenguajes de marcado: XML 2.1. Introducción Lenguajes de marcado Desde el principio de la informática hemos utilizado lenguajes etiquetados, los procesadores de texto son un buen ejemplo. En la mayoría de ocasiones los metadatos se representaran en lenguaje etiquetado o bien el propio recurso se encontrará estructurado en alguno de estos lenguajes.

4 Gema Bueno de la Fuente Lenguajes de marcado Un lenguaje de marcado cumple con dos objetivos esenciales para diseñar y procesar un documento digital: –Separa un texto en los elementos en los que se compone, como por ejemplo un párrafo, un capítulo, etc. –Especifica las operaciones tipográficas y funciones que debe ejecutar el programa visualizador sobre dichos elementos. Las operaciones tipográficas son instrucciones de formato que se aplican a cada uno de los elementos de un documento digital, por ejemplo, imprimir un título en itálicas. Varios lenguajes de marcado: HTML, XHTML, TeX, LaTeX, DocBook, XML, SGML, MathML, XSL, Lenguajes de marcas ligerosHTMLXHTMLTeXLaTeX DocBookXMLSGMLMathMLXSLLenguajes de marcas ligeros Tema 2. Lenguajes de marcado: XML 2.1. Introducción

5 Gema Bueno de la Fuente HTML (Hypertext Markup Languaje) HTML es un tipo de documento descrito con SGML Lenguaje para transmitir por la red documentos sencillos y genéricos (cabeceras, párrafos, listas, ilustraciones, etc., algo de hipertexto y multimedia) Lenguaje de visualización (apariencia del documento) Su sencillez le proporciona éxito inmediato (revolución en Internet) HTML evoluciona: tablas, formularios..., mapas de imagen..., scripts y applets... Tema 2. Lenguajes de marcado: XML 2.1. Introducción

6 Gema Bueno de la Fuente HTML (Hypertext Markup Languaje) HTML hoy HTML 4.01 (Rec ) ISO HTML (ISO/IEC 15445:2000, 1ª ed ) XHTML 1.0 (The Extensible HyperText Markup Language (Second Edition) A Reformulation of HTML 4 in XML 1.0, Rec , rev ) y 1.1 (Module-based XHTML, Rec ) Tema 2. Lenguajes de marcado: XML 2.1. Introducción

7 Gema Bueno de la Fuente HTML (Hypertext Markup Languaje) Problemas de HTML: limitación para describir documentos complejos o datos orientación paulatina hacia el marcado de formato (hasta 4.0) normalización poco respetada por los desarrolladores... Tema 2. Lenguajes de marcado: XML 2.1. Introducción

8 Gema Bueno de la Fuente HTML (Hypertext Markup Languaje) Limitaciones: elementos estructurales iguales para cualquier documento estructura demasiado flexible para algunos documentos (datos...) enlaces hipertextuales muy simples presentación pobre de los documentos a pesar de las ampliaciones ausencia de normalización en esquemas de metadatos Necesidad de un nuevo lenguaje para la web Tema 2. Lenguajes de marcado: XML 2.1. Introducción

9 Gema Bueno de la Fuente Lenguajes de marcado No lenguaje de formato o descripción de páginas (RTF, PostScript, PDF...) No es un lenguaje de programación (la marca es interpretada por un programa) Describe las partes lógicas del documento (estructura lógica y semántica) Marcado a base de etiquetas asignadas a las partes: El mundo y sus demonios Tema 2. Lenguajes de marcado: XML 2.1. Introducción

10 Gema Bueno de la Fuente SGML (Standard Generalized Markup Language) Estándar internacional para definir la estructura y contenido de múltiples tipos de documentos electrónicos Metalenguaje: permite crear lenguajes de marcas propios que describan la información contenida en múltiples clases de documentos El Origen de todos los lenguajes de marcas existentes GML (1969): creado por Ch. F. Goldfarb (Mosher y Lorie), de IBM, para intercambiar documentos electrónicos entre plataformas informáticas SGML (1986): versión final desarrollada por la ISO (ISO8879:1986) Norma de facto para el intercambio de documentos extensos, complejos y de tipos muy diferentes (transcripciones de rollos sumerios, documentación técnica de aviones, historiales médicos, notaciones musicales...) Lenguaje robusto y potente / complejo, exhaustivo, y caro de implantar y mantener Tema 2. Lenguajes de marcado: XML 2.1. Introducción

11 Gema Bueno de la Fuente XML (Extensible Markup Language) Versión abreviada de SGML, omitiendo las partes más complejas y menos usadas de SGML incidiendo en aspectos de distribución e interoperatividad en la Web Permite definir la estructura de tipos específicos de documentos electrónicos (o datos) por medio de Definiciones de Tipo de Documento (DTD o XML Schemas), definiendo conjuntos de etiquetas y atributos (vocabularios) Desarrollado (1996->) en el W3C por Jon Bosak (Sun) y otros: Rec. 1.0, , Rec. 1.0, 2ª ed , 3ª ed ; Rec. 1.1, Apto para cualquier plataforma, SO o entorno de trabajo (documentos en ASCII de 7 u 8 bits) Tema 2. Lenguajes de marcado: XML 2.1. Introducción

12 Gema Bueno de la Fuente XML (Extensible Markup Language) Es un lenguaje de marcado diseñado para describir estructuras de datos. No está centrado, como ocurre con html en cuestiones de presentación, sino en la estructura del documento. Extensible, etiquetas no predefinidas. Puede usarse para intercambiar o almacenar datos. Gran éxito industrial y adopción en múltiples contextos –Parte fundamental de la arquitectura Web –Otras aplicaciones: Ficheros de Configuración, vocabularios específicos, etc. Tema 2. Lenguajes de marcado: XML 2.1. Introducción

13 Gema Bueno de la Fuente XML (Extensible Markup Language) Muchas otras normas asociadas a XML (1) uso de varios vocabularios en el mismo documento –Namespaces in XML (Rec. 1.0, ; Rec. 1.1, ): referencias a partes de un documento –XPath (XML Path Language, Rec. 1.0, ; en preparación la version 2.0, WD), usado por XSLT, XPointer, XQuery... inserción de enlaces –XLink (XML Linking Language, Rec. 1.0, ) –XML Base (1.0, ) –XPointer (XML Pointer Language, Rec ) Tema 2. Lenguajes de marcado: XML 2.1. Introducción

14 Gema Bueno de la Fuente XML (Extensible Markup Language) Muchas otras normas asociadas a XML (2) semántica asociada a los recursos electrónicos –RDF (Resource Description Framework, Rec., , Rev ), hoy un conjunto de seis documentos que ya incluye RDF Schema o RDF-S (RDF Vocabulary Description Language, Rec. 1.0, ) –OWL (Ontology Web Language, Rec ) hojas de estilo, transformación de documentos... –XSL (Extensible Stylesheet Language, conjunto de XSLT, XSL-FO y XPath) –XSLT (XSL Transformations, Rec. 1.0, ; en preparación la version 2.0, WD) –XSL Formatting Objects (o propiamente XSL, Extensible Stylesheet Language, Rec. 1.0, ) Tema 2. Lenguajes de marcado: XML 2.1. Introducción

15 Gema Bueno de la Fuente XML (Extensible Markup Language) Muchas otras normas asociadas a XML (y 3) definición de tipos de documentos –XML Schema (Rec ), mayor potencia que DTD de SGML búsquedas en documentos XML –XQuery (XML Query, WD LC 1.0, ) formularios –Xforms (Rec ) comunicación entre aplicaciones que usan XML –XMLP (XML Protocol Abstract Model, WD 1.0, ) Tema 2. Lenguajes de marcado: XML 2.1. Introducción

16 Gema Bueno de la Fuente Contenido 2.1. Introducción 2.2. Marcado de documentos con XML –El documento XML –Marcado y notación de marca –Creación y visualización de documentos XML 2.3. Definiciones de Tipo de Documento (DTD) 2.4. Referencias y recursos Web 2.5. Bibliografía básica Tema 2. Lenguajes de marcado: XML Contenido

17 Gema Bueno de la Fuente Creación y visualización de documentos XML Creación (documentos XML y DTDs): –editor de textos (Bloc de notas) –editor de páginas web (Macromedia Dreamweaver) –editor específico de XML (IBM Xeena, XMLWriter, XML Spy...) Visualización: –procesador XML genérico: Netscape 6, MS Internet Explorer 5, Opera 5, Mozilla 1.0, Doczilla... –procesadores especializados según el tipo de documento (En HTML es el navegador de Web) -previsible- Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

18 Gema Bueno de la Fuente Documento XML Fichero de texto, generalmente de extensión ".xml", que usan el juego de caracteres –ISO-Latin-1 (ISO ) de 8 bits o –Unicode (ISO 10646, o UCS-2, Universal Character Set, v.2) de 16 bits, para cualquier alfabeto Formados por –Prólogo –Instancia del documento Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

19 Gema Bueno de la Fuente Documento XML Formados por –Prólogo: una declaración XML (instrucción de procesamiento): versión de XML y codificación de caracteres. generalmente (no necesariamente en XML) una declaración de tipo de documento seguida de una DTD (interna, externa o mixta) para la que hayan sido construidos: la referencia a una hoja de estilo externa que indica cómo representar el documento, en su caso (instrucción de procesamiento):... [Otras instrucciones de procesamiento] –la instancia del documento: contenido textual, marcado por etiquetas que señalan cada elemento, y que pueden llevar atributos para dar información más específica de cada elemento Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

20 Gema Bueno de la Fuente Ejemplo de documento XML Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

21 Gema Bueno de la Fuente Marcado y notación de marca Un documento XML está compuesto exclusivamente de marcado y datos de carácter, y ambos conocidos como "Texto XML". Sintaxis simple pero estricta El marcado es el texto incluido entre delimitadores: –" ", que encierran etiquetas, o bien –"&" y ";", que encierran la referencia a una entidad. –Comentarios: contienen instrucciones no analizadas por el procesador. Comienzan por Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

22 Gema Bueno de la Fuente Caracteres especiales Existen 5 caracteres especiales: –& lt; = < –& gt; = > –& amp; = & –& quot; = " –& apos; = ' Cualquier carácter Unicode puede indicarse mediante & seguido del número y acabado por ; Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

23 Gema Bueno de la Fuente Marcado y notación de marca Las etiquetas pueden ser –Dos: una inicial (en la forma ) y otra final ( ), encerrando un elemento; suelen describir contenido (párrafos, niveles de encabezado...), p.ej.: El Código Da Vinci ; son la mayoría –Una: sólo etiqueta inicial (termina con "/>"); suelen insertar algo en el documento (una imagen, un salto de línea o de página...), p.ej.: Toda la instancia del documento va encerrada dentro de las etiquetas que marcan el elemento raíz o elemento de documento, y ha de corresponderse con el tipo expresado en la declaración Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

24 Gema Bueno de la Fuente Marcado y notación de marca El "elemento de documento" (o "elemento raíz") –encierra toda la instancia del documento, –se corresponde con el tipo expresado en la declaración –Ej.: [...] Un elemento puede contener (según se especifique en la DTD, si existe): Otros elementos (subelementos o elementos hijos), p.ej.: [...] [...] –Texto (el espaciado no tiene importancia: cualquier número de espacios o saltos de línea es equivalente a un espacio), p.ej.: Hola de nuevo, Gema. –Una mezcla de elementos o texto (contenido mixto), p.ej.: El curso se celebrará el próximo mes de noviembre. –O nada, si es un elemento vacío ( ) Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

25 Gema Bueno de la Fuente Marcado y notación de marca Un elemento puede llevar uno o más atributos –especifican alguna propiedad del elemento en cuestión, por medio de un valor asociado, en la forma atributo="valor" –se expresan en la etiqueta inicial del elemento, p.ej.: –si existen varios pueden expresarse en cualquier orden –dan sentido a la mayoría de los elementos vacíos, p.ej.: –el tipo de valor que puede llevar asociado se especifica en la DTD (si existe) Nombres de elementos y atributos –comienzan por una letra, seguida sólo de letras o números –son sensibles a la caja de letra (SGML, y por tanto HTML, no) Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

26 Gema Bueno de la Fuente Estructura de un documento XML Un documento XML siempre se puede representar como un árbol Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

27 Gema Bueno de la Fuente Documento XML bien formado y válido Documento bien formado Un documento XML está bien formado si cumple las reglas anteriores: –contiene un único elemento raíz –las etiquetas están correctamente anidadas –Se usan caracteres válidos y bien aplicados –los valores de los atributos vienen encerrados entre comillas Una condición básica para trabajar con un documento XML es que esté bien formado Documento válido Un documento bien formado, es además válido, si cumple con alguna regla de validación: –DTD –XML Schema Tema 2. Lenguajes de marcado: XML 2.2. Marcado de documentos XML

28 Gema Bueno de la Fuente Contenido 1.1. Introducción 1.2. Marcado de documentos con XML –El documento XML –Marcado y notación de marca –Creación y visualización de documentos XML 1.3. Definiciones de Tipo de Documento (DTD) 1.4. Referencias y recursos Web 1.5. Bibliografía básica Tema 2. Lenguajes de marcado: XML Contenido

29 Gema Bueno de la Fuente La definición del tipo de documento (DTD) Definición formal de un tipo de documento particular: –elementos de su estructura que conforman el vocabulario –atributos que esos elementos pueden tomar –reglas que rigen las interacciones entre esos elementos y –entidades que se pueden incluir en los documentos En el documento XML se "declara" opcionalmente la DTD que usa ("Declaración del Tipo de Documento": interna, externa, o combinación de ambas). Hay miles en SGML (accesibles y de uso público), que pueden ser convertidas a XML, pero a veces será necesario escribir nuestras propias DTDs Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

30 Gema Bueno de la Fuente DTDs internas Vs externas Las DTDs pueden definirse dentro del documento XML... ]>... También pueden residir en otro documento:... Algunas DTDs pueden tener identificadores públicos Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

31 Gema Bueno de la Fuente Estructura básica de una DTD Todos los aspectos de la marca se especifican en la DTD con declaraciones: –DE ELEMENTOS: tantas como elementos contenga la DTD (contenedores o vacíos) –DE CONTENIDO: parte de la declaración de elemento, describe qué tipo de contenido puede anidarse en su interior (datos, otros elementos o contenido mixto) –DE LISTAS DE ATRIBUTOS: que puede adoptar un elemento específico (en su caso) –DE ENTIDADES: sobrenombre asociado a un grupo de datos (interna, de texto externa, binaria externa, de carácter o numérica) Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

32 Gema Bueno de la Fuente Estructura básica de una DTD Declaración de elementos: Bloques básicos de una DTD o documento; los demás (atributos, modelos de contenido, entidades...) se forman a partir de los elementos Incluye el modelo de contenido para el elemento Hay dos tipos de elementos: –CONTENEDORES (el caso más habitual): pueden albergar otros elementos o texto regular DTD: Declarado como Documento: marcado con una etiqueta inicial y otra final: Hola de nuevo, Adela. –VACÍOS: no pueden contener texto ni ningún otro elemento normalmente transmiten información mediante los valores de sus atributos Se declaran en la forma Documento: marcado con sólo una etiqueta inicial: Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

33 Gema Bueno de la Fuente Estructura básica de una DTD Modelos de contenido aplicado al primer nivel de elementos anidados en su interior (los elementos hijos tienen sus propios modelos de contenido) tipos de contenido de un elemento (salvo elementos vacíos): –Otros elementos –Texto: –Otros elementos y texto ("*" oblig.): –Cualquier tipo de contenido (infrecuente y desaconsejado): orden en que se anidarán los elementos –",": lista o secuencia: –"|": lista de alternativas: frecuencia de aparición –"": 1 vez –"+": 1 o más: –"?": 0 o 1: –"*": 0 o más: Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

34 Gema Bueno de la Fuente Estructura básica de una DTD Declaración de listas de atributos: Consisten en un nombre del atributo y un valor asociado DTD: Documento: Tipos de valores: –de texto simple (la mayoría); señalados con CDATA –de señalización: ID, IDREF / IDREFS, ENTITY / ENTITIES, NMTOKEN / NMTOKENS –enumerados: lista de valores posibles –de notación: notación NOTATION Tipos de atributos: –requeridos (#REQUIRED): deben aparecer –fijos (#FIXED): el autor del documento no puede modificarlo –Implícitos (#IMPLIED): pueden aparecer o no (no toman ningún valor por defecto) –valor por defecto: si el atributo no aparece toma ese valor por defecto Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

35 Gema Bueno de la Fuente Estructura básica de una DTD Declaración de entidades: Unidad virtual de almacenamiento (cadena de caracteres, fichero gráfico...) Tipos: –DE TEXTO –DE CARÁCTER Y NUMÉRICAS –BINARIAS –PARAMÉTRICAS Hay que declararlas en la DTD antes de poder utilizarlas Usan la sintaxis Se referencia a una entidad en la DTD o en el documento como &nombre; (las paramétricas como %nombre; ) Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

36 Gema Bueno de la Fuente Ejemplo de DTD Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

37 Gema Bueno de la Fuente Esquema XML (XML Schema) Los DTD no son muy potentes para definir gramáticas. Otra forma de hacerlo es con Esquemas XML basados en el propio XML y que soportan más tipos de datos. Un Esquema XML define: –Qué elementos contiene un XML –Su organización –Sus Atributos –Tipos de elementos Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

38 Gema Bueno de la Fuente Esquema XML - DTD D T D Esquema XML Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

39 Gema Bueno de la Fuente XML Namespaces El estándar XML también define los espacios de nombres (XML Namespaces). Permiten que un mismo documento XML tenga etiquetas de diferentes lenguajes (definidas en diferentes gramáticas DTD). Así es posible mezclar más información en los documentos, por ejemplo, añadir información semántica a un documento XHTML. Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

40 Gema Bueno de la Fuente Ejemplo XML Namespaces Calle Madrid Getafe Gema Bueno Calle Madrid Getafe Gema Bueno Tema 2. Lenguajes de marcado: XML 2.3. Definición de Tipo de Documento (DTD)

41 Gema Bueno de la Fuente Contenido 2.1. Introducción 2.2. Marcado de documentos con XML –El documento XML –Marcado y notación de marca –Creación y visualización de documentos XML 2.3. Definiciones de Tipo de Documento (DTD) 2.4. Referencias y recursos Web 2.5. Bibliografía básica Tema 2. Lenguajes de marcado: XML Contenido

42 Gema Bueno de la Fuente Recursos Web Referencias oficiales: Extensible Markup Language (XML) –http://www.w3.org/XMLhttp://www.w3.org/XML XML Schema Validator –http://www.w3.org/2001/03/webdata/xsvhttp://www.w3.org/2001/03/webdata/xsv XML Tools at W3C –http://www.w3.org/XML/#softwarehttp://www.w3.org/XML/#software Tema 2. Lenguajes de marcado: XML 2.4. Recursos web

43 Gema Bueno de la Fuente Tutoriales Nogales Flores, Tomás. Breve Introducción a XML. –http://www.bib.uc3m.es/~nogales/cursos/xml.htmlhttp://www.bib.uc3m.es/~nogales/cursos/xml.html Reino Romero, Alfredo. Introducción a XML en castellano. Versión 2.0 (26 enero 2000). García Castellano, Javier. Tutorial de XML. Versión 2.3. Marzo Labra Gayo, José Emilio. XML. Octubre Tema 2. Lenguajes de marcado: XML 2.4. Recursos web

44 Gema Bueno de la Fuente Contenido 2.1. Introducción 2.2. Marcado de documentos con XML –El documento XML –Marcado y notación de marca –Creación y visualización de documentos XML 2.3. Definiciones de Tipo de Documento (DTD) 2.4. Referencias y recursos Web 2.5. Bibliografía básica Tema 2. Lenguajes de marcado: XML Contenido

45 Gema Bueno de la Fuente Referencias bibliográficas Box, Don; Skonnard, Aaron; Lam, John. Essential XML : beyond markup. Boston ; Madrid [etc.] : Addison-Wesley, [ISBN ] Brown, Peter. Information Architecture with XML : a Management Strategy. London : John Wiley and Sons, [ISBN ] Geroimenko, Vladimir; Chen, Chaomei (eds.). Visualizing the semantic web : XML-based internet and information visualization. London : Springer, [ISBN ] Goldfarb, Charles F.; Prescod, Paul. Manual de XML. Madrid [etc.]: Prentice Hall, Harold, Elliotte Rusty. XML bible (2nd ed.). New York [etc.] : Hungry Minds, [ISBN ] Harold, Elliotte Rusty. XML: Extensible Markup Language. Foster City [etc.] : IDG Books Worldwide, ISBN Morrison, Michael. XML al descubierto. Madrid [etc.] : Prentice Hall, [ISBN ] Pitts, Natanya, XML. Madrid: Anaya Multimedia, Ray, Erik T. Learning XML. Beijing [etc.] : O'Reilly, [ISBN ] Tennant, Roy (ed.). XML in libraries. New York : Neal-Schuman Pub., [ISBN ] Tema 2. Lenguajes de marcado: XML 2.5. Bibliografía básica


Descargar ppt "2. Lenguajes de marcado: XML El lenguaje de marcado XML (eXtensible Mark-Up Language)"

Presentaciones similares


Anuncios Google