La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

XML y tecnologías asociadas Hacia la Web Semántica.

Presentaciones similares


Presentación del tema: "XML y tecnologías asociadas Hacia la Web Semántica."— Transcripción de la presentación:

1 XML y tecnologías asociadas Hacia la Web Semántica

2 Antecedentes históricos 1960: Utilización de etiquetas descriptivas para codificación 1967: Separación entre el contenido de los documentos y su formato 1969: GML (Lenguaje de Marcación Generalizado). Permitir que los subsistemas de edición y formateado de textos y los de RI compartieran documentos Introduce el concepto de tipo de documento 1985: SGML (estándar ISO 8879:1986). Estándar internacional para la descripción de la codificación electrónica de textos 1990: HTML 1998: XML

3 Motivaciones aparición XML Tratar datos semi-estructurados de la web Organizar colecciones de datos de distintas fuentes y formatos Intercambiar datos entre diferentes sitios/organizaciones

4 XML eXtended Markup Language Metalenguaje que nos permite definir lenguajes de marcado adecuados a usos determinados Subconjunto de SGML, simplificado y adaptado a Internet Marcación descriptiva Extensible –Los proveedores de información pueden definir nuevas etiquetas y atributos

5 Ventajas de XML No pertenece a ninguna compañía y su utilización es libre Fácilmente procesable por personas y por software Permite su utilización en diferente hardware (ordenadores personales, teléfonos celulares, terminales de Braille,...) Diseñado para ser utilizado con cualquier alfabeto Sustitución de cadenas de caracteres (entidades ) Separa radicalmente la información o contenido de su presentación o formato Un documento (XML)  muchas formas de presentación (PDF, HTML, WML, RTF, VRML,...)

6 Ventajas XML (cont.) Permitirá integrar sistemas de información hasta ahora separados: –Documentos · estructura irregular · anidados profundamente · tipos de datos relativamente simples · se da gran importancia al orden –Relaciones · estructura muy regular · relativamente planas · tipos de datos relativamente complejos · se da poca importancia al orden

7 Terminología wElemento Unidad de texto considerada como un componente estructural wAtributos Características y propiedades asociadas con elementos de un tipo determinado wDOM (Document Object Model) Árbol cuyos nodos son los elementos. Para acceder y manipular los datos almacenados en un documento XML se utiliza una colección de objetos, con varias propiedades y métodos, que representan el árbol y sus nodos.

8 Estructura de un documento XML Ejemplo Instrucciones de procesamiento Declaraciones de tipo de documento (DTD) Etiquetas de elementos y atributos Entidades Comentarios Secciones marcadas

9 Ejemplo de documento XML Adelaida Delgado adelaida@ipc4.uib.es Antonio F. Coca antonioc@ipc4.uib.es Saludos ¿Hola qué tal? Hace mucho que no escribes. A ver si llamas y quedamos para tomar algo. prólogo

10 Instrucciones de procesamiento  Sintaxis:  Ejemplo:

11 Documentos XML bien formados/válidos wXML está diseñado para ser utilizado con o sin DTD wUn documento XML es válido si tiene una DTD concordante. –La DTD puede está contenida en el propio documento XML o contenida en un fichero externo wUn documento XML está bien formado si cumple las reglas descritas en la especificación oficial XML v1.0 (http://www.w3.org/TR/REC-xml)

12 Documentos XML bien formados wEstructura jerárquica de elementos –Los elementos deben estar correctamente anidados, no se pueden superponer –Sólo puede haber un elemento raíz, en el que están contenidos todos los demás wEtiquetas –Deben estar balanceadas –Las etiquetas vacías (de los elementos sin contenido) han de presentar el símbolo “/” al final wAtributos –Los valores de los atributos han de estar entre comillas wMayúsculas y minúsculas –XML es case-sensitive

13 Documentos XML bien formados, sin DTD wCuando no se utiliza DTD el documento debe comenzar por una declaración de documento único standalone wLos documentos XML sin DTD pueden utilizar atributos pero han de ser del tipo CDATA por defecto

14 Declaración de tipo de documento  La DTD puede residir en un fichero externo (que puede ser compartido por otros documentos) o bien estar contenida en el propio documento XML, como parte de su declaración de tipo de documento.  Si la DTD es externa, en la declaración de tipo de documento se indica dónde encontrarla: –Mediante un identificador público (PUBLIC) –Mediante un Identificador Universal de Recursos (URI) precedido por la palabra SYSTEM. wEjemplos:

15 Elementos y atributos en XML  Etiquetas de elementos –Cada tipo de elemento tendrá un nombre (etiqueta), indicativa de la función, su identificador genérico o bien: si el contenido del elemento es vacío Es importante comprender la estructura del documento para representarla utilizando las etiquetas apropiadas contenido_elemento

16 Elementos y atributos en XML  Atributos –Suelen ser opcionales –Atributo especial de identificación “id”  se utiliza para dar un valor único a la ocurrencia de un elemento particular. · Se puede utilizar para hacer referencias cruzadas –Valores de los atributos  se darán en la instancia del documento como un par atributo=“valor”, en la ocurrencia de la etiqueta de principio del elemento Ejemplo:...

17 Entidades w XML utiliza entidades para referenciar a objetos (ficheros, páginas web, imágenes, cualquier cosa) que no deben ser analizados sintácticamente según las reglas de XML. w Sintaxis: &entidad;

18 Entidades predefinidas Al usar una referencia a una entidad, el analizador sintáctico reemplaza la referencia con su contenido. Entidad Carácter ------------------------- << >> && &apos;‘ "“

19 Entidades generales internas  Son abreviaturas declaradas en la DTD mediante el uso de "<!ENTITY".  Ejemplo: <!DOCTYPE texto[ ]>... Historia de &nombre;

20 Entidades generales externas analizadas  Obtienen su contenido en cualquier otro sitio del sistema.  Se referencian mediante la palabra SYSTEM seguida de un URI.  Ejemplo: <!ENTITY mientidad SYSTEM "http://www.servidor.com/entidades.xml">

21 Entidades generales externas no analizadas  Son aquéllas cuyo contenido no es texto sino por ejemplo una imagen, un archivo de vídeo, un ejecutable, etc.  Ejemplo: <!ENTITY foto SYSTEM "http://www.servidor.com/foto.gif">

22 Entidades parámetro  Se usan para agrupar ciertos elementos que se repitan mucho.  Para declararlas y referenciarlas se usa el símbolo "%".  Pueden ser internas y externas.  Ejemplo: <!DOCTYPE texto [ ">... %elem_parrafo; ]>

23 Comentarios  Son ignorados por los procesadores XML  Pueden aparecer en cualquier lugar de la instancia del documento o del prólogo pero no en las declaraciones, en las etiquetas o dentro de otros comentarios  Sintaxis:

24 Secciones CDATA  Sirven para definir texto que no será tratado por los analizadores XML.  Sintaxis:

25 Tecnologías asociadas a XML wModularidad y reutilización de documentos XML: Espacios de Nombres wDefinición de Documentos: DTDsDTDs y XML SchemasXML Schemas wDefinición de estilos: CSSCSS y XSLXSL wReferencias a partes de los documentos: XPath wEnlazado de documentos: XLinkXLink, XPointerXPointer wAplicaciones: RDFRDF, XHTML,...XHTML

26 Espacios de nombres XML wColección de nombres universales identificada por un URI (URL o URN) que se utiliza en los documentos XML como tipos de elementos y nombres de atributos. wDeclaración por defecto: declara un espacio de nombres que se utilizará para todos los elementos dentro de ese ámbito. wDeclaración explícita: se define un prefijo que se utilizará para calificar los elementos que pertenezcan al espacio de nombres que se le ha asociado como xmlns:prefijo=”espacio_de_nombres”

27 Espacios de nombres XML. Ejemplos A Suitable Boy 22.5 <bk:BOOK xmlns:bk="urn:BookLovers.org:BookInfo" xmlns:money="urn:Finance:Money"> A Suitable Boy 22.5

28 DTDs wConjunto de reglas que definen un documento XML y que sirven para etiquetarlo adecuadamente wIndica qué elementos, atributos y entidades están permitidas y algunas limitaciones de cómo combinarlos wCrear una DTD es como crear nuestro propio lenguaje de marcado para una aplicación específica wSintaxis: <! DOCTYPE tipo_doc [... ]>

29 DTDs. Declaración de elementos wEstructura arborescente –Sintaxis: <!DOCTYPE etiqueta [ ]> – Ejemplo de declaración de elementos:

30 id_gen indica un identificador genérico asignado al elemento que se quiere definir (su nombre)

31  La especificación de contenido de un elemento puede ser: –EMPTY: Se utiliza para etiquetas vacías Ejemplo: –ANY: Puede tener cualquier contenido Ejemplo: –Mixed: Puede tener caracteres de tipo datos (#PCDATA), opcionalmente mezclados con elementos de tipo hijos (children) Ejemplo: –Children: Contiene sub-elementos. Se especifica un modelo de contenido (una simple gramática que gobierna los tipos permitidos para los elementos hijos y el orden en el cual pueden aparecer) Ejemplo: especificac_contenido

32  Modelos de contenido –Si la especificación de contenido contiene más de un componente hay que especificar el orden mediante conectores: “,” (mismo orden que el especificado), “|” (sólo puede aparecer uno), “&” (cualquier orden) –Cada partícula de contenido puede llevar un indicador de frecuencia: “+” (una o más veces), “?” (como mucho una ocurrencia) y “*” (ausente, o una o más veces) Ejemplo: En este caso, puede tener o no (pero sólo uno), y puede tener cero o más conjuntos,, etc. especificac_contenido

33 DTDs. Declaración de atributos wEn la DTD los atributos suelen declararse a continuación del elemento –Sintaxis: <! ATTLIST id_gen nombre tipo_valor estado/valor_defecto > <!ATTLIST poema idID#IMPLIED estado(borrador|revisado|publicado)borrador> – Ejemplo de declaración de atributos:

34 id_gen  Indica el identificador genérico del elemento del que se declaran los atributos  Si varios elementos comparten los mismos atributos se daría la lista de los elementos implicados entre paréntesis  A continuación vienen tantas líneas nombre tipo_valor estado/valor_defecto como atributos tenga el elemento

35 nombre indica el nombre del atributo

36 tipo_valor w Atributos de cadena w CDATA: cadenas de caracteres cualesquiera, no analizadas sintácticamente w Atributos enumerados w Sólo pueden contener un valor de entre un número determinado de opciones w Atributos con símbolo w Normalización del valor del atributo y validación en base al tipo de atributo que se declare w Símbolos: w ID, IDREF, IDREFS w ENTITY, ENTITIES w NMTOKEN, NMTOKENS w NOTATION

37 estado/valor_defecto wdefault indica el valor predeterminado del atributo w #REQUIRED significa que no tiene valor por defecto ya que es obligatorio especificar este atributo w # IMPLIED se utiliza cuando interesa que se pueda omitir un atributo, sin que se adopte automáticamente un valor por defecto w # FIXED indica que el atributo tiene un valor fijo

38 XML Schemas  Similar a una DTD en cuanto a que  define qué elementos puede contener un documento XML,  cómo están organizados,  y que atributos y de qué tipo pueden tener sus elementos

39 XML Schemas. Ventajas  Usan sintaxis de XML  Mayor riqueza de tipos de datos:  Tipos predefinidos (booleanos, fechas y horas, URIs, enteros, decimales, reales, intervalos de tiempo, etc.)  Tipos definidos por los usuarios  Permite agrupar atributos  Modelos de contenido:  Abierto: todos los elementos requeridos han de estar presentes, pero no es un error que también aparezcan elementos adicionales.  Refinable: permite que aparezcan elementos adicionales pero sólo si el esquema define cuáles son  Soportan los espacios de nombres

40 XML Schemas. Frenos  La existencia de un gran número de herramientas, tanto SGML como XML, que pueden procesar DTDs  La existencia de un gran número de tipos de documentos ya definidos usando DTDs: HTML, XHTML, etc.  Una larga experiencia de aplicación práctica de las DTDs y conocimiento de éstas por parte de la comunidad de programadores de XML y SGML

41 XML Schemas. Validación  Es posible convertir automáticamente las DTDs existentes en esquemas XML, con lo cual se mejoraría la descripción de los documentos  Para validar documentos frente a esquemas XML o DTDs se puede usar la herramienta XML Validator de Microsoft, accesible en http://msdn.microsoft.com/downloads/samp les/internet/xml/xml_validator/

42 XML Schemas. Ejemplo <Schema xmlns="urn:schemas-microsoft-com:xml-data" xmlns:dt="urn:schemas-microsoft-com:datatypes"> Pepito Pérez Pérez

43 CSS (Cascade Style Sheet)  Lenguaje de hojas de estilos diseñado para HTML  Las reglas de las hojas de estilos se pueden colocar:reglas  directamente en un documento HTML o XML,  en documentos de hojas de estilos externas con la extensión de archivo.css.  CSS1, diciembre 1996 (IE 4.x, Netscape 4.x) CSS1  CSS2, mayo 1998 (IE 5.x, Netscape 6.0) CSS2  CSS3, en proceso CSS3

44 CSS. Reglas de estilo  Constan de dos partes: el selector y la cadena de estilos.  Selectores  Construcciones CSS que identifican partes de un documento HTML o XML.  Cadena de estilos  Conjunto de: propiedad: valor;

45 CSS1. Tipos de selectores  Tipo de elemento: selecciona un elemento de un determinado tipo y le aplica un estilo o conjunto de estilos. Tipo de elemento  Clase de atributo: permite aplicar estilos a un atributo especial. El atributo class se utiliza para definir clases de estilos de un determinado tipo de elemento. Clase de atributo  ID de atributo: establece una regla de estilo que se puede aplicar a cualquier elemento, independientemente de su tipo. ID de atributo

46 Ejemplo de definición de un conjunto de estilos para el elemento p de un documento HTML p { display: block; margin-bottom: 10px; font-family: Times, serif; font-size: 12pt; } En el documento HTML se marcaría el código de párrafo de manera habitual: Parrafo de texto.

47 Ejemplo de definición de una clase especial de párrafos: p.especial { display: block; margin-bottom: 10px; font-family: Times, serif; font-size: 12pt; font-style: italic; } En el documento HTML se marcaría el código de párrafo especial utilizando el atributo class: Parrafo de texto.

48 Ejemplo de creación de una regla de estilo por medio del selecto ID de atributo: #azul { color: blue; font-family: Times, serif; } En el documento HTML se marcaría utilizando el atributo id: Esto es un encabezamiento de color azul.

49 CSS1. Propiedades  display describe cómo aparece un elemento y si tiene que aparecer. Los posibles valores son:  block (aparece en un recuadro),  list-item (aparece con una viñeta en un recuadro),  inline (aparece en un recuadro a continuación del contenido adyacente),  none (no aparece).  width y height: determinan el ancho y alto del recuadro o las dimensiones de una imagen.  border, border-left, border-right, border-top, border-bottom. Además también se puede indicar el grosor (border-width), el color (border-color) y el estilo (border-style).

50 CSS1. Propiedades (cont.)  margin, margin-left, margin-right, margin-top, margin-bottom.  background-color y color  text-align y text-indent: se usan para establecer, respectivamente, la alineación y el sangrado de un elemento.  Las propiedades font: se utilizan para establecer los distintos parámetros que están asociados a las fuentes, como la familia (font-family), el tamaño (font-size), el estilo (font-style), etc.

51 CSS2  Añade nuevos selectores y se pueden seleccionar elementos basándose en un patrón.  Se han añadido pseudoClases, y pseudoElementos que permiten dar formato a objetos seleccionados, objetos apuntados, etc.  Se han añadido los tipos de medios de manera que permite crear formatos diferentes dependiendo del tipo de medio que se vaya a utilizar para mostrarlo, video, TV, impresoras, etc.  Permite fuentes descargables  Permite el posicionamiento de elementos y tablas

52 CSS3  Propone modularizar las especificaciones de CSS  Los selectores permiten seleccionar elementos en base a si contienen o no cierta palabra, o si son el único elemento de cierta clase

53 XSL (eXtensible Style Language)  Sintaxis XML  Un mismo documento XML puede tener varias hojas de estilo XSL que lo muestren en diferentes formatos (HTML, PDF, RTF, VRML, PostScript, sonido, etc.).  El procesador XML lleva a cabo dos procesos:  Transformación (tecnología XSLT)XSLT  Formateo (tecnología XSLFO)XSLFO

54 XSLT  A partir del árbol XML fuente se construye un árbol transformado, el cual puede tener una estructura significativamente diferente del original.  Una hoja de estilo XSL consta de una serie de reglas de transformación.  Cada regla se compone de un patrón (pattern) y una acción o plantilla (template).  XSLT utiliza el patrón para seleccionar partes de un documento XML para su transformación.  Al cotejar un patrón con una parte del árbol, se usa una plantilla para determinar cómo se transforma esa parte de árbol.  XSLT utiliza expresiones XPath para recorrer un documento XML y llegar a un nodo determinado.

55 XSLT. Espacio de nombres  Elementos:  xsl:template: contiene los patrones y datos de transformación.  xsl:value-of: se usa para insertar el valor de un elemento o atributo en la salida resultante de la hoja de estilos.  xsl:if  xsl:for-each  xsl:apply-templates: se usa para aplicar plantillas que se definen en una hoja de estilos. <xsl:stylesheet versión=”1.0” xmls:xsl=”http://www.w3.org/1999/XSL/Transform”>

56 XSLT. Ejemplos AutoSketch Ramón Montero 15.02 Windows 98 Jaime de Yraolagoitia 3.250 Web Graphics Ron Wodaski 49.95 Programming in Windows 95 Charles Petzold 39.95 Documento XML

57 XSLT. Ejemplos Titulo Autor Precio </td ejemplo1.xsl

58 XSLT. Ejemplos Aplicación de la hoja de estilo ejemplo1.xsl

59 Titulo Autor Precio ejemplo2.xsl

60 XSLT. Ejemplos Aplicación de la hoja de estilo ejemplo2.xsl

61 XSLFO  Superconjunto de CSS  Cada uno de los nodos del árbol se trata como un objeto de formateo, donde cada nodo soporta una amplia gama de estilos de presentación.  Cuando el procesador XSL procesa un objeto de formateo, se asigna a un área rectangular en la superficie de la pantalla.  Las propiedades del objeto determinan qué formato tiene, junto con los parámetros del área en la que está asignada.

62 XPath  Con Xpath podemos seleccionar y hacer referencia a texto, elementos, atributos y cualquier otra información contenida en un fichero XML.  Su nombre le viene de utilizar una notación de ruta (path) para navegar a través de la estructura jerárquica de un documento XML.  XPath opera sobre la estructura lógica de un documento XML, modelándolo como un árbol de nodos.  Una expresión Xpath devuelve una lista de punteros a los elementos que encajan con el patrón que representa dicha expresión.

63 Dos calles Pepa Pepo La primera calle Era una sombría noche del mes de agosto... Ella, inocente cual mariposa que surca el cielo... La segunda calle Era una oscura noche del mes de septiembre... Ella, inocente cual abeja que surca el viento en busca de flores...

64 Ejemplos de expresiones XPath /libro/capitulo/parrafo referencia a todos los elementos parrafo que sean hijos de cualquier elemento capitulo que a su vez sean hijos de cualquier elemento libro que cuelgue del nodo raíz. /libro/capitulo/@num selecciona el atributo num que posean los elementos capitulo /libro/capitulo[@num="1"]/parrafo referencia todos los elementos parrafo de todos los elementos capitulo que tengan un atributo llamado num al cual se le haya asignado el valor "1" /libro/capitulo[@public]/* selecciona todos los elementos hijos de los elementos capitulo que posean el atributo public //parrafo//*[@href] selecciona todos los descendientes de parrafo que tienen un atributo href //parrafo/text() selecciona el texto de todos los nodos parrafo

65 Xpointer (XML Pointer Language)  Describe cómo apuntar a un elemento de XML. Es similar a utilizar etiquetas para apuntar a una parte de los documentos HTML.  Sintaxis: donde expresión es una expresión Xpath con algunas propiedades extra. URI#xpointer(expresion)

66 XLink (XML Linking Language)  XLink describe cómo enlazar dos o más recursos.  Atributos  type. Valores: simple, extended, locator, arc, resource, title, none  href  show. Valores: replace, new, embed, other, none  actuate. Valores: onLoad, onRequest, other, none  label  from  to  role  arcrole  title xmls:xlink= "http://www.w3.org/XML/XLink/1.0"

67 XLink. Ejemplo enlace simple... xlink:label="UIB" xlink:show="new"> Este enlace apunta a la pagina de inicio de la UIB y hace que se visualice en una nueva instancia del navegador....

68 XLink. Ejemplo enlace extendido... Los clubes de fútbol de hoy en día......

69 RDF (Resource Description Framework)  Aplicación de XML para escribir metadatos que describan recursos Web (cualquier recurso identificable a través de un URI) de tal manera que puedan ser intercambiados y procesados por los ordenadores.  XML permite dotar de estructura a los documentos, RDF expresa el significado de esa estructura  Tripletas: sujeto, verbo y objeto (Sujetos) (tienen propiedades) (con ciertos valores) (Adelaida Delgado)(es la autora de)(XML y tecnologías asociadas) (field 5 in database A) (is a field of type) (zip code) Sujeto, verbo y objeto se identifican con URIs

70 XHTML  Versión de HTML conforme a XML  DTD para XML  Características  Existen elementos obligatorios (html, head, title, body, etc.)  Todas las etiquetas deben tener principio y fin  Se ha de respetar el anidamiento de etiquetas  El código ha de estar en minúsculas  Los valores de atributos han de ir entre comillas dobles  Servicio de validación en http://validator.w3.org/


Descargar ppt "XML y tecnologías asociadas Hacia la Web Semántica."

Presentaciones similares


Anuncios Google