La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tema 1: La evolución hacia XML Ricardo Eíto Brun Sevilla, 23-25 de octubre, 2002.

Presentaciones similares


Presentación del tema: "Tema 1: La evolución hacia XML Ricardo Eíto Brun Sevilla, 23-25 de octubre, 2002."— Transcripción de la presentación:

1 Tema 1: La evolución hacia XML Ricardo Eíto Brun Sevilla, 23-25 de octubre, 2002

2 Guíon del tema Introducción a los lenguajes de marcas Introducción a los lenguajes de marcas La evolución hacia XML La evolución hacia XML SGMLSGML HTML y dHTMLHTML y dHTML XMLXML xHTMLxHTML

3 El documento digital La diferencia entre bases de datos con información estructurada y las bases textuales se ha diluido, La diferencia entre bases de datos con información estructurada y las bases textuales se ha diluido, La representación o codificación de información – estructurada y no estructurada – ha aceptado al lenguaje XML como un estándar La representación o codificación de información – estructurada y no estructurada – ha aceptado al lenguaje XML como un estándar Utilizamos el mismo “lenguaje” o “formato”, XML, para: Utilizamos el mismo “lenguaje” o “formato”, XML, para: Codificar y transferir metadatos (información estructurada)Codificar y transferir metadatos (información estructurada) Codificar y transferir contenidos (información no estructurada)Codificar y transferir contenidos (información no estructurada) ¿cuál ha sido la evolución?¿cuál ha sido la evolución?

4 El documento digital - Formatos En la actualidad existen distintos formatos disponibles: En la actualidad existen distintos formatos disponibles: Basados en lenguajes de marcas: SGML/HTML/XML, a los que se llama ‘la opción semántica’.Basados en lenguajes de marcas: SGML/HTML/XML, a los que se llama ‘la opción semántica’. Formatos de imagen - TIFFFormatos de imagen - TIFF Formatos de réplica o portables - PDFFormatos de réplica o portables - PDF Formatos para el intercambio - MIF, RTF,Formatos para el intercambio - MIF, RTF, y un largo etcétera...y un largo etcétera...

5 Paradoja de la compatibilidad La existencia de distintos formatos originó la llamada ‘paradoja de la compatibilidad’: La existencia de distintos formatos originó la llamada ‘paradoja de la compatibilidad’: “A medida que el número de materiales disponibles en soporte digital autentaba, también se hacían mayores las dificultades para acceder a los mismos” Para solucionar este problema, se comenzó a trabajar a favor de la normalización de formatos Para solucionar este problema, se comenzó a trabajar a favor de la normalización de formatos La normalización nos lleva… a XML La normalización nos lleva… a XML

6 El camino hacia la normalización  ¿el camino hacia la normalización...  1974 - SGML  1985 - ODA/ODIF  1994 - HTML  1996 - XML  o hacia la desnormalización?  Distintos formatos para distintas fases del ciclo de producción Los formatos se complementan Los formatos se complementan La evolución ha favorecido a los formatos: La evolución ha favorecido a los formatos: simples,simples, con mayores posibilidades de interacción entre aplicaciones e intercambio de información.con mayores posibilidades de interacción entre aplicaciones e intercambio de información. El tratamiento de formatos forma ya parte de la GED y de todas las aplicaciones y sistemas de gestión (incluyendo bibliotecarias) El tratamiento de formatos forma ya parte de la GED y de todas las aplicaciones y sistemas de gestión (incluyendo bibliotecarias)

7 SGML Structured Markup Language Creado en 1969 en IBM por Charles Goldbarb Creado en 1969 en IBM por Charles Goldbarb En 1986 se convierte en norma ISO 8879-1986 En 1986 se convierte en norma ISO 8879-1986 Se basa en el ‘marcado descriptivo’ o ‘generalizado’, que indica cómo se deben intercalar marcas en un documento para diferenciar sus componentes estructurales. Se basa en el ‘marcado descriptivo’ o ‘generalizado’, que indica cómo se deben intercalar marcas en un documento para diferenciar sus componentes estructurales. Las marcas no señalan cómo se debe presentar el documento en pantalla ni cómo se tiene que formatear el documento al imprimirlo. Las marcas no señalan cómo se debe presentar el documento en pantalla ni cómo se tiene que formatear el documento al imprimirlo.

8 SGML no propone un conjunto de marcas predefinidas, sino: –la sintáxis que debe utilizarse para definir un conjunto de marcas aplicables a los documentos de un mismo tipo (aplicación) –la forma en la que se debe intercalar estas marcas en los documentos –los juegos de caracteres que se pueden utilizar en los documentos (ISO 646 e ISO 10646) SGML Structured Markup Language

9 Los elementos que pueden aparecer en un tipo de documento, sus características y el orden en el que deben escribirse se definen en un documento aparte llamado DTD (Document type definition) Los documentos se consideran ‘instancias’ de un tipo de documento específico que define su estructura válida Un documento SGML siempre debe cumplir las restricciones que se indican en su DTD Un documento SGML debe incluir una referencia a la DTD a partir de la cual se ha definido SGML Structured Markup Language

10 SGML tiene capacidad hipertexto basadas en la norma HyTime Los enlaces SGML unen un elemento origen con un elemento destino El elemento origen tendrá un atributo de tipo IDREF (por convención se llama link o xref a este atributo) El elemento destino tendrá un atributo de tipo ID (por convención se llama target) SGML Structured Markup Language

11 DTD <!ATTLIST nota link IDREF #REQUIRED> link IDREF #REQUIRED> <!ATTLIST textonota target ID #REQUIRED> target ID #REQUIRED> Instancia… Comentarios de Rodríguez Sáez La edición de 1994 contiene errores de interpretación… SGML Structured Markup Language

12 Para imprimir un documento SGML o verlo en pantalla, es necesario aplicarle un formato El formato indicará cómo se debe formatear cada uno de los elementos que forman el documento: tipo de letra, márgenes, etc. Se han diseñado dos normas que indican cómo se deben crear hojas de estilo para documentos SGML: –DSSSL (Document Style Semantic and Specification Language) –FOSI (Format Output Specification Interface) SGML Structured Markup Language

13 En el éxito del lenguaje SGML ha jugado un papel trascendental dos hechos: –La decisión del DoD (Department of Defense) de los EUA de adoptar SGML en su proyecto CALS (Computer-aided Acquisition and Logistic Support) –El desarrollo del lenguaje HTML y la ‘explosión’ del World Wide Web En los dos últimos años, XML ha devuelto el interés por SGML, al que amenaza con sustituir SGML Structured Markup Language

14 HTML Hypertext Markup Language HTML es una aplicación SGML para codificar documentos y distribuirlos en el World Wide Web HTML es una aplicación SGML para codificar documentos y distribuirlos en el World Wide Web HTML define un conjunto limitado de marcas que se pueden intercalar en los documentos HTML define un conjunto limitado de marcas que se pueden intercalar en los documentos Comparte las ventajas de SGML: multiplataforma, fácilmente procesable, etc. Comparte las ventajas de SGML: multiplataforma, fácilmente procesable, etc. Ha alcanzado un gran éxito, hasta el punto de llegar a igualarse edición electrónica con edición HTML Ha alcanzado un gran éxito, hasta el punto de llegar a igualarse edición electrónica con edición HTML

15 HTML - Limitaciones La simplicidad de HTML acarrea limitaciones: La simplicidad de HTML acarrea limitaciones: Falta de fórmulas de compresión asociadas al formato (problema ancho de banda)Falta de fórmulas de compresión asociadas al formato (problema ancho de banda) Posibilidades de formateo muy limitadasPosibilidades de formateo muy limitadas Falta de mecanismos de acceso: búsqueda texto completo, tablas de contenidos, etc.Falta de mecanismos de acceso: búsqueda texto completo, tablas de contenidos, etc. Escasa capacidad expresiva del lenguajeEscasa capacidad expresiva del lenguaje Disponemos de browsers y tecnologías (Java, lenguajes de script, etc.) muy potentes cuya capacidad está siendo infrautilizada por las limitaciones del formato HTMLDisponemos de browsers y tecnologías (Java, lenguajes de script, etc.) muy potentes cuya capacidad está siendo infrautilizada por las limitaciones del formato HTML

16 dHTML – HTML dinámico La evolución de HTML ha estado condicionada por la presión ejercida por los fabricantes de los browsers más utilizados La evolución de HTML ha estado condicionada por la presión ejercida por los fabricantes de los browsers más utilizados dHTML hace referencia a unas características soportadas por la versión 4 de los browsers de Netscape y Microsoft dHTML hace referencia a unas características soportadas por la versión 4 de los browsers de Netscape y Microsoft Algunas de estas características se tomaron del borrador disponible para la versión 4 del formato HTML Algunas de estas características se tomaron del borrador disponible para la versión 4 del formato HTML

17 dHTML – HTML dinámico dHTML permite: dHTML permite: Control sobre los elementos que conforman una página HTML mediante el DOM (Document Object Model)Control sobre los elementos que conforman una página HTML mediante el DOM (Document Object Model) Posibilidad de formatear los elementos de la páginaPosibilidad de formatear los elementos de la página Posibilidad de modificar el formato de los elementos en respuesta a acciones realizadas por el usuarioPosibilidad de modificar el formato de los elementos en respuesta a acciones realizadas por el usuario Control de la posición de un elemento u objeto dentro de la páginaControl de la posición de un elemento u objeto dentro de la página Capacidad de cambiar el contenido de la página una vez ésta ha sido descargada por el navegadorCapacidad de cambiar el contenido de la página una vez ésta ha sido descargada por el navegador

18 dHTML - HTML dinámico Problemas de dHTML Problemas de dHTML Orientado a la presentación de los documentos y a aspectos ‘visuales’Orientado a la presentación de los documentos y a aspectos ‘visuales’ No representa el contenido semántico ni la lógica de la información que contiene el documentoNo representa el contenido semántico ni la lógica de la información que contiene el documento Las ‘implementaciones’ de Microsoft y de Netscape no son idénticas: las mismas hojas de estilo son interpretadas de forma distinta por los navegadores, problemas en soporte a lenguajes de script, controles ActiveX, etc.Las ‘implementaciones’ de Microsoft y de Netscape no son idénticas: las mismas hojas de estilo son interpretadas de forma distinta por los navegadores, problemas en soporte a lenguajes de script, controles ActiveX, etc.

19 XML: eXtensible Markup Language Su desarrollo comienza en septiembre de 1996 dirigido por el W3C y con la participación de importantes empresas: Microsoft, IBM, Sun, Novell, ArborText, H-P etc. Su desarrollo comienza en septiembre de 1996 dirigido por el W3C y con la participación de importantes empresas: Microsoft, IBM, Sun, Novell, ArborText, H-P etc. El propósito es: El propósito es: diseñar un lenguaje de marcas optimizado para el WWWdiseñar un lenguaje de marcas optimizado para el WWW unir la simplicidad de HTML con la capacidad expresiva de SGMLunir la simplicidad de HTML con la capacidad expresiva de SGML Versión 1.0 ratificada en diciembre de 1997 Versión 1.0 ratificada en diciembre de 1997

20 Áreas de aplicación: Áreas de aplicación: Representación y distribución de documentos e información textualRepresentación y distribución de documentos e información textual Intercambio de datos e información estructurada a través de Internet y el WWWIntercambio de datos e información estructurada a través de Internet y el WWW Integración de datos procedentes de fuentes heterogéneasIntegración de datos procedentes de fuentes heterogéneas Elimina la ‘barrera’ entre información estructurada e información textual Elimina la ‘barrera’ entre información estructurada e información textual XML: eXtensible Markup Language

21  XML  Perfil de SGML  No especifica etiquetas, sino cómo deben definirse conjuntos de etiquetas aplicables a un tipo de documento  Modelo de hiperenlaces complejo (múltiples destinos, fijos y relativos, etc.)  HTML  Aplicación de SGML  Conjunto limitado de etiquetas y un único tipo de documento  Modelo de hiperenlaces simple (unidireccionales y fijos) XML: eXtensible Markup Language

22  XML  Gran capacidad para procesar documentos, el browser es una plataforma para el desarrollo de aplicaciones  Fin de la guerra de los navegadores y etiquetas propietarias  HTML  Escasa capacidad de procesamiento, el browser es un mero visor de páginas  El problema de la ‘no compatibilidad’ y las diferencias entre browsers ha alcanzado un punto en el que la solución es difícil XML: eXtensible Markup Language

23  XML  Mayor simplicidad  Eliminación de las etiquetas opcionales  Un documento no debe ser validado obligatoriamente, basta con que esté ‘bien formado’  SGML  Gran complejidad que dificulta su tratamiento e implementación  Validez requerida: todos los documentos deben cumplir las restricciones de su DTD XML: eXtensible Markup Language

24  XML  La simplicidad de XML hace más fácil el desarrollo de aplicaciones de bajo coste  Amplio soporte de la industria informática y más áreas de aplicación  SGML  Su complejidad hace que las aplicaciones informáticas para procesar SGML sean muy costosas  Escaso impacto al margen de sectores muy específicos: editoriales, doc.técnica XML: eXtensible Markup Language

25 XML XML Compatibilidad e integración con HTML (soporte a CSS y data-islands)Compatibilidad e integración con HTML (soporte a CSS y data-islands) Formateo y estilos fáciles de aplicar mediante:Formateo y estilos fáciles de aplicar mediante: CSS CSS XSL XSL SGML SGML No hay una compatibilidad con HTML definidaNo hay una compatibilidad con HTML definida Formateo y estilos relativamente complejos (norma DSSSL)Formateo y estilos relativamente complejos (norma DSSSL) XML: eXtensible Markup Language

26 XML - Áplicaciones XML - Áplicaciones RDF - Resource Description FrameWorkRDF - Resource Description FrameWork Catalogación de recursos Internet Catalogación de recursos Internet CDF - Channel Description FormatCDF - Channel Description Format Envío de información a través de push Envío de información a través de push OSD - Open Software DescriptionOSD - Open Software Description Descripción de packs de actualización de software Descripción de packs de actualización de software OFX - Open Financial ExchangeOFX - Open Financial Exchange Intercambio de datos financieros para aplicaciones contabilidad doméstica Intercambio de datos financieros para aplicaciones contabilidad doméstica XML: eXtensible Markup Language

27 XML - Áplicaciones XML - Áplicaciones XER - XML Encoding RulesXER - XML Encoding Rules Codificar mensajes ASN.1 para Z39.50, ILL, etc. Codificar mensajes ASN.1 para Z39.50, ILL, etc. MARTIF - Machine Readable Terminology Interchange Format MARTIF - Machine Readable Terminology Interchange Format Codificar registros terminológicos Codificar registros terminológicos TMX - Translation Memory eXchange TMX - Translation Memory eXchange Codificar memorias de traducción Codificar memorias de traducción DOCBOOKDOCBOOK DTD para manuales y guías técnicas documentación de software DTD para manuales y guías técnicas documentación de software XML: eXtensible Markup Language

28 Hay distintos enfoques y opiniones: Hay distintos enfoques y opiniones: SGML para documentos y XML para datos y documentos generados ‘on the fly’ sin persistenciaSGML para documentos y XML para datos y documentos generados ‘on the fly’ sin persistencia XML sustituirá a SGML definitivamenteXML sustituirá a SGML definitivamente XML sustituirá a HTMLXML sustituirá a HTML ¿Se ha sobreestimado XML?¿Se ha sobreestimado XML? Problema de falta de estandarizaciónProblema de falta de estandarización ¿El futuro de XML?

29 Las conferencias de GCA pasaron a llamarse XML Conference en lugar de SGML Conference Las conferencias de GCA pasaron a llamarse XML Conference en lugar de SGML Conference Gartner Group señala a XML como un medio óptimo para el intercambio y la integración de datos en torno a arquitecturas Internet y http Gartner Group señala a XML como un medio óptimo para el intercambio y la integración de datos en torno a arquitecturas Internet y http Compañías antagónicas trabajaron a favor de XML (Microsoft, IBM, Sun, etc.) Compañías antagónicas trabajaron a favor de XML (Microsoft, IBM, Sun, etc.) Los fabricantes de bases de datos (Oracle, Informix, Software AG) se volcaron con XML Los fabricantes de bases de datos (Oracle, Informix, Software AG) se volcaron con XML

30 xHTML W3c lo hace público en agosto de 1999 W3c lo hace público en agosto de 1999 Reformular HTML 4.0, utilizando los mismos elementos y atributos, pero con sintáxis XML Reformular HTML 4.0, utilizando los mismos elementos y atributos, pero con sintáxis XML Uso obligatorio de etiquetas de inicio y de fin, p.ej.... Uso obligatorio de etiquetas de inicio y de fin, p.ej.... Sintáxis XML para elementos vacíos:Sintáxis XML para elementos vacíos: en lugar de en lugar de Valores de atributos entrecomillados (números también)Valores de atributos entrecomillados (números también) Nombres de elementos y atributos deben escribirse en minúsculasNombres de elementos y atributos deben escribirse en minúsculas

31 xHTML Se proponen tres DTDs para documentos HTML Se proponen tres DTDs para documentos HTML Estricto – para documentos nuevosEstricto – para documentos nuevos Transición – para documentos ya disponiblesTransición – para documentos ya disponibles Para documentos con marcos (frames)Para documentos con marcos (frames) Soporte a espacios de nombres “namespaces” Soporte a espacios de nombres “namespaces” Los elementos se agrupan en módulos: xhtml1- tables.mod, xhtml1-form.mod, xhtml1- linking.mod, etc. Los elementos se agrupan en módulos: xhtml1- tables.mod, xhtml1-form.mod, xhtml1- linking.mod, etc. Facilitar el acceso al Web desde otros dispositivos: móviles, TV, etc. Facilitar el acceso al Web desde otros dispositivos: móviles, TV, etc.


Descargar ppt "Tema 1: La evolución hacia XML Ricardo Eíto Brun Sevilla, 23-25 de octubre, 2002."

Presentaciones similares


Anuncios Google