EGEE-III INFSO-RI-222667 Enabling Grids for E-sciencE www.eu-egee.org EGEE and gLite are registered trademarks Architecture of the gLite Data Management.

Slides:



Advertisements
Presentaciones similares
gLite Data Management Grupo Grid Universidad de Los Andes
Advertisements

Internet y tecnologías web
Diseño de Bases de Datos
SISTEMAS DE GESTIÓN DE BASES DE DATOS
Proyecto e-CA: Organización Virtual y Testbed Susana Sánchez Expósito José Ruedas Sánchez II Reunión de e-Ciencia Andaluza 16-17, Octubre 2008.
Hacia un sistema institucional de costos 04 / 12 / 09 Sitio Web para descarga de productos SC Dirección General de Planeación y Desarrollo en Salud.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Término que se le da al conjunto de equipos de cómputo que se encuentran conectados entre si por medio de dispositivos físicos que envían y reciben -
Servicios Web.
Tema 5 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto
Características generales de un servicio Web.
PROTOCOLOS Un protocolo es un conjunto de reglas que hacen que la comunicación en una red sea más eficiente.
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
Primer Taller Latino Americano de Administradores de Grid Storage Element Vanessa Hamar Noviembre del 2005 Mérida Venezuela.
INTEGRANTES ALEXIS MENDOZA ALDAIR ARRIETA CARLOS PASTOR LORENA RODRIGUEZ ANTHONY JIMENEZ.
Introducción a los Conceptos de Bases de Datos Docente: Ing. Marleny Soria Medina.
Universidad de La Coruña Escuela Universitaria Politécnica Control de Procesos por Computador Diego Cabaleiro 24 de Noviembre 2009.
Acceso del usuario a la aplicación.
2. ASYNCRONOUS TRANSFER MODE 2.1Características generales 2.2 Modelo de referencia del protocolo 2.3 Categorías de servicio ATM.
Arquitectura de una aplicación
BASE DE DATOS BY: Julián Villar Vázquez.
Sistema de archivos Sistemas operativos.
Tema 10.3: Asignación de Espacio No Contiguo. Tema 10.3: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.),
Asignación de Espacio No Contiguo
Sistema de Archivos Hernández Martinez Sonia Lizbeth
5. Sistemas de archivos avanzados1 Tema 5: Sistemas de Archivos Avanzados Resumen: –Sistema de archivos distribuido –File Replication Service.
Tema 1. Introducción a Windows 2000
Un sistema de gestión de bases de datos: Es un conjunto de programas que permite a los usuarios crear y mantener una base de datos. Por tanto, el SGBD.
Capítulo 7 Gestión de memoria.
Sistema de análisis distribuido de ATLAS (ADA) Farida Fassi / Mª Dolores Jordán IFIC.
1 Seguridad de los sistemas de ficheros Ampliación de Sistemas Operativos Trabajo realizado por: –Jose Yeray Suárez Perdomo.
Seguridad DNS. Javier Rodríguez Granados.
Tema 8: Introducción a los SOs. Tema 8: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.), Introducción.
CONCEPTOS FUNDAMENTALES DEL NIVEL DEL SISTEMA OPERATIVO
Cuentas de usuarios y grupos en windows 2008 server
Teoría de Sistemas Operativos Sistemas Archivos de Red
Estructura de los Sistemas Operativos
Prof. César Molina Sesión 2 - Principios de la computación Redes y comunicaciones.
JHON JAIRO MONTOYA GIRALDO INFORMATICA EMPRESARIAL.
Sistemas de Archivos Sistemas Operativos.  Se debe proporcionar un almacenamiento secundario que respalda a la memoria principal  El Sistema de archivos.
Navegación y comunicación en Internet y uso de las redes sociales
La administración de dominios
Instituto Tecnológico de las Américas (ITLA)
File Transfer Protocol.
Jorge De Nova Segundo. SSH File Transfer Protocol (también conocido como SFTP o Secure File Transfer Protocol) es un protocolo del nivel de aplicación.
Gestión de sistemas operativos de red
Gabriel Montañés León.  El sistema de nombres de dominio (DNS, Domain Name System) se diseñó originalmente como un protocolo. Antes de considerar qué.
Sistemas Operativos De Red
PLATAFORMA TEÓRICO-CONCEPTUAL
Bases de Datos Unidad 1.
BASE DE DATOS.
Luis Villalta Márquez Servicios SFTP/SCP. SFTP SSH File Transfer Protocol (también conocido como SFTP o Secure File Transfer Protocol) es un protocolo.
INTEGRANTES: Giovanna Kristhel Mendoza Castillo Eduardo Solis Lara Gustavo Antonio González Morales.
GlobalQuoter.COM Fácil, Seguro y Asequible GlobalQuoter.COM Fácil, Seguro y Asequible.
BASE DE DATOS DISTRIBUIDAS
Arquitectura de una aplicación Arquitectur a: desarrolla un plan general del sistema, asegurando que las necesidades de los usuarios sean atendidas. Ingeniería.
En el presente trabajo, se explica los diferentes elementos que nos ofrece Microsoft Access, para hacer mas fácil y rápido la realización de bases de.
18/02/2016Diego Alberto Rincón Yáñez, Pontificia Universidad Javeriana, 1.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
Diccionario/Directorio de Datos
BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks The gLite Information System Virginia Martín-Rubio.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Proxy Management with the gLite API Virginia.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Introducción al Middleware gLite Antonio.
Sistemas de archivos. Sistemas de archivos 2 Objetivo del SdA  Ocultar al usuario los detalles relativos al almacenamiento de información en dispositivos.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Architecture of the gLite Data Management.
Information System Virginia Martín-Rubio Pascual
The gLite Information System
The gLite Information System
The gLite Information System
Transcripción de la presentación:

EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Architecture of the gLite Data Management System Virginia Martín-Rubio Pascual RedIRIS gLite tutorial for users and applications developers de Octubre de 2009 Madrid

Enabling Grids for E-sciencE EGEE-III INFSO-RI Índice -Introducción a la gestión de datos en Grid -DMS (Data Storage Management) -SE (Storage Element) Tipos de SE, protocolos soportados -SRM (Storage Resource Manager) -Nomenclatura ficheros Grid -LFC (LCG File Catalog) Arquitectura Ejemplos Comandos LFC -Herramienta de Gestión de réplicas LCG Comandos LCG

Enabling Grids for E-sciencE EGEE-III INFSO-RI Introducción Usuarios y programas producen y requieren datos, estos pueden ser de distinta naturaleza pero son tratados de la misma forma  archivos. Archivos: Generalmente son escritos una sola vez y leídos muchas Localizados en Storage Elements (SEs) Algunas réplicas de un archivo se encuentran en diferentes sitios Accesibles por los usuarios de Grid y aplicaciones desde “cualquier parte” Localizable por el WMS (requerimientos descritos en JDL) Ademas… WMS puede enviar datos hacia y desde los jobs: Input y Output Sandbox. Archivos pueden ser copiados desde los sistemas de ficheros locales (WNs, UIs) hacia el Grid (SEs) y viceversa.

Enabling Grids for E-sciencE EGEE-III INFSO-RI El reto de DMS (Data Managament System)

Enabling Grids for E-sciencE EGEE-III INFSO-RI DMS (Data Management System) DMS permite la manipulación de los datos: -El usuario no necesita conocer donde se encuentran los datos físicamente, solo su nombre lógico. -Los datos son consultados a través de interfaces estándares. -Los datos pueden ser replicados o transferidos a tantos sitios como sea necesario. -Los datos almacenados son compartidos con otros usuarios de la misma VO. DMS permite realizar todas las operaciones que el usuario esta acostumbrado a utilizar: -Subir/bajar archivos, -Crear/renombrar/borrar/mover/listar archivos/directorios, -Crear enlaces simbólicos.

Enabling Grids for E-sciencE EGEE-III INFSO-RI SE (Storage Element) Storage Element: es el servicio que permite a un usuario o una aplicación almacenar datos para recuperarlos en el futuro. -Los archivos pueden escribirse una sola vez y leerse tantas veces como se requiera. -Los archivos no pueden cambiarse a menos que sean eliminados o reemplazados. -Permite administrar diferentes sistemas de almacenamiento de manera uniforme y transparente para el usuario (proporcionando una interfaz SRM). -Soporta protocolos de transferencia de archivos básicos: (donde GSI significa Grid Security Infraestructure) -Soporta un protocolo de acceso nativo I/O POSIX, librerias cliente I/O para acceso directo a datos (GFAL, Grid File Access Library).

Enabling Grids for E-sciencE EGEE-III INFSO-RI Tipos de SE Existen distintos tipos de Storage Elements: -Classic SE: servidor GridFTP, usa RFIO en modo no seguro (no está soportado por la interfaz SRM). Cercano a dejar de estar soportado. Sistemas de almacenamiento masivo: -CASTOR: CERN Advanced STORage manager. Es un sistema de ficheros virtual. Como usa el protocolo RFIO en modo no seguro y no soporta GSI, solo está permitido acceder a los archivos almacenados desde la misma LAN del SE. Disk pool managers: -dCache: consiste en un servidor y uno o más pool de discos, los discos se pueden añadir al pool de manera dináminca. dCache usa el protocolo gsicap. Se emplea como frontend buffer de disco en muchos sistemas de almacenamiento masivo (como por ejemplo HPSS o Enstore). -LCG Disk pool manager (DPM): es un gestor de pool de discos ligero donde los discos también pueden ser añadidos dinámicamente. Al igual que ocurre con CASTOR y dCache, esconde la complejidad de la arquitectura del pool de discos. Emplea el protocolo RFIO en modo seguro, lo que permite acceder desde una WAN.

Enabling Grids for E-sciencE EGEE-III INFSO-RI SRM SRM (Storage Resource Manager) SRM ha sido diseñado como una interfaz única que se encarga de la interacción de los SE (tanto dispositvos de almacenamiento masivo como disk pool managers) con el almacenamiento local. Esquema de funcionamiento: 1. El cliente solicita un archivo al SRM. 2. El SRM solicita al sistema de almacenamiento la recuperación del archivo. 3. El sistema de almacenamiento notifica la disponibilidad del archivo y su ubicación. 4. El SRM devuelve la TURL (Transport URL), por ejemplo: la ubicación donde se puede acceder al archivo. 5. El cliente interactúa con el sistema de almacenamiento usando el protocolo especificado por la TURL. SE CASTOR SE DPM SE dCache Cliente

Enabling Grids for E-sciencE EGEE-III INFSO-RI Nomenclatura de los ficheros -Logical File Name (LFN), alias creado por el usuario que puede usarse para identificar un fichero: lfn:/grid/gilda/tutorials/input-file -Grid Unique Identifier (GUID), compartido por todas las réplicas de un fichero guid:4d57edef-fa5c-4512-a345-1c838916b357 -Storage URL (SURL), réplica del fichero localizada en un SE específico: srm://aliserv6.ct.infn.it/gilda/generated/ /fileb366f371-b2c0-485d- b12c-c114edaf4db4 -Transport URL (TURL), réplica del fichero localizada en un SE específico y transportada con un determinado protocolo: gsiftp://gilda.ct.infn.it/gilda/generated/ /fileb366f371-b2c0-485d-b12c- c114edaf4db4

Enabling Grids for E-sciencE EGEE-III INFSO-RI LFC (LCG File Catalog) ¿Cómo llevar la cuenta de todos los ficheros que tenemos en el Grid? LFC es el servicio que mantiene localizadas las distintas réplicas de los ficheros Grid, guardando el mapeo entre los distintos LFNs, SURLs y GUIDs. -LFC publica el camino hasta los ficheros en el Sistema de Información para que puedan ser descubiertos por otras herramientas de gestión de datos u otros servicios (por ejemplo el WMS). -Consiste en un único catálogo donde los usuarios pueden acceder y administrar ficheros a través del LFN. -Sistema de metadatos y enlaces simbólicos. -Estructura de directorios en forma de árbol. Para cada VO soportada existe un directorio dentro del directorio “/grid” donde todos los miembros de esa VO tienen permisos de lectura-escritura.

Enabling Grids for E-sciencE EGEE-III INFSO-RI Ejemplo de LFC Espacio de nombre LFCDefinido por el usuario

Enabling Grids for E-sciencE EGEE-III INFSO-RI Arquitectura del catálogo LFC Más LFN pueden ser añadidos como SURLs enlaces simbólicos al LFN principal.

Enabling Grids for E-sciencE EGEE-III INFSO-RI Ejemplo 1: lanzamiento de un trabajo -Ficheros pequeños: InputSandbox / OutputSandbox (atributos del.jdl) -El tamaño máximo de estos ficheros es de 10MB.

Enabling Grids for E-sciencE EGEE-III INFSO-RI Ejemplo 2: gestión de datos en un trabajo(1/2) -Ficheros almacenados en un SE:

Enabling Grids for E-sciencE EGEE-III INFSO-RI Ejemplo 2: gestión de datos en un trabajo(2/2) Si el trabajo necesita un fichero de gran tamaño almacenado en un SE lo puede especificar en el jdl para que el WMS elija el CE más cercano a ese SE. Por ejemplo: DataRequirements = { [ InputData = {"lfn:/grid/gilda/emidio/test.txt"}; DataCatalogType = "DLI"; DataCatalog = " ] }; DataAccessProtocol = {"rfio","gsiftp"}; Introducción a gLite

Enabling Grids for E-sciencE EGEE-III INFSO-RI Comandos LFC -El usuario puede interactuar con el catálogo de ficheros (LFC) a través de la línea de comandos o de APIs para C. -Es necesario que la variable de entorno LFC_HOST contenga el nombre del servidor LFC: LFC_HOST=lfc-gilda.ct.infn.it -La estructura de directorios del espacio de nombres LFC tiene el siguiente aspecto: /grid/ / -Los comandos LFC permiten manipular los archivos y directorios registrados en el LFC.

Enabling Grids for E-sciencE EGEE-III INFSO-RI Listado de comandos LFC

Enabling Grids for E-sciencE EGEE-III INFSO-RI ACL (Access Control List) LFC permite adjuntar a un fichero o a un directorio una lista de control de acceso (ACL), que consiste en una lista de permisos que indican quien puede acceder o modificar dicho fichero o directorio. -Los permisos son similares a los de los sistemas de ficheros UNIX: lectura(r), escritura(w) y ejecución (x) -En LFC todos los usuarios y grupos están definidos por identificadores de usuario (uids) o de grupo (gid) numéricos y virtuales (porque sólo existen en el espacio de nombres del LFC). Un usuario puede identificarse por un nombre, un uid virtual o un DN. Un grupo puede identificarse por un nombre, un gid virtual o el FQAN (Fully Qualified Attribute Name) de un VOMS. -Un directorio LFC tiene también una ACL por defecto, que es heredada por los ficheros y subdirectorios que existan dentro de este. -Al crear un subdirectorio su ACL por defecto es heredada de su directorio padre.

Enabling Grids for E-sciencE EGEE-III INFSO-RI Herramienta LCG para la gestión de datos -La herramienta de gestión de datos LCG permite a los usuarios copiar ficheros entre la UI, WN y un SE, registrar las entradas en el LFC y duplicar ficheros entre SEs. -El paquete lcg-utils asegura la relación entre archivos en el SE y el LFC. -Es necesario que la variable de entorno LCG_GFAL_INFOSYS contenga el nombre del servidor top BDII: LCG-GFAL_INFOSYS=gilda-bdii.ct.infn.it:2170 lcg-cpCopia un archivo del grid a un destino local. lcg-crCopia un archivo a un SE y registra el archivo en el catálogo. lcg-delElimina un archivo lcg-repDuplica un archivo en dos SEs y registra la réplica en el catálogo lcg-gtBusca el TURL de un dado SURL y el protocolo de transferencia

Enabling Grids for E-sciencE EGEE-III INFSO-RI Referencias gLite: Guía del usuario Documentación oficial de LFC y DPM Documentación del DMS

Enabling Grids for E-sciencE EGEE-III INFSO-RI Preguntas ¡Gracias por vuestra atención! ¿Preguntas?