Primer Taller Latino Americano de Administradores de Grid Storage Element Vanessa Hamar Noviembre 21-25 del 2005 Mérida Venezuela.

Slides:



Advertisements
Presentaciones similares
Integrando Obras y Oficina
Advertisements

Capitulo 7: Procesamiento batch y el Job Entry Subsystem (JES)
Intranets P. Reyes / Octubre 2004.
Configuración de Control
Sección 13 Programación de Obra
© Dr. Iván E. Calimano Formas, usos, etc.
E-science grid facility for Europe and Latin America Instalación del Computing Element (CE) Vanessa Hamar Grupo Grid Universidad de Los.
Instalación y configuración del catálogo de datos (LFC) Javier Pérez-Griffo Callejon Centro Extremeño de Tecnologías Avanzadas (CIEMAT) Unidad de Sistemas.
gLite Data Management Grupo Grid Universidad de Los Andes
Nau Gran dHivern Intr. a la creación y gestión de páginas web Introducción a la web.
Internet y tecnologías web
CFGM Redes Locales Documentos: Elementos de configuración de una suite de antivirus. Panda Internet Security 2011.
PRESENTA: Mizrain Cano Chico Profesor: Lic. Albino Petlacalco Ruiz
Mail Server Xavier Bustamante. Objetivo: Permitir que usuarios en la red puedan enviar y recibir mail. HUB user10 user20 Mac OS X Server 10.4 user30.
© 2009 Cisco Systems, Inc. All rights reserved.Cisco Public 1 Septiembre 2009 Herramienta de Administracion de Servicio de Acceso: Bill to ID.
Proyecto e-CA: Organización Virtual y Testbed Susana Sánchez Expósito José Ruedas Sánchez II Reunión de e-Ciencia Andaluza 16-17, Octubre 2008.
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Programa para el Impulso a la Implementación del Protocolo IPv6 en Instituciones Vinculadas a RENATA 2012 Servicio FTP.
4. Mantenimiento de los espacios de trabajo. Manual de formación 2 4. Modificación de los espacios de trabajo 4.1 Introducción……………………………….……..……..…pág.
Sistemas Operativos Distribuidos Plataforma Cliente/Servidor
EQUIPO ·# 3 SISTEMAS OPERATIVOS
SERVICIOS DE TCP/IP.
Ing. Horacio Carlos Sagredo Tejerina
Trabajar en una pequeña o mediana empresa o ISP. Capítulo 7
Los servicios de red son la fundación de una red de trabajo en un ambiente de computadoras. Generalmente los servicios de red son instalados en uno o.
Compartir Informacion Compartir Hardware y Software
Sistemas Operativos Distribuidos
PASOS PARA EL FORMATEO DE UN PC
Es un Sistema operativo de red. Es una de las plataformas de servicio más fiable para ofrecer acceso seguro y continuado a la red y los recursos de.
PROTOCOLOS Un protocolo es un conjunto de reglas que hacen que la comunicación en una red sea más eficiente.
Índice Sesión I Bloque I (09:30 a 10:30 Horas) Configuración Inicial
Integración de VOs y middleware para EGEE
Almacenamiento virtual de sitios web: «Hosts» virtuales Gustavo Antequera Rodríguez.
Servidores de nombres de dominio (DNS)
Aspectos básicos de networking: Clase 5
Introducción a los Conceptos de Bases de Datos Docente: Ing. Marleny Soria Medina.
1 Consigna 2006 UPV/EHU Consigna David Fernández Acin CIDIR Bizkaia Euskal Herriko Unibertsitatea / Universidad del País Vasco XXII.
Universidad de La Coruña Escuela Universitaria Politécnica Control de Procesos por Computador Diego Cabaleiro 24 de Noviembre 2009.
Pierre Sergei Zuppa Azúa Administración de sistemas versus administración de servicios.
Sistemas Operativos Distribuidos Plataforma Cliente/Servidor
Implementación y administración de DHCP
FHS: organización de directorios en Linux
5. Sistemas de archivos avanzados1 Tema 5: Sistemas de Archivos Avanzados Resumen: –Sistema de archivos distribuido –File Replication Service.
Ing. Cristhian Quezada Asenjo
DNS Pamela Millán Ana Laura Félix Teresa Treviño
Creación de un dominio Windows  Descripción general Introducción a la creación de un dominio de Windows 2000 Instalación de Active Directory Proceso.
BASE DE DATOS EN LA WEB.
Almacenamiento virtual de sitios web “HOST VIRTUALES” Tema 4 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto.
CONCEPTOS FUNDAMENTALES DEL NIVEL DEL SISTEMA OPERATIVO
Almacenamiento virtual de sitios web “HOSTS VIRTUALES”
UNIVERSIDAD LATINA BASES DE DATOS ADMINISTRACIÓN.
Almacenamiento virtual de sitios web: «Hosts» virtuales. Jesús Torres Cejudo.
Teoría de Sistemas Operativos Sistemas distribuidos.
La administración de dominios
S ERVICIOS DE RED E I NTERNET T EMA 4 : I NSTALACIÓN Y ADMINISTRACIÓN DE SERVICIOS W EB Nombre: Adrián de la Torre López.
File Transfer Protocol.
Gestión de sistemas operativos de red
Gabriel Montañés León.  El sistema de nombres de dominio (DNS, Domain Name System) se diseñó originalmente como un protocolo. Antes de considerar qué.
Luis Villalta Márquez. Servidores de nombres de dominio (DNS)
Almacenamiento virtual de sitios web: «Hosts» virtuales
Elementos y tipos de sistemas operativos
1     Sistema de gestión de contactos PARQUE E Miércoles, 29 de Abril de 2015   
20411 D - LAB 8 B Preparación para la configuración de Direct Access
Sistema de Dominio DNS Por: Cesar Posada Octavio Sucerquia Yefferson Henao.
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
18/02/2016Diego Alberto Rincón Yáñez, Pontificia Universidad Javeriana, 1.
REDES Angie Paola Gutiérrez C. ♥ Once ♥. REDES DE COMPUTADORAS Es un conjunto de elementos interceptados entre si, para compartir información. Como en.
WINDOWS SERVER 2008 r2 ADMINISTRACION DE RECURSOS: Con el Administrador de recursos del sistema de Windows del sistema operativo Windows Server® 2008 R2,
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Architecture of the gLite Data Management.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks The gLite Information System Virginia Martín-Rubio.
Transcripción de la presentación:

Primer Taller Latino Americano de Administradores de Grid Storage Element Vanessa Hamar Noviembre del 2005 Mérida Venezuela

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 2 Derechos de Autor Todas las láminas aqui presentadas han sido tomadas del presentaciones y documentos del EGEE disponibles en Internet.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 3 Introducción Archivos y replicas –Los usuarios y los programas producen y requieren datos. –La data puede ser almacenada en Datasets (Conjuntos de archivos)  Se localizan en los Storage Element  Se puede tener una copia de un archivo en muchos sitios  Deben ser accesibles por los usuarios y las aplicaciones del Grid desde cualquier sitio.  Deben poder ser localizadas por el WMS (requerimientos de datos en los JDL) –Otra manera  El Resource Broker puede enviar (pequeñas cantidades) datos para los trabajos Input Sandbox y Output Sandbox  La data puede ser copiada desde sistemas de archivos locales (WNs, Uis) hacia el grid

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 4 Almacenamiento La data puede ser accedida utilizando –Transferencia de archivos: GridFTP (seguro) –File I/O: RFIO (Acceso Local) gsidcap (Acceso seguro al dCache) Storage Elements en LCG-2 –Classic SE (Servidor de discos) GridFTP + RFIO –SRM – dCache (Spool de discos) GridFTP + gsidcap –SRM – Disk Pool Manager (Spool de Discos) GridFTP + RFIO –SRM – Castor (Sistemas masivos de almacenamiento) GridFTP + RFIO Interfaz del Storage Resource Manager (SRM) –Provee capacidades adicionales para el manejo del almacenamiento. –SRM es un protocolo para el manejo del almacenamiento –Permite el acceso a los archivos utilizando: GridFTP, dcap, RFIO…

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 5 Storage Element Classic Básicamente un disco con: –Servidor GridFTP –Demonio RFIO Capacidades que no posee –Manejo de tiempo de gracia de archivos Lack of lifetime management (archivos permanentes y volátiles) –No permite realizar reservaciones de espacio o identificación de archivos (Pinning file). Es muy limitado para el Grid –Por lo que se introdujo el SRM

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 6 CASTOR Cern Advanced STORage Manager Manejador de almacenamiento jerárquico –Cintas + Discos Cache –Espacios permanentes y volátiles La data es accesible por: –GridFTP –Plugin RFIO – GSI Implementa la interfaz SRM

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 7 dCache Maneja pool de discos –La data puede ser distribuida entre una gran cantidad de servidores de discos. –Soporta copias internas y externas de un único archivo –Balanceo de carga automático utilizando métricas de costos y transferencias entre pools. –Maneja Archivos permanentes y volátiles. Data accesible por –GridFTP –Gsidcap (GSI-seguro) Sigue siendo una solución pesada para: –Sitios pequeños –Solo para soluciones pre-probadas

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 8 dCache Nodos del dCache –Un nodo admin + varios nodos pool –El nodo admin = centro del sistema + puntos de acceso  SRM, gridftp y servidores gridcap –Nodos pool: servidores de discos con espacios dedicados –Las pool pueden ser agrupados para facilitar su administración. –El nodo admin también puede ser un nodo pool. Un único árbol de espacios jerárquicos –Pnfs virtual del sistema de archivos (Utiliza NFS) –Soportado por una base de datos PostgreSQL en el nodo admin. Terminología –La funcionalidades son divididas en dominios (servicios) –Los dominios están subdivididos en celdas –Doors o puertas son puntos de entrada para acceder a la data (GridFTP door, gsidcap door….)

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 9 SRM El Storage Resource Manager (SRM) es una especificación que define la manera en la cual un server que corre sobre un recurso de almacenamiento debe ser capaz de interactuar con aplicaciones alcanzables a través del Grid. Estas aplicaciones deben ser capaces de invocar un conjunto de métodos y esperar respuestas estándares y el rol de la interfaz SRM es asegurar que cualquier implementación de un sistema de manejo de almacenamiento puede ser capaz de utilizar esos métodos y respuestas.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 10 SRM SRM ha sido el resultado de la colaboración del European DataGrid, CERN, Fermilab y LBNL. La implementación de los protocolos SRM se han hecho para numerosos sistemas de almacenamiento: HPSS, Enstore, JasMINE, CASTOR, EDG SE, ATLAS y arreglos RAID.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 11 SRM Los Archivos SRM y los tipos de espacios de almacenamiento –Se basan en el tiempo de vida de un sistema de almacenamiento:  Permanente: en un sistema de almacenamiento son de la misma naturaleza que los archivos permanentes en un sistema de archivos típico. Se garantiza que estos son almacenados y permanecen sin modificaciones a menos que los propietarios decidan borrarlos.  Volátil: son aquellos archivos que tienen un tiempo de vida especifico, va a estar disponible para el usuario solo por ese tiempo especifico. Si este expira el archivo puede ser removido tan pronto el sistema de almacenamiento requiera el espacio.  Durable: son archivos que usualmente son de naturaleza temporal y que contiene data importante. También tiene tiempo de vida pero cuando expira el sistema no lo remueve. La idea de esta información es que el sistema pueda accederlo rápidamente.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 12 Funcionalidad del SRM Existen muchos tipos de sistemas de almacenamiento, como cache de discos, sistemas de almacenamiento de cintas, arreglos de discos. Un “storage facility” puede contener mas de un tipo de sistemas de almacenamiento. En adición estos sistemas pueden manejas diferentes operaciones aplicar diferentes políticas. Las operaciones básicas que cualquier sistema manejado por una implementación SRM debe soportar se dividen en 5 categorías: –Manejo de espacio de funciones –Manejo de espacio de directorios –Funciones de transferencia –Funciones de permisología –Funciones de status

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 13 Manejo de espacio de funciones Estas funciones permiten reservar y actualizar el espacio en sistemas de almacenamiento, así como también encontrar información acerca del espacio y los archivos que contiene (espacio libre, tiempo de vida, etc.) y modificar estos parámetros.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 14 Manejo de espacio de directorios Son las funciones que pueden ser necesarias para el manejo de directorios de sistemas de archivos de Unix. Por estas razones tienen los mismos nombres que los comandos de shell de Unix: srmMkdir, srmRmdir, srmMv, etc) Los directorios son un constructor virtual que provee esencialmente al usuario una manera lógica de agrupar archivos dentro del grid.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 15 Funciones de transferencia Las funciones de transferencia son utilizados para transferir archivos de y para los sistemas de almacenamiento manejados por el SRM. Los nombres de los archivos utilizados por estas funciones se refieren a las replicas en el Grid son las SURLs y los TURLs.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 16 Funciones de permisología Esta son la funciones encargadas de proteger los archivos de accesos no autorizados. La permisología de los archivos son completamente análogos a las permisologías en los sistemas de archivos Unix.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 17 Funciones de estatus Son aquellas que pueden ser utilizadas para seguir el progreso de una operación SRM. La duración de subir o bajar desde o hacia un sistema de almacenamiento, comenzando en el momento de la petición del cliente, la información del estatus de la operación, etc.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 18 Identificación de Archivos En la práctica debe garantizar la extensión del tiempo de vida de un archivo de naturaleza temporal, con el fin de incrementar el chance de que esta este disponible después que vence su tiempo de vida. Coloca una marca en el archivo temporal y va borrando el archivo con la marca mas antigua.

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 19 LCG-2 y SRM Existen diferencias entre el SE classic y la implementación del SE con SRM, la más importante es que la ultima soporta transferencia de datos asíncrona y la identificación de los archivos (pinning file) En el caso de la implementación de un SE Classic el cliente solo puede hacer la petición hasta que la previa haya sido terminada.

Primer Taller Latino Americano de Administradores de Grid Instalación SE

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 21 Instalación del SE con YAIM Procedimiento para cada nodo: –Instale el Sistema Operativo (SL3 or RH7.3)  Asegúrese que el NTP y el apt-get estén instalados y configurados. –Obtenga el certificado para cada host –Copie hostcert.pem y el hostkey.pem dentro del directorio /etc/grid-security –Instale YAIM (como root) wget ; rpm -ivh lcg-yaim-...-noarch.rpm –Copie el archivo site config (previamente configurado) –Corra los scripts de instalación: > install_node mySite-info.def lcg-SECLASSIC > configure_classic_SE mySite-info.def –Posiblemente tendrá unos huecos de seguridad en el corta fuegos (GridFTP, SRM, RFIO…) –Las configuraciones locales es mejor hacerlas a mano. –Verifique que las CAs deben estar instaladas

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 22 Classic SE Important attributes for the SE: –Generales:  CE_HOST, SE_HOST, SITE_NAME –Cuentas y monitoreo  MON_HOST, REG_HOST, MYSQL_PASSWORD, GRIDICE_SERVER_HOST –Configuración del apt_get  LCG_REPOSITORY, CA_REPOSITORY –VOs y usuarios  USERS_CONF, VOS, VO_ _SGM, VO_ _USERS, VO_ _STORAGE_DIR –Especificación del Close SE  CE_CLOSE_SE, CE_CLOSE_ _HOST, CE_CLOSE_ _ACCESS_POINT

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 23 Configuración - Logs Gridftp server –Información del Logging:  Archivos: /var/log/globus-gridftp.log y /var/log/messages –Quotas de discos:  Normalmente todas las VOs están en la misma partición  No se colocan quotas por VO  No se tiene información del espacio consumido por cada VO A VO should not “steal” the space assigned to other VOs –Mapeo de usuarios y autentificación –Local Centre Authorization Service (LCAS): Chequea si un usuario esta autorizado o no utilizando la información existente en el /etc/grid-security/grid-mapfile  Local Credential Mapping Service (LCMAPS): Mapea las credenciales del grid con las locales (ejemplo: UNIX uid/gid, AFS tokens, etc.) Utiliza el grid-mapfile  Configuracion: /opt/edg/var/etc/gridftpd_lcas_lcmaps.conf  Logging: /var/log/gridftp-lcas_lcmaps.log

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 24 Configuración - Logs Demonio RFIO RFIO no utiliza el GSi-enabled, la seguridad está basada en uid/gid’s  Requiere que los uid/gid de los usuarios del Grid sean los mismos en los WNs and SEs –Es levantado usualmente al iniciarse la máquina ( /etc/rc.d/rc3.d/S65rfiod )  /usr/local/bin/rfiod –sl (standalone con logging info) corre como root –Configuración  /etc/sysconfig/rfiod  /etc/services contiene los puertos RFIO (“rfio 5001/tcp”, “rfio 5001/udp”) –Logging information: un archivo nuevo diariamente  /var/log/rfiod, /var/log/rfiod.1, /var/log/rfiod.2.gz... Persistencia de Archivos  Los archivos no deben ser borradon aun asi sean viejos...

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 25 GridFTP Problemas de Autentificación –Los usuarios necesitan un proxy valido, registrado en una VO y haber utilizado el grid- proxy-init –Deben tener una entrada correcta en el grid-mapfile (/etc/grid-security/grid-mapfile)  Actualiza cada 6 horas en un minuto aleatorio mediante el cronjob.  Esto requiere que el archivo edg-mkgridmap.conf sea correcto. –Se debe tener una lista actualizada de cada CA de los certificados revocados  Estas son actualizadas utilizando el crontab y bajandose los archivos de un sitio web.  La CA debe actualizar los CRL antes que expiren los certificados. –Los RPMs de las autoridades de certificaci{on deben ser actualizados  Todos los hosts necesitan todos los certificados de todas las CAs que aceptan  Coloque un trabajo en el crontab para actualizar las CAs /opt/lcg/yaim/scripts/install_node lcg-CA

Enabling Grids for E-sciencE Primer Taller Latino Americano de Administradores de Grid 26 GridFTP Depurando errores de autentificación –Cheque el archivo de logs /var/log/messages para obtener los errores de autentificación –Chequee los siguiente  Chequee si el DN del usuario y la VO esten en el grid-mapfile.  Cheque la fecha del archivo CRL (/etc/grid- security/certificates/xxxxxx.r0)  Chequee que el RPM de las CAs este instalado  Puede obtener mas información tratando como usuario de: globus-url-copy -dbg gsiftp:// / file:/tmp/myFile

Primer Taller Latino Americano de Administradores de Grid Preguntas