Infraestructuras de Accounting en EGEE. sumario presentación Descripción general del CESGA Cálculo INTENSIVO Almacenamiento Accounting en el Cesga Accounting.

Slides:



Advertisements
Presentaciones similares
Grid Computing Rogelio Ferreira Escutia. 2 Computación Grid, febrero 2010 Definición La computación grid.
Advertisements

Alfredo Arnulfo (COMSAT International) Presidente
Gate y la experiencia Cubana E-infrastructure shared between Europe and Latin America Henry Ricardo Mora CUBAENERGIA –- CUBA Foro sobre.
gLite Sistema de Información
Tutorial EELA para usuarios E-infrastructure shared between Europe and Latin America Prácticas Sistema de Información Eduardo Murrieta.
Internet y tecnologías web
Proceso Certificación y Manejo de Datos en EGEE Gonzalo Merino PIC/IFAE XVIII Grupos de Trabajo de RedIRIS Sesión: EGEE-IrisGRID Toledo 25-Oct
Microsoft Office Sharepoint Server Business Intelligence Rubén Alonso Cebrián Código: HOL-SPS07.
Caso de Éxito: Portal de GIAHSA
Arquitectura Avanzada
© 2005 – RNP Proyecto EELA – Computación en grid 2 a Reunión Técnica Conjunta de CLARA y el Proyecto ALICE Vera Cruz, Abril 2005 Michael Stanton Comisión.
1 Un Panorama de las finanzas públicas Ricardo Martner Area de Políticas Presupuestarias y Gestión Pública ILPES, CEPAL, Naciones Unidas IV Curso Internacional.
Aplicación de la tecnología Grid: Portal de recursos de supercomputación José Ruedas Sánchez Instituto de Astrofísica de Andalucía Consejo Superior de.
Proyecto e-CA: Organización Virtual y Testbed Susana Sánchez Expósito José Ruedas Sánchez II Reunión de e-Ciencia Andaluza 16-17, Octubre 2008.
Computación en la Universitat de les Illes Balears
Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada.
Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano de Ciencias Sociales.
CONCEPTES AVANÇATS DE SISTEMES OPERATIUS Departament dArquitectura de Computadors (Seminaris de CASO) Autors P2P and Promise of Internet Equality JOSE.
Stuart Pérez A12729.
Sistemas Operativos Distribuidos Plataforma Cliente/Servidor
Ordenadamente crece tu negocio Actualmente es una prioridad mantener ordenada tu empresa para controlar tus procesos y ser eficiente, por lo que se hace.
Patricia Muñoz Palma Directora Programa de Información Científica
IDES - 20 de Noviembre Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano.
Indicadores de Gestión en la Administración Pública Alfonso RAMIREZ Gerente de Comercial Software Libre Andino Diego M.
ESCUELA POLITÉCNICA DE LAS FUERZAS ARMADAS - ESPE
MEMORIA 1.
Janny David Vilac Salazar David Alejandro Gallo Moya
Plataforma Digital de Revistas Científicas Españolas y Latinoamericanas Elena Fernández Centro de Información y Documentación Científica. CINDOC-CSIC.
Integración de VOs y middleware para EGEE
Denisse Cayetano – Christian Rivadeneira
MICROSOFT EXCHANGE PRESENTADO POR: LEONARDO GONGORA HERRERA PRESENTADO A: INGENIERO FABIO Andrés Lasso PARQUE INFORMATICO CARLOS ALBAN TECNICO LABORAR.
Telefónica España Grandes Clientes ICT Competence Center Cloud Computing VII Reunión Foro Técnico en Informática de la Salud Octubre 2010.
Santiago de Compostela, SPAIN, 2007 Diseño y Mejora de Sistemas de Refrigeración de Centros de Procesamiento de Datos Andrés Gómez
Índice Introducción Big Data Arquitectura HDFS
Red Académica i2basque HPC Josu Aramberri Iñaki Serna II Workshop.
X6: la sexta generación de Tecnología EXA Isabel Zárate Directora de x86 y Pure Systems IBM Rápido, Flexible, Fiable, para cargas de trabajo emergentes.
Curso de Computación Científica en Clusters
Soporte de Usuarios del CrossGrid: HelpHesk Curso Grids y e-Ciencia, Junio 2004 Santander, España Farida Fassi IFIC.
1 Análisis Distribuido & User Support Farida Fassi IFIC (Instituto de Física Corpuscular) CSIC-Universitat de València III REUNIÓN ATLAS TIER-2 Federado,
© Siemens AG All right reserved. Primeros pasos hacia una red eléctrica inteligente - Smart Metering Congreso INGENIERIA ARGENTINA 2014 Ing. Fabián.
COMPUTACION Jaca Las TIC Las Tecnologías de la Información y de las Comunicaciones (TIC) son una realidad presentes en la mayoría de los ámbitos.
Grids. Cluster High-availability (HA) Clusters (Linux HA) Load-balancing Clusters (Platform LSF HPC, Sun Grid En gine, Moab Cluster Suite and Maui Cluster.
Producido por con el apoyo de Definición DISEÑO WEB Es la creación de sitios en internet gráficamente atractivos y funcionales que mediante un manejo.
¿QUE NO ES? COMPUTADORES EN LAS NUBES Es un paradigma que permite ofrecer servicios de computación a través de Internet. Los usuarios puedan acceder.
Spanish Teachers Programme CERN, 27 de julio de 2007 Informática Cientifica Miguel Angel Marquina 1 where the Web was born GRID e Informática Científica:
Cloud Computing. ¿Qué es Cloud Computing? Definiciones Refers to the bigger picture…basically the broad concept of using the internet to allow people.
14 de diciembre de 2005 Universidad de Murcia1 Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de.
© FCSCCYL. Dirección Científica (2008) PRESENTACIÓN DEL CENTRO DE SUPERCOMPUTACIÓN DE CASTILLA Y LEÓN Parque Tecnológico de León 11 de Noviembre de 2008.
Curso de Postgrado ‘GRIDS y e-Ciencia’ ” UTILIZACION DE UNA INFRAESTRUCTURA GRID” J. Salt Grupo de GRID Computing del IFIC IFCA, Santander; de Junio.
© FCSCCYL. Dirección Científica (2008) PRESENTACIÓN DEL CENTRO DE SUPERCOMPUTACIÓN DE CASTILLA Y LEÓN Parque Tecnológico de León 11 de Noviembre de 2008.
ASOPROJECT Componentes del grupo: - Alberto Díaz Gil - Miguel Ángel Llorente Gracía - Javier E. Yépez Hualde.
Informe de Materia de Graduación “Uso de la plataforma Pig sobre Hadoop como alternativa a una RDBMS para el análisis de datos masivos. Prueba de concepto.
Agenda  Introducción  Relevamientos de tecnologías Objetivos de la fase de relevamiento de tecnologías Principales tecnologías disponibles -OpenMosix,
Departamento de Informática Universidad de Rancagua
PROYECTO E-IMRT CESGA - UVIGO – USC – CHUS - UCM Andres Gomez CESGA
1 GESTIÓN DE UTILIZACIÓN DE REDES Noviembre 2013 Herramienta de Monitoreo Pandora FMS David González.
COMUNIDAD SHAREPOINT DE COLOMBIA. Sharepoint & Azure … juntos mejor !!!
18/02/2016Diego Alberto Rincón Yáñez, Pontificia Universidad Javeriana, 1.
Las entidades Locales, la innovación y los servicios ‘cloud’ y los servicios ‘cloud’ Josep Clotet Sopeña Gerente del Consorcio del Parque Científico y.
Actualización del Superordenador Virtual Gallego Valencia, 12 Abril Carlos Fernández Sánchez Responsable Técnico de Sistemas
HPC 2005 VIGO Juan Villasuso Barreiro
Santiago de Compostela, SPAIN, 2008 Diseño y Mejora de Sistemas de Refrigeración de Centros de Procesamiento de Datos Ignacio López
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks The gLite Information System Virginia Martín-Rubio.
Análisis de datos del detector ATLAS utilizando el Grid: Modelo de Análisis Distribuido en ATLAS S. González de la Hoz IFIC – Institut de Física Corpuscular.
Modo de uso dos Servidores de Cálculo e Almacenamento Dispoñibles no Cesga Dr. Carlos Fernández Sánchez Responsable Técnico de Sistemas
ALICE GRID en México 19 de junio de 2007 Autores: Luciano Diaz, Lukas Nellen, Pedro Podesta Co-autores: Patricia Méndez, Kitzia Lubreras, Hans Reyes, Latchezar.
¿Cómo hacer uso de los recursos del cesga? José Ignacio López Cabido Subdirector Técnico
misión Promover servicios comunes de apoyo a la investigación, desarrollo en innovación en el ámbito de las tecnologías de la información y de las comunicaciones,
Information System Virginia Martín-Rubio Pascual
The gLite Information System
Transcripción de la presentación:

Infraestructuras de Accounting en EGEE

sumario presentación Descripción general del CESGA Cálculo INTENSIVO Almacenamiento Accounting en el Cesga Accounting en EGEE

misión Promover servicios comunes de apoyo a la investigación, desarrollo en innovación en el ámbito de las tecnologías de la información y de las comunicaciones, en Galicia y en la comunidad investigadora del CSIC. Promover acciones tendentes a la innovación y a la mejora en la prestación de servicios de cálculo intensivo y comunicaciones avanzadas, asi como actividades encaminadas a promover soluciones innovadoras en el mundo de la Sociedad del Conocimiento

personalidad jurídica Fundación Pública Empresa Pública Xunta de Galicia 70% CSIC 30% socios y patronatos

Universidades gallegas Centros de investigación de la Xunta de Galicia Centros y laboratorios del CSIC Departamentos de I+D de empresas Centros de investigación europeos Otras instituciones (centros tecnológicos, hospitales, fundaciones,...) usuarios

11 años de historia: el cálculo intensivo 1993 VP ,5 GFLOPS 1998 VPP 300 AP ,1 GFLOPS 12 GFLOPS 1999 HPC 4500 STORAGETEK 9,6 GFLOPS 2003 SUPERDOME 768 GFLOPS 2001 SVG 9,9 GFLOPS 2002 HPC 320 BEOWULF 64 GFLOPS16 GFLOPS 51 TERABYTES 2004 SVG 512 GFLOPS

Cluster DELL NUEVO SERVIDOR DE CÁLCULO Throughput procesadores 1MB cache, 1 GB memoria, 160GB disco Interconexión Gigabit, Total 512GFlops pico, 80GB memoria, 12TB disco

infraestructura: almacenamiento

evolución de la capacidad de cálculo instalada en el cesga

evolución del consumo de horas de cpu en cesga

utilización de los recursos de cálculo

Qué se usa (Sistemas, nodos, software, etc...) Cómo se usa Quién lo usa Cuál es el comportamiento? Tiempos de espera en cola, niveles de disponibilidad, calidad esperada!, etc... Cerrar el lazo con los SLA. Ejemplos: si un usuario/institución está saturando las colas, penalizar (menos prioridad). Determinación de la eficiencia de las políticas de distribución de trabajos, etc... Hacer un coste realista del consumo (no es suficiente el número de horas consumidas, sino el número de horas en qué arquitectura, y no sólo el procesador, sino tener en cuenta también la memoria, sistema de E/S, etc...) Necesidad de acounting

Información proveniente de: Base de datos de usuarios (login, departamento, proyecto, etc...) Ficheros logs de sistemas de colas (actualmente LSF, PBS, SGE) Consumo de los sistemas (ficheros acct) Monitorizacion del los sistemas (ficheros sa) Generamos base de datos (MySQL) de consumos/trabajos Scripts de consulta en PHP Consultas web Arquitectura de acounting en el cesga

Distribución por instituciones

Tiempo medio de espera en cola

Porcentaje de ocupación Servidor de cálculo HPC320, año 2003

Número de procesadores solicitados (jan-aug )

Memoria solicitada (jan-aug )

Tiempo solicitado (jan-aug )

Espacio en disco solicitado (jan-aug )

Accounting Computing Element Storage Element Resource metering: getting info about resource usage Resource metering: getting info about resource usage Arquitectura de accounting

Accounting Computing Element Storage Element Reports about resource usage per user / VO/ resource Arquitectura de accounting

Accounting Computing Element Storage Element Resource pricing Resource owner Arquitectura de accounting

Accounting Computing Element Storage Element Resource pricing Resource owner Cost computation Arquitectura de accounting

Desarrollado para el GOC en el RAL John Gordon y Dave Kant CCLRC e-Science Centre, UK EGEE JRA1 IT-CZ cluster homepage wm EGEE JRA1 (middleware activity) homepage Quién

Dos partes diferenciadas: La infraestructura de recogida y tratamiento de la información de accounting basada en R-GMA y que concentra todos los datos en un punto central Un portal web para permitir la visualización de distintos tipos de informes en funcion de las demandas Basado en R-GMA, cada site debe instalar un nodo local R-GMA MON para almacenar la información de accounting Soporta PBS (lcgpbs, pbspro, Vanilla pbs, openpbs, torque) y BQS. Trabajando en soportar LSF. CESGA tratará de integrar SGE Se deben almacenar los logs de batch, gatekeeper y mensajes del sistema Se asume que el ID del grupo utilizado para ejecutar los trabajos del usuario es el nombre de la VO (pendiente de confirmar) Asume que el cluster es homogéneo. Páginas web de accounting en el GOC están siendo desarrolladas: Estará incluído en el próximo SLC3 Arquitectura de accounting

La información se obtiene de 3 logs: Gatekeeper Records contain DN, GramScriptJobID and the manager type (lcgpbs, fork, lcglsf). Gatekeeper logs are used to distinguish jobs that are submitted through the grid (grid jobs) from jobs submitted locally (non- grid jobs) on the fabric. Messages logs contain mappings between GramScriptJobID and LocalJobID of Batch System. Batch Logs do not distinguish between grid jobs and non-grid jobs. Batch Logs: E (PBS) or JOB_FIINISH (LSF) and LocalJobID, LocalUser, LocalGroup, StartTime, StopTime, ExecutingHost, CPUTime, MemoryUsage, Exit Status, … Arquitectura de accounting

Batch Log GK Log messages filter CE Site GIIS LCG SITE Data Sources MON RGMARGMA GOC Site MON RAW Accounting Data Data Aggregation per VO per ROC Accounting Service On Demand Reports Arquitectura de accounting

BaseCpuSeconds agregados en EGEE Cada Site, por VO, por Mes Interface para elegir la visualización de los datos: VO, ventana temporal y Region Cada Region, por VO, por Mes Otras Distribuciones CPU Normalizada Nº de trabajos Arquitectura de accounting

Dar soporte a la federación Portar a otros sistemas de colas Clusters heterogéneos Otras plataformas Accounting de sistema Accounting de almacenamiento Integración con políticas SLA Colaborar en el desarrollo Actividad prevista en el Cesga en accounting

Carlos Fernández, Gracias!!