Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada.

Slides:



Advertisements
Presentaciones similares
Código: HOL-SQL29. Permite la encriptación de ficheros de registro y de datos mediante clave de encriptación de datos (Database Encryption Key) Encriptación.
Advertisements

Nau Gran dHivern Intr. a la creación y gestión de páginas web Introducción a la web.
Storage Networking y el almacenamiento sobre internet: iSCSI
Internet y tecnologías web
Arquitectura de Sistema de E/S
Ingeniería de Software II
PRESENTA: Mizrain Cano Chico Profesor: Lic. Albino Petlacalco Ruiz
ADELA TORRES JONATHAN BEJARANO
Servidores Web Capítulo 2.
Supervisión del rendimiento de SQL Server
Proyecto e-CA: Organización Virtual y Testbed Susana Sánchez Expósito José Ruedas Sánchez II Reunión de e-Ciencia Andaluza 16-17, Octubre 2008.
I.T.E.S.R.C. Romina Tamez Andrea Martínez Ma. De Lourdes Solís
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Servicios Web.
Los servicios de red son la fundación de una red de trabajo en un ambiente de computadoras. Generalmente los servicios de red son instalados en uno o.
Bases de Datos Introducción.
Modelo de procesos de dos estados
Compartir Informacion Compartir Hardware y Software
Proyecto de Ingeniería de Software 2010 Producto
Windows XP sp3.
ARIS-G: Software de Monitoreo Geomecánico de Superficies
Gestión de Entrada / Salida
Arquitectura de Software del SIAFI
Introducción a los Conceptos de Bases de Datos Docente: Ing. Marleny Soria Medina.
TEMAS DE ADMINISTRAR LOS RECURSOS DE UNA RED. SEGUNDA EVALUACION.
Implementación y administración de DHCP
UNIDAD 3 Conceptos de Sistemas Operativos.
OMAR SANCHEZ ROBLES HECTOR PEREZ GARCIA. “Sistemas de cómputo compuesto por un gran número de CPU´s conectados mediante una red de alta velocidad”, Tanenbaum.
Servicios Web. Servicios web Son programas con funcionalidad accesible a través de protocolo http que permiten la ejecución remota de métodos y funciones.
Administrar • Crear • Autoservicio • Auditoría • Workflows
Instalación y configuración de servidores. 2 de 9 Servicios Internet (I) “El proyecto Apache es un esfuerzo conjunto para el desarrollo de software orientado.
Contenido: 1- Que es el .Net Framework 2- Arquitectura en .Net
S i C o D Sistema de Colección de Datos. Especificaciones técnicas Lenguaje de programación: Lenguaje de programación: ® Microsoft Visual Basic 6.0. Manejador.
Paulina Guevara UNITA - IBARRA. Lenguaje de programación orientado a objetos y procedural. Un Sistema Gestor de Bases de datos o Database Management System.
Programación I MC José Andrés Vázquez Flores
Ciclo de vida de la administración de servicios de TI
Introducción a los Sistemas Operativos
Un sistema de gestión de bases de datos: Es un conjunto de programas que permite a los usuarios crear y mantener una base de datos. Por tanto, el SGBD.
TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS
Instalación y Configuración Inicial del Sistema
1 Capítulo 21: Interacción Cliente Servidor ICD 327: Redes de Computadores Agustín J. González.
Integrantes: Jorge Herrera M. Carlos Rodríguez R..
Sistema de análisis distribuido de ATLAS (ADA) Farida Fassi / Mª Dolores Jordán IFIC.
FUNCIONALIDAD DE SOFTWARE DE SISTEMAS
CONCEPTOS FUNDAMENTALES DEL NIVEL DEL SISTEMA OPERATIVO
Supongamos que un usuario desea escribir un informe e imprimirlo en una impresora conectada. Para realizar esta tarea, se precisa una aplicación de procesamiento.
Definición y concepto Un sistema distribuido es aquel en el que dos o más máquinas colaboran para la obtención de un resultado. En todo sistema distribuido.
“condición que necesita el usuario para resolver un problema o conseguir un objetivo determinado”. Los requisitos de un sistema son los aspectos que el.
1 GESTIÓN DE UTILIZACIÓN DE REDES Noviembre 2013 Herramienta de Monitoreo Pandora FMS David González.
Nombre: Germania Ruiz UNIVERSIDAD TECNOLOGICA AMERICA.
UNIVERSIDAD LATINA III. MANTENIMIENTO Y GESTIÓN DE LA INFORMACIÓN DE UNA BASE DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
GESTIÓN DE REDES - INTRODUCCIÓN
FUNCIONAMIENTO INTERNO DEL ORDENADOR
MARIANA PRECIADO VILLA TELECOMUNICACIONES 11º3
Roles de Open UP.
LIA. SUEI CHONG SOL, MCE..  1.- SOFTWARE BÁSICO O DE SISTEMA. Conjunto de programas imprescindibles para el funcionamiento del sistema.  2.- SOTWARE.
Introducción al proceso de verificación y validación.
ESCULA NORMAL “PROFR. DARÍO RODRÍGUEZ CRUZ” LIC
BASE DE DATOS DISTRIBUIDAS
Elementos y tipos de sistemas operativos
SISTEMAS OPERATIVOS Son un conjunto de programas destinados a permitir la comunicación entre el usuario y en computador y gestionar sus recursos.
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
Integrantes Miguel Betancourt Alexis Tacuri.  Activiti es una plataforma para la formación de flujos de trabajo y procesos empresariales dentro del.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks The gLite Information System Virginia Martín-Rubio.
GeoBuilder Fernando Alonso-Pastor Es un gestor de geoprocesos que facilita la realización de múltiples operaciones que deben ejecutarse simultánea.
Entregables del Proyecto
P ROCESO DE E NSAMBLADO Cámara Vázquez Berenice Rubí.
Transcripción de la presentación:

Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada

Introducción 1/13 Julio Lozano Bahilo Objetivo : Automatización de las tareas necesarias para efectuar la generación, simulación y reconstrucción masiva de datos de ATLAS (DC2) empleando los recursos disponibles gracias a la tecnología GRID Optimización del uso de las CPUs y elementos de almacenamiento Estudio exhaustivo en condiciones extremas del middleware y del hardware: estabilidad del sistema, capacidad de almacenamiento, ancho de banda, etc … Arquitectura : Sistema modular lo más simple y flexible posible: 1.Repositorio con trabajos a ejecutar y todo tipo de información acerca de los ficheros de entrada, de salida y de su estado de ejecución

Introducción 2/13 Julio Lozano Bahilo 2.Agente que se comunica con dicho repositorio, extrayendo la información precisa para crear los trabajos (jobs) y actualiza la información presente en él 3.Agente que intercambia información con el agente previo y envia los trabajos al GRID; por ello depende del sabor GRID 4.Sistema de acceso uniforme a los datos empleado por el agente que gestiona la ejecución de los trabajos. Transfiere los ficheros de entrada necesarios y copia los archivos producidos a un elemento de almacenamiento

Esquema de producción 3/13 Julio Lozano Bahilo LCGNGGrid3LSF LCG exe LCG exe NG exe G3 exe LSF exe prodDB DMS super RLS jabber Lexor Dulcinea Capone Don Quijote Windmill Legacy

Base de datos 4/13 Julio Lozano Bahilo ProdDB Servidor Oracle en el CERN : comunicación via queries SQL Consta de diferentes tablas : TASK JOBTRANSLOGICALFILEJOBDEFINITION Colección de trabajos asociados a una misma transformación Transformación : versión del software generación/simulación/reconstrucción tipo de datos Definición abstracta del trabajo, incluyendo todos los parámetros necesarios para su ejecución : transformación, ficheros de entrada y salida, etc … Información sobre los ficheros generados : LFN y GUID de los ficheros de datos y el log Estado de cada intento de ejecución del trabajo e información adicional : supervisor, ejecutor, CE, mensaje de error en caso de fallo JOBEXECUTION

Supervisor 5/13 Julio Lozano Bahilo Windmill Tanto el supervisor como el ejecutor son paquetes escritos en Python y corren en un UI ( User Interface ) Funcionalidad del supervisor : Gestionar los trabajos residentes en la base de datos : 1.Extraer su definición y traspasarla al ejecutor en formato XML ( tabla jobdefinition ) 2.Obtener información acerca del estado de los trabajos enviados a GRID a través del ejecutor y actualizar la base de datos ( tablas jobexecution y jobdefinition ) Verificar la correcta finalización de los trabajos accediendo a través de Don Quijote al RLS Un fichero de configuración determina diversos parámetros de operación del supervisor. Alguno de ellos está relacionado con las máquinas empleadas:

Supervisor 6/13 Julio Lozano Bahilo servidor jabber Y otros con el tiempo de espera para que el supervisor realice las operaciones pertinentes: petición de nuevos trabajos información de tabajos en espera estado actual de procesos en ejecución información de trabajos finalizados tiempos a optimizar

Supervisor 7/13 Julio Lozano Bahilo Windmill numJobsWanted executeJobs getExecutorData getStatus killJob Via de comunicación jabber ejecutores Don Quijote (gestión de datos) Centros GRID 1. lexor 2. dulcinea 3. capone 4. legacy 5. rocinante supervisores Centros GRID Base de datos de producción

Supervisor 8/13 Julio Lozano Bahilo Windmill La comunicación con el ejecutor se hace en base a 5 mensajes codificados en XML a través de un servidor jabber : i.numJobsWanted el supervisor pide al ejecutor que haga una estimación del numero de CPUs disponibles en maquinas que cumplen los requisitos apropiados ( versión del software, CPU MHzs, memoria RAM ) ii.executeJobs transmite la definición del trabajo al ejecutor para su posterior envío a un CE iii.getExecutorData obtiene el identificador único de los trabajos enviados a GRID iv.getStatus recibe información acerca del estado del trabajo y si ha acabado, ordena al ejecutor que registre los ficheros de salida v.killJob

Ejecutor 9/13 Julio Lozano Bahilo Lexor Al igual que el supervisor, está implementado en Python. Se ejecuta en un UI. Requiere de una credencial para enviar los trabajos y esa credencial se debe guardar en un Proxy Server para que la credencial guardada localmente sea renovada antes de que expire ( WN RB PS ) El ejecutor depende del sabor GRID dado que utiliza el middleware asociado a cada proyecto: LCG-2 ( basado en EDG ) en nuestro caso Funcionalidad del ejecutor : Suministrar información al supervisor : 1.Numero de CPUs disponibles ( contacta BDII ) 2.Estado de los trabajos en ejecución 3.Estado de los trabajos finalizados

Ejecutor 10/13 Julio Lozano Bahilo Enviar los trabajos a ejecución : 1.Traducir la descripción del trabajo de XML a JDL 2.Enviar trabajo a RB para ejecución en CE Un fichero de configuración determina las máquinas a utilizar ( RB, BDII, Proxy Server ), el número máximo de trabajos en ejecución y permite restringir los centros donde corren los trabajos El script que se ejecuta en un WN ( Worker Node ) realiza los siguientes pasos: Verifica la instalación del software del experimento Copia el paquete de la transformación a efectuar Copia los ficheros de entrada a través de DQ Ejecuta el programa del experimento para generar/simular/reconstruir los sucesos Copia los ficheros de salida a un SE mediante DQ

Ejecutor 11/13 Julio Lozano Bahilo El ejecutor para la infra- estructura GRID de LCG es Lexor. Intercambia mensajes de tipo XML via jabber con el supervisor y envía los trabajos a ejecución XML job description Job Description Language Supervisor Lexor cliente jabber XML parser gestor de trabajos Workload Management System API El ejecutor también recupera la información sobre el estado del trabajo y si acaba correctamente registra los ficheros de salida. Transmite la información al ejecutor via XML igualmente

UI jobdefinitionjobexecution Flujo de tareas 12/13 Julio Lozano Bahilo SupervisorEjecutor Serv. jabber numJobsWanted BDII executeJobs RBCE getExecutorDatagetStatus SE RLS DQ ProdDB SQLldap EDG WMS API job wrapper

Comentarios 13/13 Julio Lozano Bahilo 1.Ejemplo de empleo de tecnología GRID aplicada a la producción, procesado y almacenado de datos en AA.EE. 2.Se ha sometido la infraestructura GRID ( tanto middleware como hardware y personal humano ) a un continuo esfuerzo para mejorar las prestaciones del sistema 3.Empleo de diferentes tecnologías para implementar un sistema en cuya base tenemos la tecnología GRID 4.GRID está vivo y coleando y va dando frutos visibles