La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada.

Presentaciones similares


Presentación del tema: "Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada."— Transcripción de la presentación:

1 Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada

2 Introducción 1/13 Julio Lozano Bahilo Objetivo : Automatización de las tareas necesarias para efectuar la generación, simulación y reconstrucción masiva de datos de ATLAS (DC2) empleando los recursos disponibles gracias a la tecnología GRID Optimización del uso de las CPUs y elementos de almacenamiento Estudio exhaustivo en condiciones extremas del middleware y del hardware: estabilidad del sistema, capacidad de almacenamiento, ancho de banda, etc … Arquitectura : Sistema modular lo más simple y flexible posible: 1.Repositorio con trabajos a ejecutar y todo tipo de información acerca de los ficheros de entrada, de salida y de su estado de ejecución

3 Introducción 2/13 Julio Lozano Bahilo 2.Agente que se comunica con dicho repositorio, extrayendo la información precisa para crear los trabajos (jobs) y actualiza la información presente en él 3.Agente que intercambia información con el agente previo y envia los trabajos al GRID; por ello depende del sabor GRID 4.Sistema de acceso uniforme a los datos empleado por el agente que gestiona la ejecución de los trabajos. Transfiere los ficheros de entrada necesarios y copia los archivos producidos a un elemento de almacenamiento

4 Esquema de producción 3/13 Julio Lozano Bahilo LCGNGGrid3LSF LCG exe LCG exe NG exe G3 exe LSF exe prodDB DMS super RLS jabber Lexor Dulcinea Capone Don Quijote Windmill Legacy

5 Base de datos 4/13 Julio Lozano Bahilo ProdDB Servidor Oracle en el CERN : comunicación via queries SQL Consta de diferentes tablas : TASK JOBTRANSLOGICALFILEJOBDEFINITION Colección de trabajos asociados a una misma transformación Transformación : versión del software generación/simulación/reconstrucción tipo de datos Definición abstracta del trabajo, incluyendo todos los parámetros necesarios para su ejecución : transformación, ficheros de entrada y salida, etc … Información sobre los ficheros generados : LFN y GUID de los ficheros de datos y el log Estado de cada intento de ejecución del trabajo e información adicional : supervisor, ejecutor, CE, mensaje de error en caso de fallo JOBEXECUTION

6 Supervisor 5/13 Julio Lozano Bahilo Windmill Tanto el supervisor como el ejecutor son paquetes escritos en Python y corren en un UI ( User Interface ) Funcionalidad del supervisor : Gestionar los trabajos residentes en la base de datos : 1.Extraer su definición y traspasarla al ejecutor en formato XML ( tabla jobdefinition ) 2.Obtener información acerca del estado de los trabajos enviados a GRID a través del ejecutor y actualizar la base de datos ( tablas jobexecution y jobdefinition ) Verificar la correcta finalización de los trabajos accediendo a través de Don Quijote al RLS Un fichero de configuración determina diversos parámetros de operación del supervisor. Alguno de ellos está relacionado con las máquinas empleadas:

7 Supervisor 6/13 Julio Lozano Bahilo servidor jabber Y otros con el tiempo de espera para que el supervisor realice las operaciones pertinentes: petición de nuevos trabajos información de tabajos en espera estado actual de procesos en ejecución información de trabajos finalizados tiempos a optimizar

8 Supervisor 7/13 Julio Lozano Bahilo Windmill numJobsWanted executeJobs getExecutorData getStatus killJob Via de comunicación jabber ejecutores Don Quijote (gestión de datos) Centros GRID 1. lexor 2. dulcinea 3. capone 4. legacy 5. rocinante supervisores Centros GRID Base de datos de producción

9 Supervisor 8/13 Julio Lozano Bahilo Windmill La comunicación con el ejecutor se hace en base a 5 mensajes codificados en XML a través de un servidor jabber : i.numJobsWanted el supervisor pide al ejecutor que haga una estimación del numero de CPUs disponibles en maquinas que cumplen los requisitos apropiados ( versión del software, CPU MHzs, memoria RAM ) ii.executeJobs transmite la definición del trabajo al ejecutor para su posterior envío a un CE iii.getExecutorData obtiene el identificador único de los trabajos enviados a GRID iv.getStatus recibe información acerca del estado del trabajo y si ha acabado, ordena al ejecutor que registre los ficheros de salida v.killJob

10 Ejecutor 9/13 Julio Lozano Bahilo Lexor Al igual que el supervisor, está implementado en Python. Se ejecuta en un UI. Requiere de una credencial para enviar los trabajos y esa credencial se debe guardar en un Proxy Server para que la credencial guardada localmente sea renovada antes de que expire ( WN RB PS ) El ejecutor depende del sabor GRID dado que utiliza el middleware asociado a cada proyecto: LCG-2 ( basado en EDG ) en nuestro caso Funcionalidad del ejecutor : Suministrar información al supervisor : 1.Numero de CPUs disponibles ( contacta BDII ) 2.Estado de los trabajos en ejecución 3.Estado de los trabajos finalizados

11 Ejecutor 10/13 Julio Lozano Bahilo Enviar los trabajos a ejecución : 1.Traducir la descripción del trabajo de XML a JDL 2.Enviar trabajo a RB para ejecución en CE Un fichero de configuración determina las máquinas a utilizar ( RB, BDII, Proxy Server ), el número máximo de trabajos en ejecución y permite restringir los centros donde corren los trabajos El script que se ejecuta en un WN ( Worker Node ) realiza los siguientes pasos: Verifica la instalación del software del experimento Copia el paquete de la transformación a efectuar Copia los ficheros de entrada a través de DQ Ejecuta el programa del experimento para generar/simular/reconstruir los sucesos Copia los ficheros de salida a un SE mediante DQ

12 Ejecutor 11/13 Julio Lozano Bahilo El ejecutor para la infra- estructura GRID de LCG es Lexor. Intercambia mensajes de tipo XML via jabber con el supervisor y envía los trabajos a ejecución XML job description Job Description Language Supervisor Lexor cliente jabber XML parser gestor de trabajos Workload Management System API El ejecutor también recupera la información sobre el estado del trabajo y si acaba correctamente registra los ficheros de salida. Transmite la información al ejecutor via XML igualmente

13 UI jobdefinitionjobexecution Flujo de tareas 12/13 Julio Lozano Bahilo SupervisorEjecutor Serv. jabber numJobsWanted BDII executeJobs RBCE getExecutorDatagetStatus SE RLS DQ ProdDB SQLldap EDG WMS API job wrapper

14 Comentarios 13/13 Julio Lozano Bahilo 1.Ejemplo de empleo de tecnología GRID aplicada a la producción, procesado y almacenado de datos en AA.EE. 2.Se ha sometido la infraestructura GRID ( tanto middleware como hardware y personal humano ) a un continuo esfuerzo para mejorar las prestaciones del sistema 3.Empleo de diferentes tecnologías para implementar un sistema en cuya base tenemos la tecnología GRID 4.GRID está vivo y coleando y va dando frutos visibles


Descargar ppt "Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada."

Presentaciones similares


Anuncios Google