La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tutorial EELA para usuarios E-infrastructure shared between Europe and Latin America gLite Arquitectura del WMS Henry Ricardo Mora CUBAENERGIA- Cuba Tutorial.

Presentaciones similares


Presentación del tema: "Tutorial EELA para usuarios E-infrastructure shared between Europe and Latin America gLite Arquitectura del WMS Henry Ricardo Mora CUBAENERGIA- Cuba Tutorial."— Transcripción de la presentación:

1 Tutorial EELA para usuarios E-infrastructure shared between Europe and Latin America gLite Arquitectura del WMS Henry Ricardo Mora CUBAENERGIA- Cuba Tutorial EELA para usuarios Guatemala, 18-19 Octubre 2007

2 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 2 Visión de la arquitectura del WMS - Componentes - Funciones Panorámica del Lenguaje de descripción de trabajo (Job Description Language) - Atributos principales Temas a tratar

3 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 3 El Sistema de gestión de la carga de trabajo Workload Management SystemEl Sistema de gestión de la carga de trabajo Workload Management System (WMS) está conformado por un conjunto de componentes del Middleware de la GRID. Su función es aceptar las solicitudes para el envío de tareas por parte de los usuarios, así como realizar el manejo y tomar las acciones apropiadas para satisfacer estas solicitudes. Propósitos del WMS La interacción de los usuarios con el sistema se limita a la descripción de las características y requerimientos de las tareas que serán enviadas utilizando el lenguaje de descripción del trabajo (JDL), así como su envío y seguimiento.

4 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 4 Componentes WMS Los componentes que encargan del manejo del trabajo son: Wmproxy/Network Server Workload Manager Resource Broker Job Controler CondorC/DagMan Logging & Bookeeping Log Monitor

5 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 5 Descripción de los componentes El Network Server (NS) es un demonio genérico de red que proporciona soporte para el control de las funcionalidades de los trabajos. Es responsable de aceptar las solicitudes de los trabajos que llegan de la UI (ej. job submission, job removal), los evalúa y si resultan validos se envían al Workload Manager. El Workload Manager Proxy (WMProxy) es un servicio que provee acceso a las funcionalidades del WMS a través de interfaces basadas en servicios Web. Además suministra posibilidades adicionales como el envió en paquetes y el soporte para Sandboxes compartidos y comprimidos.

6 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 6 El Workload Manager El WM constituye el componente núcleo de WMS y su propósito es aceptar y satisfacer solicitudes de envío de tareas provenientes de los clientes. Para satisfacer estas necesidades necesita de otros componentes, los cuales son específicos para las diferentes solicitudes que se realizan. – La solicitud de envío de una tarea significa delegar la responsabilidad de la ejecución de la misma al WM. El WM a su vez pasará la tarea hacia un CE adecuado parar su ejecución, teniendo en cuenta los requerimientos necesarios y las preferencias establecidas matchmakingLa decisión acerca de que recurso debe ser utilizado es la salida del proceso denominado matchmaking.

7 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 7 Resource Broker El Resource Broker (RB) o Matchmaker ayuda al WM para la toma de decisiones. Por ejemplo: Encontrar el mejor recurso que mejor se adapta al JDL.

8 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 8 El WM puede adoptar dos politicas de planificación: – eager scheduling (push model) El trabajo es ligado a un recurso tan ponto como sea posible. Una vez que se ha tomado esta desicion el trabajo es enviado al recurso para su ejecución. – lazy scheduling (pull model) El trabajo es retenido por el WM hasta que aparece un recurso disponible. Cuando esto sucede se machea con eltrabajo enviado. WMS políticas de planificación

9 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 9 El ISM representa una de las mejoras mas notables en el WM y consiste en un reposiorio de información que esta disponible en un modo de solo lectura para el proceso de matchmaking. Este componente es el que permite la implementación de las políticas de planificación de las tareas. Supermercado de Información (ISM)

10 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 10 La cola de tareas (Task Queue) representa la segunda mejora mas notable en el diseño interno del WM – Posibilita mantener una solicitud de envío por un tiempo si no hay ningún recurso disponible inmediatamente que pueda encargarse de la realización del trabajo Solicitudes Non-matching se reintentan periódicamente Utilizando eager scheduling, O tan pronto como se reciba una notificación de recurso disponible en el ISM (Aproximación lazy scheduling) La cola de tareas

11 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 11 Adaptador de trabajo (Job Adapter (JA)) – Es el responsable de: Realizarle los toque finales a la expresión JDL de un trabajo, antes de que pase por el CondorC para su envío. Crear el job wrapper script, que a su vez crea un apropiado ambiente de ejecución en el nodo de trabajo del CE tranferencia del input y del output sandboxes CondorC – Responsable de Realizar las operaciones de manejo del trabajo job submission, job removal DAGMan – meta-scheduler Propósito de navegar el esquema Determinar cuales nodos están libres de dependencias Seguir la ejecución de los trabajos correspondientes JA, CondorC, DAGMan

12 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 12 Monitor de Logeo (Log Monitor (LM)) – Es responsable de: Observar el fichero log del CondorC Interceptar eventos interesantes relacionados con los trabajos activos Servicio de Renovación del proxy (Proxy Renewal Service) – Es responsable de asegurar que: exista durante toda la vida del trabajo un proxy del usuario valido dentro del WMS Contactar al servidor MyProxy Server para la renovación de las credenciales de los usuarios Logeo y contabilidad (Logging & Bookkeeping (LB)) – Es responsable de: Almacenamiento de eventos generados por varios de los componentes del WMS Entregar al usuario la información acerca del estado del trabajo Log Monitor, Proxy Renewal Servise, LB

13 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 13 WMS Solicitud de gestión de trabajo (envio, cancelación) expresado via a Job Description Language (JDL) Encuentra un CE apropiado Para cada solicitud de envío, teniendo e cuenta Solicitudes de tareas, preferencias, Grid status, políticas de utilización de recursos Mantiene las solicitudes de envio Las solicitudes se conservan por un tiempo por un tiempo Si no existe un recurso disponible inmediatamente disponible inmediatamente Repositorio de la información de los recursos disponible para el matchmaker Actualizado via notificaciones Y/O encuestas Activas sobre los recursos Ejecuta el envió de trabajos y el monitoreo

14 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 14 Flujo de Trabajo FLUJO DE TRABAJO En esta sección se explica que sucede cuando un usuario envía un trabajo a la GRID

15 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 15 Flujo de trabajo Submitted Aborted Cleared El usuario envía en trabajo a través de la Interfaz de usuario

16 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 16 Flujo de trabajo Submitted Waiting Done (Canceled) Aborted Cleared El RB busca el mejor CE disponible para realizar el trabajo. Se consultan el BDII y el Catálogo

17 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 17 Flujo de trabajo Submitted Waiting Done (Canceled) Aborted Cleared Ready El JA prepara el trabajo para su envió

18 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 18 Flujo de trabajo Submitted Waiting Scheduled Done (Canceled) Done (Failed) Aborted Cleared Ready El CE recibe la solicitud y envía el trabajo al LRMS para su ejecución (permanece en la cola)

19 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 19 Flujo de trabajo Submitted Waiting Scheduled Running Done (0k) Done (Canceled) Done (Failed) Aborted Cleared Ready El trabajo se comienza a ejecutar en los WN, el LRMS se encarga de su control.

20 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 20 Flujo de trabajo Submitted Waiting Scheduled Running Done (0k) Done (Canceled) Done (Failed) Aborted Cleared Ready El trabajo termina

21 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 21 Flujo de trabajo Submitted Waiting Scheduled Running Done (0k) Done (Canceled) Done (Failed) Aborted Cleared Ready El usuario recupera la salida del trabajo

22 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 22 Lenguaje de Descripción de trabajo Job Description Language

23 E-infrastructure shared between Europe and Latin America El JDL se usa en gLite para especificar las características del trabajo y sus restricciones, las cuales seran usadas durante el proceso match-making de match-making para seleccionar los mejores recursos para la ejecución del trabajo. El JDL se usa en gLite para especificar las características del trabajo y sus restricciones, las cuales seran usadas durante el proceso match-making de match-making para seleccionar los mejores recursos para la ejecución del trabajo. Lenguaje de descripción de trabajo Job Description Language (JDL) El Lenguaje de Descripción de trabajo Job Description Language (JDL) se utiliza para describir los trabajos que son ejecutados en la GRID. CLASSified Advertisement language (ClassAd) El JDL adoptado dentro del gLite middleware se basa en Condors CLASSified Advertisement language (ClassAd). Un ClassAd es una estructura similar a un record compuesto de un numero finito de atributos separados por (;) El ClassAd es altamente flexible y puede ser usado para representar servicios arbitrarios.

24 E-infrastructure shared between Europe and Latin America JDL La sintaxis JDL consiste en declaraciones como: Attribute = value; # Los comentarios tienen que estar precedidos por el caracter ( # ) o seguir la sintaxis el C++ Lenguaje de descripción de trabajo Atención: El JDL es sensible a los espacios y al tabulador. Por lo que no se deben encontrar estos tipos de caracteres luego del punto y como al final de la línea

25 E-infrastructure shared between Europe and Latin America Executable = test.sh; StdOutput = std.out; StdError = std.err; InputSandbox = {test.sh}; OutputSandbox = {std.out,std.err}; Executable = test.sh; StdOutput = std.out; StdError = std.err; InputSandbox = {test.sh}; OutputSandbox = {std.out,std.err}; Lenguaje de descripción de trabajo En un JDL, algunos atributos son obligatorios mientras que otros son opcionales. Un JDL elemental es el siguiente: Si se necesita argumentos para los ejecutables se pueden pasar de esta forma Arguments = Hello World!;

26 E-infrastructure shared between Europe and Latin America Si el argumento contiene una cadena entre comillas, las comillas deben ser escapadas con un backslash e.g. Arguments = \Hello World!\ 10; Caracteres especiales tales como &, |, >, < se permiten solo si se especifica dentro de una cadena entre comillas o precedido por triple \ (e.g. Arguments = "-f file1\\\&file2";) Lenguaje de descripción de trabajo

27 E-infrastructure shared between Europe and Latin America JDL: Atributos Relevantes Tipo de Trabajo (JobType Tipo de Trabajo (JobType (optional)) Normal (simple, tarea secuencial), Interactive, MPICH, Checkpointable, Partitionable, Parametric O combinaciones de ellos Checkpointable, Interactive Checkpointable, MPI JobType = Interactive; E.j. JobType = Interactive; JobType = {Interactive,Checkpointable}; JobType = {Interactive,Checkpointable}; Interactive + MPI no permitido aún

28 E-infrastructure shared between Europe and Latin America Ejecutable Ejecutable (obligatorio) Este es una cadena representando el ejecutable/nombre del comando. El usuario puede especificar un ejecutable que se encuentre en el CE remoto Executable = {/opt/EGEODE/GCT/egeode.sh}; El usuario puede suministrar el nombre del ejecutable local, el cual puede ser llevado desde la UI hacia el WN. Executable = {egeode.sh}; InputSandbox = {/home/larocca/egeode/ InputSandbox = {/home/larocca/egeode/egeode.sh}; JDL: Atributos Relevantes (cont.)

29 E-infrastructure shared between Europe and Latin America Argumentos (Arguments Argumentos (Arguments) (opcional) Esta es una cadena que contiene todos los argumentos de la línea de comandos del trabajo. Ej.: Si su ejecutable tiene que comenzar como: $ sum N1 N2 –out result.out Executable = sum; Executable = sum; Arguments = N1 N2 –out result.out; Arguments = N1 N2 –out result.out; JDL: Atributos Relevantes (cont.)

30 E-infrastructure shared between Europe and Latin America Entorno (Environment Entorno (Environment (opcional)) Lista de las características del entorno para que el trabajo corra sin dificultades Environment = {JAVA_HOME=/usr/java/j2sdk1.4.2_08}; Ej. Environment = {JAVA_HOME=/usr/java/j2sdk1.4.2_08}; InputSandbox InputSandbox (opcional) Lista de archivos en el disco de la UI local necesarios para ejecutar el trabajo. Los ficheros listados serán automáticamente enviados hacia el recurso remoto. InputSandbox ={myscript.sh,/tmp/cc,sh}; Ej. InputSandbox ={myscript.sh,/tmp/cc,sh}; JDL: Atributos Relevantes (cont.)

31 E-infrastructure shared between Europe and Latin America OutputSandbox OutputSandbox (optional) Lista de archivos, generados por el trabajo, los cuales tienen que ser recuperados del CE OutputSandbox ={ std.out,std.err, Ej. OutputSandbox ={ std.out,std.err, image.png}; image.png}; JDL: Atributos Relevantes (cont.)

32 E-infrastructure shared between Europe and Latin America Requerimientos (Requirements Requerimientos (Requirements (optional)) Requerimientos del trabajo en los recursos de computo Uso específico de atributos e recursos publicados en el servicio de información Si no se especifican, se asumen los valores por defecto definidos en la configuración del UI Requirements = other.GlueCEStateStatus == "Production; Default. Requirements = other.GlueCEStateStatus == "Production; Requirements=other.GlueCEUniqueID == adc006.cern.ch:2119/jobmanager-pbs-infinite Requirements=Member(ALICE-3.07.01, other.GlueHostApplicationSoftwareRunTimeEnvironment); JDL: Atributos Relevantes (cont.)

33 E-infrastructure shared between Europe and Latin America Rango (Rank Rango (Rank (optional)) Expresión de punto flotante usado para determinar el rango de los CEs que cumplen con los requisitos de la expresión. La expresión del rango puede contener atributos que describen la CE en el Sistema de información (IS). La evaluación de la expresión del rango se realiza por el WMS durante el proceso de match-making. Un valor numérico mayor representa un mejor rango. Si no se especifica, se utilizan valores por defecto definidos en la configuración de la UI. Rank = - other.GlueCEStateFreeCPUs; Default: Rank = - other.GlueCEStateFreeCPUs; JDL: Atributos Relevantes (cont.)

34 E-infrastructure shared between Europe and Latin America InputData InputData (opcional) Esto es una cadena o lista de cadenas representando el nombre lógico del fichero Logical File Name (LFN) o Grid Unique Identifier (GUID) necesitado por el trabajo como dato de entrada. La lista es usada por el WMS para encontrar el CE desde el cual se puede tener un mejor acceso a los ficheros especificados y planificar el trabajo para que corra en el. InputData = {lfn:cmstestfile, guid:135b7b23-4a6a-11d7-87e7-9d101f8c8b70}; JDL: Atributos Relevantes (cont.)

35 E-infrastructure shared between Europe and Latin America DataAccessProtocol DataAccessProtocol (obligatorio si se ha definido el campo InputData) El protocolo o la lista de protocolos con los cuales la aplicación es capaz de comunicarse para tener el acceso a los ficheros relacionados en el InputData y que se encuentran SE dado. gsiftpfile Los protocolos soportados actualmente en gLite son gsiftp, and file. DataAccessProtocol = {file,gsiftp}; JDL: Atributos Relevantes (cont.)

36 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 36 StorageIndex StorageIndex (Obligatorio si se han definido el InputData o el OutputData ) Representa la dirección URL del StorageIndex Service a contactar para resolver los nombres de los ficheros especificados en los atributos del InputData. StorageIndex = https://glite.org:9443/StorageIndex; JDL: Atributos Relevantes (cont.)

37 E-infrastructure shared between Europe and Latin America OutputSE OutputSE (opcional) Esta cadena representa la dirección URI del Storage Element (SE) donde el usuario quiere almacenar los datos de salida. Este atributo es utilizado por el Resource Broker para encontrar el mejor CE cercano a este SE y planificar el trabajo en el mismo. OutputSE = grid009.ct.infn.it; JDL: Atributos Relevantes (cont.)

38 E-infrastructure shared between Europe and Latin America OutputData OutputData (opcional) Este atributo permite al usuario preguntar por la carga automática y registro del conjunto de datos producidos por la ejecución del trabajo en el Worker Node (WN). Este atributo contiene a su vez los siguientes atributos: OutputFile StorageElement LogicalFileName JDL: Atributos Relevantes (cont.)

39 E-infrastructure shared between Europe and Latin America OutputFile OutputFile (Obligatorio si se ha especificado el OutputData ) Este es un atributo que representa el nombre del fichero de salida, generado por el trabajo en el WN, el cual ha tenido que ser automáticamente subido y registrado por el WMS. StorageElement StorageElement (opcional) Este es una cadena que representa la dirección URI del SE donde los ficheros de salida especificados en el OutputFile han sido subido por el WMS. LogicalFileName LogicalFileName (opcional) Este es una cadena que representa el LFN que el usuario quiere asociar al fichero de salida cuando se vaya a registrar en el Catalogo. JDL: Atributos Relevantes (cont.)

40 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 40 NodeNumber NodeNumber (Obligatorio si el tipo de trabajo se definió como JobType=MPICH) Es un número entero que especifica el número de nodos necesarios para un trabajo MPI. El RB utiliza este atributo durante el proceso matchmaking para la selección de aquellos CE que tengan un numero igual o mayor de procesadores que los especificados en NodeNumber. NodeNumber = 5; JDL: Atributos Relevantes (cont.)

41 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 41 JobSteps JobSteps (Obligatorio para trabajos de tipo checkpointable o partitionable) Este atributo puede ser un entero que representa el número de pasos para un trabajo checkpointable o partitionable: JobSteps = 100000; O una lista de cadenas que representan niveles asociados a los pasos de los trabajos checkpointable o partitionable : JobSteps = {d0, d1, gmos}; JDL: Atributos Relevantes (cont.)

42 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 42 CurrentStep CurrentStep (Obligatorio para trabajos de tipo checkpointable o partitionable) Se utiliza para indicar el paso inicial cuando se envía un trabajo de tipo checkpointable or partitionable. CurrentStep = 2; JDL: Atributos Relevantes (cont.)

43 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 43 Referencias JDL Attributes http://server11.infn.it/workload-grid/docs/DataGrid- 01-TEN-0142-0_2.pdf https://edms.cern.ch/document/590869/1 http://egee-jra1-wm.mi.infn.it/egee-jra1- wm/api_doc/wms_jdl/index.html LCG-2 User Guide Manual Series https://edms.cern.ch/file/454439/LCG-2- UserGuide.html https://edms.cern.ch/file/454439/LCG-2- UserGuide.html

44 E-infrastructure shared between Europe and Latin America Tutorial EELA para usuarios 44 Questions…


Descargar ppt "Tutorial EELA para usuarios E-infrastructure shared between Europe and Latin America gLite Arquitectura del WMS Henry Ricardo Mora CUBAENERGIA- Cuba Tutorial."

Presentaciones similares


Anuncios Google