Análisis de datos del detector ATLAS utilizando el Grid: Modelo de Análisis Distribuido en ATLAS S. González de la Hoz IFIC – Institut de Física Corpuscular.

Slides:



Advertisements
Presentaciones similares
Proyecto Grid Venezuela Emilio Hernández Universidad Simón Bolívar Escuela Latinoamericana de Grid Abril 2006.
Advertisements

Internet y tecnologías web
Diseño de Bases de Datos
Proceso Certificación y Manejo de Datos en EGEE Gonzalo Merino PIC/IFAE XVIII Grupos de Trabajo de RedIRIS Sesión: EGEE-IrisGRID Toledo 25-Oct
HP- CAST Centro Informático Científico de Andalucía de Octubre Juan Antonio Ortega Ana Silva.
Aplicación de la tecnología Grid: Portal de recursos de supercomputación José Ruedas Sánchez Instituto de Astrofísica de Andalucía Consejo Superior de.
Proyecto e-CA: Organización Virtual y Testbed Susana Sánchez Expósito José Ruedas Sánchez II Reunión de e-Ciencia Andaluza 16-17, Octubre 2008.
Sistema de producción de datos de ATLAS Julio Lozano Bahilo Universidad de Granada.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
PRESENTACIÓN DEL CENTRO DE SUPERCOMPUTACIÓN DE CASTILLA Y LEÓN
Los servicios de red son la fundación de una red de trabajo en un ambiente de computadoras. Generalmente los servicios de red son instalados en uno o.
Partículas fundamentales
Marco Benzi Eduardo González Matías Müller Redes de Computadores I - ELO 322.
2.5 Seguridad e integridad.
Almacenamiento en la nube
EL SUPERACELERADOR LARGE HADRON COLLIDER JAVIER DE LUCAS.
En este tipo de computación todo lo que puede ofrecer un sistema informático se ofrece como servicio, de modo que los usuarios puedan acceder a los.
SOA, Web 2.0 y Cloud Computing Tres aspectos innovadores en IT
ARIS-G: Software de Monitoreo Geomecánico de Superficies
Integración de VOs y middleware para EGEE
Introducción a la computadora
CCRC08 post-mortem LHCb activities at PIC G. Merino PIC, 19/06/2008.
Búsqueda del bosón de Higgs en el canal H → ZZ ( * ) →4 μ en CMS empleando un método de análisis multivariado Alejandro Alonso Díaz 27 de Septiembre de.
Soporte de Usuarios del CrossGrid: HelpHesk Curso Grids y e-Ciencia, Junio 2004 Santander, España Farida Fassi IFIC.
Gran Colisionador de Hadrones  Proyecto mundial que recrea el origen del Universo.  Dr. Gerardo Herrera (Cinvestav)  José Luis Carrillo  Octavio Plaisant.
Análisis Interactivo Tier3 Santiago González de la Hoz IFIC-Valencia III Reunión en Barcelona del Tier2 federado español de.
1 Análisis Distribuido & User Support Farida Fassi IFIC (Instituto de Física Corpuscular) CSIC-Universitat de València III REUNIÓN ATLAS TIER-2 Federado,
1 Objetivos de la III Reunión Presencial del TIER-2 ATLAS José SALT IFIC 30 de Mayo 2007.
Búsqueda del bosón de Higgs en el canal H → ZZ ( * ) →4 μ en CMS empleando un método de análisis multivariado Alejandro Alonso Díaz 27 de Septiembre de.
El grupo de Física Experimental de Altas Energías en el experimento CMS CMS es uno de los cuatro experimentos del LHC en el que colaboran unos 3000 científicos.
O Funcionamiento, ventajas y alcance o ESTUDIANTE: EDWIN ARAY VÉLEZ o PROFESOR: ING. JOSÉ MEDINA o FUNDAMENTOS TECNOLÓGICOS DE INFORMACIÓN.
Evolución y Status del Proyecto CROSSGRID
IFIC Instituto de Física Corpuscular Aplicaciones del GRID más allá del LHC Existen numerosas aplicaciones en sismología como la determinación de las características.
Presentación: Un Enfoque de Servicios Aplicación del enfoque ITIL a la gestión técnica de los servicios de la RES Dr. Prof. J. Marco de Lucas Disclaimer:
Spanish Teachers Programme CERN, 27 de julio de 2007 Informática Cientifica Miguel Angel Marquina 1 where the Web was born GRID e Informática Científica:
Cloud Computing. ¿Qué es Cloud Computing? Definiciones Refers to the bigger picture…basically the broad concept of using the internet to allow people.
Reunión Informativa de Proyectos GRID Granada, 12 de Julio de 2002 Proyectos en Tecnologías GRID (II) J. Salt (IFIC)
J.C.Cano, J. Sahuquillo, J.L. Posadas 1 Juan Carlos Julio Juan Luis
DAM ¿Qué es y qué NO es un DAM? DAM.
Visita IFIC, 24 de Noviembre, 2005, Valencia Dra SUSANA CABRERA por Dr JOSE SALT VISITA AL IFIC (INSTITUTO DE FISICA CORPUSCULAR): 1.Bienvenida. 2.Video.
Curso de Postgrado ‘GRIDS y e-Ciencia’ ” UTILIZACION DE UNA INFRAESTRUCTURA GRID” J. Salt Grupo de GRID Computing del IFIC IFCA, Santander; de Junio.
ASOPROJECT Componentes del grupo: - Alberto Díaz Gil - Miguel Ángel Llorente Gracía - Javier E. Yépez Hualde.
ROOT TOOLKIT (Parallel ROOT Facility, PROOF) Técnicas Fundamentales de Simulación, Reconstrucción y Análisis de Datos en Física Experimental de Partículas.
Sistema de análisis distribuido de ATLAS (ADA) Farida Fassi / Mª Dolores Jordán IFIC.
Herramientas de simulación, reconstrucción y análisis de datos en Física de Partículas (I): Introducción Javier Fernández Menéndez Master Técnicas de Computación.
carlos luis loor  La computación en la nube, concepto conocido también bajo los términos servicios en la nube, informática en la nube, nube de cómputo.
S ERVICIOS DE RED E I NTERNET T EMA 5 : I NSTALACIÓN Y ADMINISTRACIÓN DE SERVICIOS DE TRANSFERENCIA DE FICHEROS ” Nombre: Adrián de la Torre López.
Perspectivas de Proyectos GRID J. Salt (IFIC). 10 de Julio de Puntos a tratar 4 I.- Explotación y evolución del GoG 4 II.- Sexto Programa Marco.
RESEARCH ON ALGORITHMS OF DATA MINING UNDER CLOUD COMPUTING ENVIRONMENT BY FEI LONG KEVIN FLORES ALVAREZ INF-252.
Almacenamiento en la nube Presentado por : Daniel miranda Beto zambrano.
Gestión de datos en el Tier-2 L. March, J. Sánchez IFIC – Valencia Presentado por L. March Reunión Tier-2 federado de ATLAS IFAE (Barcelona) – 30 de mayo.
Computación en la Nube.
Introducción al LHC y CMS Isidro González Caballero ( Técnicas Experimentales en Física de Partículas.
Es un antivirus gratuito basado en cloud computing, especialmente diseñados para ofrecer protección desde la nube. Es un software de protección, como los.
ANTIVIRUS CLOUD COMPUTING. Los antivirus cloud o antivirus en la nube, son antivirus que aplican a los antivirus el concepto cloud computing. Instalan.
18/02/2016Diego Alberto Rincón Yáñez, Pontificia Universidad Javeriana, 1.
WINDOWS SERVER 2008 r2 ADMINISTRACION DE RECURSOS: Con el Administrador de recursos del sistema de Windows del sistema operativo Windows Server® 2008 R2,
Actualización del Superordenador Virtual Gallego Valencia, 12 Abril Carlos Fernández Sánchez Responsable Técnico de Sistemas
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks The gLite Information System Virginia Martín-Rubio.
La Física del quark Top en el Tier3 del IFIC. La Física del quark Top en el Tier3 del IFIC. Reunión de análisis ATLAS-Valencia Susana Cabrera.
Estancia en el CERN 18 de febrero – 18 abril de de abril, Luciano Díaz.
Avda. de la Industria, 37, 28760, Tres Cantos, Madrid, España - T: , F: , Avenida 15, Nº 125.
Facilidades de Análisis en los centros: ATLAS TIER3 en Valencia S. González de la Hoz, J. Sánchez, L. March, A. Lamas IFIC – Instituto de Física Corpuscular.
ALICE GRID en México 19 de junio de 2007 Autores: Luciano Diaz, Lukas Nellen, Pedro Podesta Co-autores: Patricia Méndez, Kitzia Lubreras, Hans Reyes, Latchezar.
Decoupling Computation and Data Scheduling in Distributed Data-Intensive Applications Kavitha Ranganathan, Ian Foster University of Chicago 11th IEEE International.
1) Almacenamiento de datos de oficiales y privados. 2) Use cases. 3) Resultados del test Step09. Santiago González de al Hoz Análisis en el Grid.
X Reunión Presencial del TIER-2 ATLAS España José SALT UAM 15 y 16 de Noviembre de
Facilidad de Análisis: ATLAS TIER3 en Valencia
XI Reunión Presencial del
CONTRIBUCION DE LOS CENTROS LOS DATOS SIMULADOS DE ATLAS
Transcripción de la presentación:

Análisis de datos del detector ATLAS utilizando el Grid: Modelo de Análisis Distribuido en ATLAS S. González de la Hoz IFIC – Institut de Física Corpuscular de València

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Índice  Modelo de Análisis distribuido en ATLAS Introducción al reto de los datos Distribución y flujo de datos Modelo de datos Infraestructura Grid Modelo de Análisis Distribuido Replicación de conjuntos de datos (Dataset) Envío de trabajos al Grid  Análisis distribuido con la herramienta Ganga (F. Fassi) Situación actual del análisis distribuido Análisis distribuido con Ganga  Definir un trabajo en Ganga usando el software de ATLAS  Enviar un trabajo con Ganga (Job Workflow)  Seguir el estado del trabajo  Demostración práctica Relacionado con esta parte: Parte de Dra. Farida Fassi

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Introducción: Large Hadron Collider (LHC)  El LHC es un colisionador p-p: E CM = 14 TeV ʆ = cm -2 s -1 (10 35 in high lumi phase)  Hay 4 detectores: 2 de carácter general: ATLAS y CMS 1 para la física del B: LHCb 1 para la física de iones pesados: ALICE

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Introducción: El reto de los datos Solución: Tecnologías GRID The offline computing: - Output event rate: 200 Hz ~ 10 9 events/year - Average event size (raw data): 1.6 MB/event 1) Procesar: - 40,000 PC’s de hoy en día 2) Almacenar: - Raw data recording rate 320 MB/sec PB/año 3) Acceder: - Investigadores repartidos por todo el mundo Worldwide LHC Computing Grid (WLCG)/EGEE

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Introducción: Colaboración WLCG  Colaboración 4 Experimentos del LHC ~140 centros de computación 12 grandes centros  (Tier-0, Tier-1) 57 federaciones  Centros Tier-2 ~35 países Tier-2 federado español para ATLAS (IFIC, IFAE y UAM)

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Federación Tier-2 española para ATLAS IFIC IFAE UAM SWE Cloud: Spain-Portugal Tier-1: PIC-Barcelona Tier-2: UAM, IFAE & IFIC LIP & Coimbra

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Rercursos Distribuidos en el Tier2 Ramp-up of Tier-2 Resources (after LHC rescheduling) numbers are cumulative Evolution of ALL ATLAS T-2 resources according to the estimations made by ATLAS CB (October 2006) Strong increase of resources IFAEUAMIFICTOTAL CPU (ksi2k) Disk (TB) Spanish ATLAS T-2 assuming a contribution of a 5% to the whole effort Present resources of the Spanish ATLAS T-2 (June’08) Accounting values are normalized according to WLCG recommendations New acquisitions in progress to get the pledged resources

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Distribución de datos en ATLAS Modelo de Computing de ATLAS

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Flujo de datos en ATLAS

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Modelo de datos en ATLAS Última actualización

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Infraestructura Grid en ATLAS  Se utilizan 3 infraestructuras Grid

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Infraestructura Grid en ATLAS  Cada “sabor” Grid tiene diferente: Middle-ware Catálogos (Replica Catalogs) Herramientas para enviar trabajos  En teoría estas diferencias están ocultas para el usuario final de ATLAS !!!

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Modelo de Análisis distribuido I  El modelo de análisis se basa en el modelo de Computing de ATLAS Los datos se distribuyen por defecto en los centros Tier- 1/Tier-2  Disponibles 24/7 Los trabajos se envían donde están los datos  Los ficheros de entrada (input datasets) son grandes, van desde 100 GB hasta algunos TB Un dataset es una agregación de ficheros Es una unidad de almacenamiento y réplica Los usuarios deben poder acceder a dichos datos y al resultado de sus trabajos Los datos quedan registrados en los catálogos (meta-data & bookkeeping)

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Modelo de Análisis distribuido II  Para ello se necesita: Distributed Data Management (DDM) Utilizamos la herramienta DQ2 (Don Quijote versión 2) Sistema automático para la gestión, distribución y almacenamiento de los datos a través de los 3 sabores de Grid utilizando un catálogo central, FTS, LFCs, etc..  EGEE y NDGF tienen un catálogo (LFC) por “cloud”  OSG tienen un catálog (LRC) por centro  Los Tier-1s tienen un determinado canal FTS con el CERN y con el resto de Tier-1s. Acceso random a los datos necesita una preselección: ej. Trigger, ID streams o TAGs (meta – data)  Situación actual En cada centro Tier-1 y Tier-2 hay un DDM-operation team el cual ayuda a la gestión de dichos datos

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Modelo de Análisis distribuido III  Modelo de Análisis De forma no local  Utilizando el Grid: Con el software específico de ATLAS (Athena) sobre ESDs/AODs De forma local  Sin utilizar el Grid: Forma interactiva sobre DPDs (ntuplas) utilizando otro tipo de software, ej. Root, Proof, etc.

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Replicación de datos: Forma de trabajo de DDM – Modelo de “cloud” Todos los Tier-1s tienen un canal predefinido (software) con el CERN y entre ellos. Tier-2s se asocian con un Tier-1 y forman la “cloud”. Las “clouds” de ATLAS van desde 2 hasta 15 centros. Tier-2s tienen solamente un canal predefinido con su Tier-1 asociado. Algunos Tier-2s (~5) tienen un canal predifinido con el CERN para calibración CERN LYON NG BNL FZK RAL CNAF PIC TRIUMF SARA ASGC Barcelona Valencia Madrid Lisboa Coimbra T3 SWT2 GLT2 NET2 WT2 MWT2 T1 T2 T3 VO box, dedicated computer to run DDM services T1-T1 and T1-T2 associations according to GP ATLAS Tiers associations. PIC Cloud BNL Cloud TWT2 Melbourne ASGC Cloud wisc

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Réplica de datos (datasets)  ES Cloud:  ALL: mary=Clouds

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Réplica de datos  Optical Private Network (OPN) conecta el CERN con los Tier-1s. Otras conexiones utilizan la European Network Backbone

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Réplica de datos: La nueva red Europea (Géant2)

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Envío de trabajos al Grid WLCG/EGEE  Los trabajos van donde están los datos  Tipos de trabajo: Instalación de software Producción de sucesos de Montecarlo (Simulación) Calibración y Alineamiento Análisis

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Envío de trabajos al Grid  Errónea suposición: Grid ≈ Gran sistema de colas Definir el trabajo en el adecuado jdl (job description language) Encontrar en este caso el software de ATLAS (Athena) propiamente instalado y distribuido en el Grid Localizar los datos en los diferentes Storage Elements Enviar, monitorizar, dividir y obtener el output de mi trabajo Etc…  Atlas ha desarrollado herramientas que integran todos estos componentes de una forma automática y “fácil” para el usuario: Ganga & Pathena !!!!

Santiago González de la Hoz, Curso Grid y e-Ciencia, Valencia 18-Julio Análisis distribuido Ver transparencias de Farida Fassi