ROOT TOOLKIT (Parallel ROOT Facility, PROOF) Técnicas Fundamentales de Simulación, Reconstrucción y Análisis de Datos en Física Experimental de Partículas.

Slides:



Advertisements
Presentaciones similares
Convenio de Cooperación. Hoy vamos a hablar de... -El Plan Integral de Educación Digital en la CABA -Programa Conectar Igualdad Sensaciones, expectativas.
Advertisements

Definición Objetivos Funciones de un S.O.
MAC OS.... CONCEPTOS GENERALES
Sistema operativo Componentes de un sistema operativo
Supervisión del rendimiento de SQL Server
I.T.E.S.R.C. Romina Tamez Andrea Martínez Ma. De Lourdes Solís
PROGRAMACIÓN PARALELA Tema 5: Análisis de algoritmos paralelos
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Virtual PC.
¿Qué es KVM? El conmutador KVM le permiten acceder y controlar un ordenador, conectándolo directamente a los puertos del teclado, video o ratón (KVM).
TECNOLOGIA DE NUBES JORLETH POVEDA MURCIA.
Gestión de usuarios en redes Miguel A. González Ruz 19/11/07.
DOM ( Document Object Model) Prof. Franklin Cedeño.
S.O. Multiusuario, red. Servicio: Cliente/Servidor, p2p
Windows XP sp3.
HERRAMIENTAS INFORMATICAS
Bioinformática FJS.
Introducción a los SSOO Sebastián Sánchez Prieto.
TRADUCTOR DE UN PROGRAMA
Tema 10: Gestión de Memoria
Análisis Interactivo Tier3 Santiago González de la Hoz IFIC-Valencia III Reunión en Barcelona del Tier2 federado español de.
DATA WAREHOUSE Equipo 9.
Programación I MC José Andrés Vázquez Flores
SISTEMAS OPERATIVOS →¿Qué es un sistema operativo?
El grupo de Física Experimental de Altas Energías en el experimento CMS CMS es uno de los cuatro experimentos del LHC en el que colaboran unos 3000 científicos.
Desarrollo de aplicaciones para ambientes distribuidos
Computación en la Nube UASF.
TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS
El software es un programa o un conjunto de programas informáticos que tienen una tarea determinada. El software está compuesto por un conjunto de instrucciones.
Introducción a Pentaho BI Suite 3.5
Introducción a los SOs.
Tema 8: Introducción a los SOs. Tema 8: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.), Introducción.
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
Cuentas de usuarios y grupos en windows 2008 server
Almacenamiento virtual de sitios web “HOSTS VIRTUALES”
Departamento de Informática Universidad de Rancagua
VENTAJAS DE LAS BASES DE DATOS.  Los sistemas de ficheros almacenan varias copias de los mismos datos en ficheros distintos. Esto hace que se desperdicie.
Servicio Remoto de Monitoreo
INTRODUCCIÓN AL CURSO Técnicas Fundamentales de Simulación, Reconstrucción y Análisis de Datos en Física Experimental de Partículas Isidro González Caballero.
EQUIPO:#3 GRUPO:304 NOMBRES: Lizbeth Nava Barón y Erick Ali Mejía.
UNIVERSIDAD LATINA III. MANTENIMIENTO Y GESTIÓN DE LA INFORMACIÓN DE UNA BASE DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
Rendimiento de la CPU y sus factores
Introducción a los modelos de simulación y análisis de datos en Física de Partículas Isidro González Caballero (
Instituto Tecnológico de las Américas (ITLA)
Sustentante: Francis Ariel Jiménez Zapata Matricula: Grupo: 2 Profesora: Jose Doñe Asignatura: Sistema Operativo 2.
TALLER DE SISTEMAS OPERATIVOS
INTRODUCCIÓN: PROGRAMACIÓN ORIENTADA A OBJETOS, GNU/LINUX Y C Técnicas Computacionales en Física Máster en Física y Tecnologías Físicas, Máster en.
ARQUICTECTURA DE SERVIDORES
LIA. SUEI CHONG SOL, MCE..  1.- SOFTWARE BÁSICO O DE SISTEMA. Conjunto de programas imprescindibles para el funcionamiento del sistema.  2.- SOTWARE.
Son los atributos de un sistema que son visibles para un programador, es decir aquellos atributos que impactan directamente en la ejecución lógica de un.
BASE DE DATOS.
TALLER DE SISTEMAS OPERATIVOS
Tipos de Lenguajes Ensamblador.
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
1 RAID (Redundant Array of Inexpensive Disks). RAID Una serie de sistemas para organizar varios discos como si de uno solo se tratara. Haciendo que trabajen.
Computación en la Nube.
TECNICO EN SISTEMAS NUMERO DE FICHA:
PROGRAMA NUESTRAS CIUDADES SISTEMA DE INFORMACION PARA LA GESTION URBANA TERRITORIAL.
BUSINESS T&G Think & Grow Uniclass Business Intelligence La solución Business Objects que analiza los procesos de su negocio.
QUE ES UNA RED Una red es un grupo de equipos de sobremesa o portátiles (y otros dispositivos de red, como impresoras) conectados entre sí El propósito.
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
ANTIVIRUS EN LA NUBE. CONCEPTO: Cloud Computing supone trabajar directamente en la Nube. De ahí que, en base a este concepto, se haya desarrollado todo.
ANTIVIRUS CLOUD COMPUTING. Los antivirus cloud o antivirus en la nube, son antivirus que aplican a los antivirus el concepto cloud computing. Instalan.
Cloud Computing (computación en la nube), se trata del conjunto de programas y servicios alojados en un servidor conectado a la Red, accesible desde cualquier.
ANTIVIRUS CLOUD COMPUTING Zamudio Julieta Antonella.
Instituto de Ciencias y Humanidades Tabasco. El software Coordinar el uso del hardware Coordinar el uso del hardware Ejercer el control Programas de aplicación.
PAGINAS WEB DENIS SILVA PARRAL SARAI LOPEZ GONZALEZ.
Planificación de CPU Conceptos Básicos Criterios de Planificación Algoritmos de Planificación Planificación con Múltiples Procesadores Planificación Real-Time.
PRESENTACIÓN DE PRODUCTO Tablero de Comando 1.
Transcripción de la presentación:

ROOT TOOLKIT (Parallel ROOT Facility, PROOF) Técnicas Fundamentales de Simulación, Reconstrucción y Análisis de Datos en Física Experimental de Partículas Isidro González Caballero ( Universidad de Oviedo) Valencia, 07-11/05/

Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas ¿Qué es?  Es una herramienta incluida en ROOT que permite “paralelizar” (en realidad más bien distribuir) fácilmente el análisis de datos sobre TTrees  Reduciendo el tiempo que se tarda en procesar los datos…  … de manera casi transparente…  El objetivo es que si se dispone de una granja de ordenadores se puedan utilizar todos sus recursos:  Siendo percibida como una extensión del PC local  Con misma syntaxis que en una sesión local  Haciendo un uso dinámico de los recursos  Proporcionando feedback en tiempo real  Haciendo transparente las tareas de splitting y merging 2

Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas Análisis de datos  El principal caso de uso es el análisis de datos basado en TTrees  Especialmente si se trata de estructuras relativamente planas que se analizan prácticamente siempre con ROOT  La simulación y la reconstrucción de datos suelen recurrir a metodologías basadas en computación GRID  En este caso es en general sencillo convertir las macros de análisis para beneficiarse de PROOF  Sólo hace falta recolocar el código  El código convertido a PROOF puede ejecutarse de manera secuencial también  El troceado, optimización de los recursos y reconstrucción de los resultados se gestionan de manera transparente  Permite integrar también sistemas distribuidos de almacenamiento 3

Modalidades  Existen básicamente dos modalidades: Lite y Cluster  Modo PROOF Lite: No requiere ningún tipo de instalación  Aprovecha los cores disponibles en una máquina  Uso inmediato  Ideal cuando se dispone de un ordenador relativamente nuevo (>4 cores)  Modo Cluster: Requiere de la instalación de ciertos servicios  Permite aprovechar los cores distribuidos en distintos nodos  Se puede integrar en una infraestructura grande a través de los sistemas de colas disponibles  Uso NO inmediato  Ideal si se tiene acceso a granjas de computación (Tier-2, Tier-3) Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas 4

¿ Cómo hacer el análisis?  El mismo código de análisis es válido tanto en PROOF Lite como en un cluster PROOF  Basado en TSelector  La estructura básica se genera a partir de una macro de PROOF TChain::MakeSelector(const char* selector); Si esa estructura es estable y única es posible definir un modelo más sencillo  La migración del código habitual a uno basado en TSelector es sencilla Básicamente recolocar el código viejo en los métodos de Tselector  Goodies: Soporte para módulos, optimización de la carga soportada por cada nodo, histogramas actualizados a medida que se van llenando, integración de resultados,…  Problemas: Los típicos de un sistema distribuido… más difícil de debuggear. 5

PROOF Lite 6 Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas [root] TDSet* chain = new TDSet("TTree","Tree"); [root] chain->Add("/some/first/minitree.root"); [root] chain->Add("/some/other/minitree.root"); … [root] p = TProof::Open(""); +++ Starting PROOF-Lite with 8 workers +++ Opening connections to workers: 5 out of 8 (62 %) Opening connections to workers: OK (8 workers) Setting up worker servers: OK (8 workers) X connection to localhost:13.0 broken (explicit kill or server shutdown). [root] p->SetParallel(4); PROOF set to parallel mode (4 workers) [root] p->Process(chain, "MySelector.C", 0, nEvents);  No necesita instalación específica en el nodo en el que se corra  La ganancia puede depender de  Dónde estén colocados los datos Ejemplo: En un disco local plateau típicamente en N cpu =4  El ancho de banda que tiene el ordenador Ejemplo: Servidos por NFS usar más de 4-5 cores no suele supone apenas ganancia TSelector con el análisis Número de sucesos Inicializamos la sesión de PROOF Lite Datos a analizar

Cluster PROOF 7 Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas  Es posible construir un cluster que soporte PROOF sobre un conjunto de ordenadores:  Las posibilidades son muchas y muy dependientes de cómo se quiera abordar el problema  Detalles en:  También es posible utilizar los sistemas de colas para acceder a varios nodos y construir con ellos un cluster PROOF dinámicamente  Pequeñas ineficiencias, pero muy conveniente porque no hay que tener accesos especiales a las máquinas  Existen herramientas eficientes que realizan estas acciones de manera transparente: PROOF on Demand (PoD): Desarrollado en DESY Soporta varios sistemas de colas disntios, GRID y ssh PROOF Cluster: Desarrollado por el IFCA y U.O. Soporta PBS y SGE

Esquema Cluster PROOF 8 Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas Storage PROOF farm MASTER commands,scripts list of output objects (histograms, …)

Screenshot 9 Téc. Fund. de Simulación, Reconstrucción y Análisis de datos en F. Exp. de Partículas