Raúl Ramos Pollán Universidad Nacional de Colombia

Slides:



Advertisements
Presentaciones similares
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities scuola.
Advertisements

Imágenes orientativas para la obra de teatro “¡Viva la ciencia!”
¿PARA QUE ESTAMOS AQUÍ? LOS OBJETIVOS DE LA ENCARNACIÓN.
SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
1 Datos sobre webloggers Datos extraidos de la encuesta a webloggers disponibles en la web de los autores.
el 1, el 4 y el 9 tres cuadrados perfectos autosuficientes
Seminario El Futuro del Seguro de Vida
1 PRINCIPALES INDICADORES DEL DESARROLLO DE LA SOCIEDAD DE LA INFORMACIÓN EN GALICIA CUADRO DE MANDO Apartado: Empresas Septiembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
AYUDA A LA FUNCIÓN DOCENTE Internet
TEMA 2 MÚLTIPLOS Y DIVISORES
02- Plan Organización Docente v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
02- PLAN DOCENTE Febrero 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
01- OFERTA FORMATIVA v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Respuestas Buscando a Nemo.
ABECEDARIO FIGURAS GEOMÉTRICAS NÚMERO
Área Razón Social 0 0 Telefónica Servicios Audiovisuales S.A. / Telefónica España S.A. Título de la ponencia / Otros datos de interés / Kit.
© 2007 Cisco Systems, Inc. All rights reserved. Traducido en apoyo a la capacitación de Instructores de la Red Proydesa Comunicación por la red Fundamentos.
Los Objetos de la Clase Escriban la palabra (the word) en español para los objetos de la clase (#1-20).
CLASE 3 SOFTWARE DEL MICROPROCESADOR
CONFERENCIA MAGISTRAL: “LA PERSONA HUMANA”
Presentación 20 de Mayo 2009.
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities alimentazione.
1. Apoyo exterior sobre ala inferior de viga de acero
1 Reporte Componente Impacto Por Orden Territorial Por Departamento No Disponible ND *Los indicadores para el año 2008 no fueron calculados.
Funciones Excel. Parte 1. Introducción 2 Una función Excel es una fórmula o un procedimiento que se realiza en el ambiente de Visual Basic, fuera de.
1 Modulo de Administradores Licencia Nacional de la Web of Knowledge Año 2013.
-17 Expectativas sobre la situación económica (Europa) Septiembre 2013 Indicador > +20 Indicador 0 a +20 Indicador 0 a -20 Indicador < -20 Total Unión.
Autodesk Civil 3D 2007 Essentials
Phone2Wave-Server Manual de Operación.
Universidad Nacional Autónoma de Honduras
Gerencia de Programas Federales de Agua Potable y Alcantarillado Evolución del Sistema Informático de Contraloría Social (SICS) Veracruz, Ver. 2 de octubre.
50 principios La Agenda 1.- Presentar un único interlocutor a los clientes. 2.- Tratar de modo distinto a las diferentes clases de clientes. 3.- Saber.
Diseño organizacional,
Informe final Luis Alberto Zuleta J. Mayo de 2010
Í N D I C E. Í N D I C E P R E S E N T A C I Ó N.
INFORME USDA NOVIEMBRE TRIGO 2 MERCADO INTERNACIONAL (Millones de Toneladas) 3.
Sistemas de Ecuaciones
Trascendencia de este curso Curso Introducción a la Computación 1
PLAN MAESTRO PARA EL MEJORAMIENTO DE LOS SERVICIOS DE AGUA POTABLE, ALCANTARILLADO Y SANEAMIENTO DE LA CIUDAD DE CANANEA, SONORA TABLA DE CONTENIDO.
EL OSO APRENDIZ Y SUS AMIGOS
50 principios 1. Los clientes asumen el mando.
1 PROYECTO DE PRESUPUESTO DE EGRESOS DE LA FEDERACION 2002 COORDINACIÓN DE POLITICA ECONOMICA GP-PRD.
RETIRO DE COMALCALCO DIC. 2012
Proyecto para Centros que trabajan una vez por semana.
3 Enero 2010 PERÚ: IV CENSO NACIONAL ECONÓMICO, APURÍMAC.
Sistema Para GENERAR gráficas a partir de logs tcpdump usando Hadoop
Comité Nacional de Información Reunión CNO Gas No. 078 Barranquilla, enero 15 de 2010 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES.
Comité Nacional de Información Bogotá, Julio 27 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Proyecto Fin de Carrera E.T.S. Ingeniería Informática 26 de Septiembre de 2006 DESARROLLO DE UN COMPONENTE TECLADO ALUMNO: Fco. Javier Sánchez Ramos TUTORES:
Aqui está Señoras y Señores !!!!!
CULENDARIO 2007 Para los Patanes.
Reunión de los requerimientos de la red
BEATRIZ LAFONT VILLODRE
Introducción al lenguaje R Sesión 2: Objetos en R
“¿Qué Pienso de mi futuro?”
AUDITORIA DE LA SEGURIDAD en Telecomunicaciones y redes de computadoras Unidad VI.
1 ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL PRESENTACIÓN DE LA TESIS Presentada por: Guayaquil, Noviembre 2007 ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL.
MSc. Lucía Osuna Wendehake
Calendario 2009 “Imágenes variadas” Venezuela Elaborado por: MSc. Lucía Osuna Wendehake psicopedagogiaconlucia.com Enero 2009.
UPC MATRICES MA49 (EPE) Universidad Peruana de Ciencias Aplicadas
Bloque 1: Sobre la satisfacción de los Alumnos/as del Centro Educativo. LOGROS IMPORTANCIA Sobre la tarea del profesorado Las enseñanzas recibidas.
Programación 1 (01) Prof. Domingo Hernández Departamento de Computación Grupo de Ingeniería de Datos y Conocimiento (GIDyC) Escuela de Ingeniería.
1 BALONCESTO PARA NOVATOS Alcobendas 15 de mayo de 2008 GUILLERMO HERNANDEZ PEÑALBA.
Manual de Procedimientos Procedimiento de ejecución del programa de
DISEÑO DE LA PROPUESTA DEL PROCESO DE RENDICION DE CUENTAS 2014 Coordinación General de Planificación Ministerio de Agricultura, Ganadería, Acuacultura.
Simulacion de sistemas dinamicos
Transcripción de la presentación:

Raúl Ramos Pollán Universidad Nacional de Colombia Perspectivas de la Computación Científica. Clusters, Grids y Clouds. Desarrollos y retos Raúl Ramos Pollán Universidad Nacional de Colombia

Computación Científica “La Ciencia e Ingeniería Basada en la Simulación ha alcanzado hoy día un nivel de capacidad predictiva que complementa sólidamente los pilares tradicionales de teoría, experimentación y observación … Muchas tecnologías críticas … están en un horizonte que no pueden ser entendidas, desarrolladas o usadas sin simulación por computador”. http://www.wtec.org/sbes/

Computación Científica Algoritmos/Aplicaciones Datos Infraestructura de cómputo Recurso humano/ Comunidades científicas

Aplicaciones – Fine grained parallelism Descomposición en elementos finitos Predicción climática Docking de proteínas

Aplicaciones – Coarse grained parallelism Particiones de datos Data scans / aggregations / summaries Summatory query form over data Logs processing, index generation  Map/reduce, Hadoop Simulación Montecarlo

Aplicaciones Coarse computation for fine grained parallelism Generate configurations Barridos de parámetros (ejemplo Stellerator TJ-II en la Grid) Simulate device conf 1 Simulate device conf 2 Simulate device …. Simulate device conf n Evaluate configurations

Paralelización de algoritmos Naturaleza de los algoritmos

Paralelización de algoritmos Recurso computacional disponible (GPUs, Cluster, Grids, Clouds, …) Topología interconexión unidades de cómputo Estrategias para explotar recursos computacionales Por paralelización intrínseca del algoritmo Por barrido de parámetros Por partición de datos

Ejemplos de algoritmos Procesamiento de imágenes  operaciones en regiones (i.e. contraste)   and perform n iterations

Ejemplos de algoritmos Particionamiento no trivial  por algoritmo (otra estrategia  por datos para muchas imágenes, pero cada una tiene que caber en memoria)

Ejemplos de algoritmos Particionamiento no trivial

Paralelización de KMeans … Paralelizar asignación y el cálculo de la media para cada centroide … …

Map-reduce, Hadoop

Map-reduce, Hadoop

Escalabilidad Ley de Amdahl N: Núm. nodos paralelos P: Proporción paralelizable del código S(N): speedup máximo

Infraestructuras de computación Clusters Supercomputadores Clouds Grids GPUs Computación oportunista

Top500, distribución histórica (www.top500.org)

Top500, distribución histórica (www.top500.org)

Clusters Planificación de tareas  Batch jobs Sistema compartido de archivos Fast inter-networking for inter-process communication Shared storage

Supercomputadores Planificación de tareas  Batch jobs Memoria compartida Procesos multi-nodo

Grids Redes de datacenters Particiones de procesos independientes Heterogéneos Federación vs distribución Middleware propio

Clouds Desacoplamiento infraestructura física Modelo de cómputo no fijo: IaaS, PaaS, SaaS

Computación oportunista Sobre recursos no propios Computación voluntaria, labs de escuelas, etc.

GPUs Computación matricial Procesadores simples y masivos

Datos científicos Colecciones de datos Adquisición de datos Colisiones LHC, secuenciaciones, digitalizaciones, bancos de imágenes, mapas

Datos científicos Orígenes Distribución Estándares y formatos Propiedad y responsabilidades

Datos científicos Orígenes Distribución Estándares y formatos Propiedad y responsabilidades

Big Data manejo de datasets de tamaño >> capacidad de las herramientas tradicionales de bases de datos según la tecnología avanza con el tiempo, el tamaño de los conjuntos de datos a los que denomina el término también crecerán, si cabe, a un aún ritmo mayo Requiere nuevo modelo (no sirven BBDD tradicionales, paquetes estadísticos/visualización desktop) Objetivo  Escalabilidad «trivial»

Bases de datos NoSQL Expresividad SQL vs. Escalabilidad Tablas: filas de keys + lista no fija de columnas/valores Operaciones simples: Scan por key Acceso directo por key Transacciones mínimas (check&put) No joins, no SQL language Big table, Hbase, DynamoDB, Azure, Cassandra, etc.

Arquitectura HBase

La Gente Científicos Ingenieros Programadores Gestores de proyecto Administrativos

Formación multidisciplinar Conclusión 1: El mundo de la computación es plano, cualquiera puede acceder. Lo que nos distinguirá del resto del mundo es nuestra habilidad para hacerlo mejor y explotar las nuevas arquitecturas que desarrollamos antes de que dichas arquitecturas sean universalmente usadas. Conclusión 2: La educación y formación inadecuadas de la siguiente generación de científicos computacionales amenaza el crecimiento global de la Ciencia e Ingeniería Basadas en Simulación. Esto es particularmente urgente [...]; a no ser que preparemos a los investigadores para desarrollar y usar la próxima generación de algoritmos y arquitecturas de computadores, no seremos capaces de explotar sus capacidades para cambiar las reglas del juego. http://www.wtec.org/sbes/

Escenarios y Retos Código sucio o poco estructurado Falta de documentación Arquitecturas de software y datos espontáneas Código mezclado (paralelo, seq, …) Procesos de desarrollo informal Comunidades científicas tradicionales Procesos de desarrollo informal

Adaptarse al hardware disponible? Contribuir al software? Decisiones Grid? Cloud? Modificar algoritmos? Adaptarse al hardware disponible? Me dedico a otra cosa? Contribuir al software? Duplico datasets? Comunidad científica? Comprar hardware? GPU?

SOLOS NO SOMOS NADA Mantener hardware es caro Portar aplicaciones es caro Criterios científicos, técnicos y organizacionales Cambios generacionales

A corto plazo Medir el alcance del sw/hw disponible Medir recurso humano disponible Afinar objetivos y esfuerzo Adaptar objetivos científicos a posibilidades

A medio/largo plazo Construir equipos multidisciplinares Actualizar programas de capacitación (BSc Msc PhD) Cultura HPC en la ciencia y Cultura científica en ingeniería Generar frameworks y modelos de computación Iniciar procesos de planificación de software Generar frameworks y modelos de computación Regeneración generacional Estrategias transnacionales

Conclusiones EL USO DEL CÓMPUTO CIENTÍFICO ES INEVITABLE La computación científica es un reto tecnológico, científico y organizacional Científicos e ingenieros computacionales se necesitan mutuamente  equipos multidisciplinares Tecnología vs. Modelos de computación vs. Disponibilidad de recursos (humanos + técnicos) Conciliar estrategias a corto, medio y largo plazo CAMBIO DE PARADIGMA  EVITAR OBSOLESCENCIA

?