Motivación ¿Qué pasaría si en un espacio acotado unimos los recursos de alta tecnología de determinadas organizaciones con los requerimientos de otras de pocos recursos? Un conjunto de hardware, software e investigadores distribuidos geográficamente comunicados por redes de alta velocidad y manejados a través de una capa de software “middleware”denominada “metasistema” SUMA
Servicios A los usuarios A los administradores A las aplicaciones Execute Submit GetResults GetStatus Cancel ChangePasswd A los administradores A las aplicaciones Precarga de Objetos Obtención y Registro de servicios CORBA
Arquitectura Capas Front End MiddleWare Servicios Back End
Diseño Módulos y conexiones
Diseño (cont.) Diagrama de clases del engine
Características generales de “SUMA” Parametrización del sistema Enfoques de administración del sistema Enfoques de proveedor de servicios ( vistas a los usuarios) Metasistema para cómputo remoto Cómputo local Cómputo remoto Cómputo local-remoto Tolerancia a fallas Archivos de backup Reubicación de trabajos
Características generales de “SUMA” (cont.) Seguridad y Control de usuarios Autentificación Autorización Encriptamiento Flexibilidad de clientes Cliente interno Cliente externo
Dificultades y soluciones Redirección de entrada y salida Carga dinámica de clases
“Overhead” y otros resultados Tiempos de overhead de los módulos de SUMA para la ejecución de una aplicación secuencial
“Overhead” y otros resultados (cont.) Tiempos de lectura usando “buffering” en la ejecución de una aplicación secuencial
Conclusiones Sistema modular, escalable y flexible Prototipo totalmente funcional Modelo de scheduling con balanceo de carga Clientes externos de administración y ejecución Flexibilidad de los clientes Módulo de control de usuarios Servidores de ejecución secuenciales y paralelos Acceso a librerias matemáticas internas
Trabajos futuros Herramienta de Profiling interna y a las aplicaciones Checkpointing Filesystem distribuido para los usuarios y módulos de SUMA Reserva de servidores de aplicación Ejecución de aplicaciones locales no java Tolerancia a fallas (mejoras - SPOF)