UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Arquitecturas Paralelas: Multinúcleos, Multiprocesadores, Multicomputadores y Grids Prof. Wílmer Pereira.

Slides:



Advertisements
Presentaciones similares
Arquitectura de Sistema de E/S
Advertisements

CARACTERISTICAS, CLASES, EJEMPLOS
II. ARQUITECTURAS PARALELAS
COLEGIO UNIVERSITARIO DE ADMINISTRACION Y MERCADEO
Guido Rubin Escalabilidad.
Multiprocesadores 3.1 Dominios de aplicación
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Sistemas Operativos Distribuidos Plataforma Cliente/Servidor
INTRODUCCIÓN ESTADO DE LA TÉCNICA PROCESAMIENTO DISTRIBUIDO CON MPI PROCESAMIETNO DISTRIBUIDO DE IMÁGENES GENÉRICO CON VTK PROCESAMIENTO DISTRIBUIDO DE.
Sistemas en estratos. Descripción: se organiza en una jerarquía de estratos, estando construido cada uno de ellos sobre el otro que tiene menor jerarquía.
Sistemas Distribuidos y Paralelos
HISTORIA Y CLASIFICACIÓN DE LOS SISTEMAS OPERATIVOS
SISTEMAS OPERATIVOS.
Universidad Centroamericana
Sistemas Distribuidos y Paralelos
PROCESAMIENTO PARALELO.  Organización lógica ◦ Visión que tiene el programados  Capacidad de expresar tareas paralelas (Estructura de control)  Método.
Universidad de SonoraArquitectura de Computadoras1 PROGRAMA CION PARALELA Y DISTRIBUIDA PRESENTA: JESUS BECERRIL PACHECO MODELOS DE ACCESO A LA MEMORIA.
Departamento de Computación, FACYT, Universidad de Carabobo
La memoria de acceso aleatorio (en inglés:random- access memory, cuyo acrónimo es RAM) es la memoria desde donde el procesador recibe las instrucciones.
Introducción a los Sistemas Distribuidos. Prof. Yudith Cardinale Sept – Dic 2006 Universidad Simón Bolívar Departamento de Computación y T. I Tópicos en.
La unidad central de procesamiento o CPU
Unidad 7 Entrada/Salida
Procesamiento paralelo
OMAR SANCHEZ ROBLES HECTOR PEREZ GARCIA. “Sistemas de cómputo compuesto por un gran número de CPU´s conectados mediante una red de alta velocidad”, Tanenbaum.
Unidad 6 (1ª parte) TEORÍA DE SSOO MANTENIMIENTO.
Memoria Cachés. Universidad de SonoraArquitectura de Computadoras2 Introducción Caché es el nivel de memoria situada entre el procesador y la memoria.
BUS DE DATOS.
CONCEPTES AVANÇATS DE SISTEMES OPERATIUS Departament d’Arquitectura de Computadors (apunts de l’assignatura en format transparència) Beowulf Vs Clusters.
Clusters Presentado por : Manuel Alejandro ahumada trochez Yenny carabali.
Sistemas Operativos II MC. Daniel Fajardo Delgado INSTITUTO TECNOLÓGICO DE CD. GUZMÁN 24 de Abril de 2004.
Desarrollo de aplicaciones para ambientes distribuidos
Características de un sistema operativo
LA HISTORIA DE LOS COMPUTADORES
Introducción a los Sistemas Operativos
SISTEMAS OPERATIVOS.
FUNDAMENTOS TECNOLÓGICOS DE INFORMACIÓN
TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS
14 de diciembre de 2005 Universidad de Murcia1 Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de.
Arquitecturas Paralelas
PROGRAMACIÓN PARALELA Modelos de programación paralela Modelos computacionales Paradigmas de programación paralela Programación en memoria compartida:
PORTADA PRESENTADO A: ING EN AUTOMATICA INDUSTRIAL FABIO ANDRES LASSO POR: BAYRON DARYAN OSORIO PARQUE IMFORMATICO CARLOS ALBAN POPAYAN -CAUCA.
Un COMPUTADOR es una máquina que permite y realiza cálculos de manera automática. Se divide fundamentalmente en dos partes: el hardware y el software.
NOTA: Para cambiar la imagen de esta dispositiva, seleccione la imagen y elimínela. A continuación haga clic en el icono Imágenes en el marcador de posición.
Introducción a los SOs.
Arquitectura de Redes Lo primero que tenemos que saber es, a que nos referimos cuando hablamos de arquitectura de red, bien pues nos referimos a las tecnologías.
Tema 8: Introducción a los SOs. Tema 8: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.), Introducción.
Integrante: Yohandry Cueto Carnet: # Contenido Kernel Linux Limitaciones del Kernel Linux Kernel Mach Que es Hurd Arquitectura Ventajas Distribuciones.
Agenda  Introducción  Relevamientos de tecnologías Objetivos de la fase de relevamiento de tecnologías Principales tecnologías disponibles -OpenMosix,
Sistemas Operativos Avanzados
Tema 5: Multiprocesadores
Generación y clasificación de pc
El Microprocesador.
TARJETAS DE RED.
Por: Ernesto Y. Soto Rivas G
Cluster de Computadores de Alto Desempeño con Acceso Remoto
Como es de saber el mundo se deja llevar mucho por la competencia en el sentido tecnológico, a estas formas de competencia y de relación se les llama.
ARQUICTECTURA DE SERVIDORES
ARQUITECTURA ALTERNATIVA DE SERVIDORES SISTEMAS OPERTIVOS DE RED En un sistema operativo de red los usuarios saben que están conectados a la red y que.
Son los atributos de un sistema que son visibles para un programador, es decir aquellos atributos que impactan directamente en la ejecución lógica de un.
ARQUITECTURAS DE LOS SERVIDORES El computador tiene 2 aspectos para entender su funcionamiento al nivel de programación: Almacenamiento Procesamiento Para.
PROCESAMIENTO PARALELO SUPERCOMPUTADORAS, MULTIPROCESAMIENTO, BENCHMARKS CRUZ VAZQUEZ MA.ROSAURA CRUZ VAZQUEZ MA.ROSAURA GUERRERO REBOLLO ARTURO GUERRERO.
SISTEMAS OPERATIVOS Son un conjunto de programas destinados a permitir la comunicación entre el usuario y en computador y gestionar sus recursos.
INTRODUCCIÓN A LAS REDES DE COMPUTADORAS. ·
Computadoras de Alto Rendimiento (HPC)
Es la autorización de la información. ¿Qué es Computación?
QUE ES UNA RED Una red es un grupo de equipos de sobremesa o portátiles (y otros dispositivos de red, como impresoras) conectados entre sí El propósito.
SISTEMAS OPERTIVOS DE RED Los usuarios están conectados a la red y que pueden compartir recursos. Cada equipo ejecuta con sus propios recursos su propio.
PROCESADOR.- El procesador es el cerebro del sistema, encargado de procesar toda la información. Básicamente, es el "cerebro" de la computadora. Prácticamente,
Sistemas operativos.
Sistemas Distribuidos Conceptos Básicos Propiedades MSI. Nancy A. Olivares Ruiz.
Transcripción de la presentación:

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Arquitecturas Paralelas: Multinúcleos, Multiprocesadores, Multicomputadores y Grids Prof. Wílmer Pereira UCAB / USB / UCV

Prof. Wílmer PereiraJOINCIC 2012 Motivación La demanda de poder de computo impulsó inicialmente a procesadores más rápidos y pequeños La demanda de poder de computo impulsó inicialmente a procesadores más rápidos y pequeños La primera solución es: múltiples procesos comparten secuencialmente un CPU potente ya que la miniaturización se duplica cada 18 meses La primera solución es: múltiples procesos comparten secuencialmente un CPU potente ya que la miniaturización se duplica cada 18 meses Procesos pesados con fork (UNIX) El proceso inicial (padre) se clona El proceso producto (hijo) se ejecuta Al terminar el hijo le reporta al padre Procesos livianos con hilos (Java o C) Los hilos nacen del hilo principal Los hilos hijos ven datos del padre Si el padre termina, desaparecen sus hijos … pero hay huerfanos y zombies...

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Una segunda solución es aprovechar la enorme capacidad del hardware para tener máquinas con múltiples procesadores Una segunda solución es aprovechar la enorme capacidad del hardware para tener máquinas con múltiples procesadores Paralelismo real... … es decir, gran cantidad de CPU’s en un mismo computador o CPU’s relativamente próximos Múltiples procesadores en el mismo integrado o muy cercanos Multinúcleo y Multiprocesador Múltiples procesadores en una misma red local sin compartir RAM Multicomputador o Cluster Multicomputador o Cluster Múltiples procesadores distribuidos en Internet Grid Grid

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Modelos de paralelismo Tiempos Nano SegsMicro SegsMili Segs SOP's Homogéneos HomogéneosHeterogéneos HeterogéneosHeterogéneos Límite 80/ No acotado de CPU's

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Limitaciones del paralelismo La capacidad de minituarización, ley de Moore (fundador de INTEL) sólo se espera que se mantenga por una década o algo más... Los tiempo de reloj son del orden de los Ghz y estamos cercanos a los Thz... sin embargo... miniaturizar y acelerar disipa demasiado calor :-( En un primer momento se logra mayores prestaciones con el paralelismo...pero … la ley de Amdalh dice: La ganancia en tiempo, para máquinas paralelas, es cada vez menor a medida que se aumenta la cantidad de procesadores dado un número de procesos constante. El cuello de botella está basicamente en el bus interno de comunicación y en la memoria a compartir pues los procesos deben sincronizarse

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Afortunadamente para el paralelismo... Predicción de clima Simulación de la economía mundial Resolución de problemas con inteligencia artificial... Esto no ha podido aún se corroborado experimentalmente debido a limitaciones tecnológicos y logísticas Más reciente Gustafson y Barsis aseguran que la ley de Amdalh deja de ser válida cuando el tamaño del problema escala con el número de procesadores. Más reciente Gustafson y Barsis aseguran que la ley de Amdalh deja de ser válida cuando el tamaño del problema escala con el número de procesadores. Aplicaciones del paralelismo...

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Integrados multinucleos Problemas … Sin embargo un fallo de hardware puede afectar a todos los CPU´s Por otro lado la arquitectura ofrece más de lo que los programadores son capaces de hacer … La capacidad de miniaturización de transistores continúa y se está aprovechando para montar CPU´s dentro de la misma pastilla … Se ha logrado hasta 80 núcleos por integrado y pronto los cientos... No difieren de las máquinas multiprocesadores basadas en bus o conmutadores y además pueden compartir más componentes, por ejemplo el cache Se pueden programar con hilos y la sincronización depende del SOP

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 SOP´s en multinucleos Cada CPU con SOP independiente pero … no comparten procesos y los caches pueden tener datos incoherentes entre ellos Multiprocesadores maestro-esclavos donde el maestro ejecuta el SOP. El problema es que el maestro es un cuello de botella. Multiprocesadores simétricos (una copia del SOP en memoria). Sin embargo el SOP es una gran región crítica, habría que dividir el SOP en trozos independientes … el problema es escribir un SOP así... El manejo de regiones críticas con semáforos no funciona en términos generales pues dos CPU pueden tomar el semáforo al mismo tiempo y acceder simultaneamente a la región crítica La solución es bloquear el bus...

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Arquitectura de acceso uniforme a la memoria ( UMA ) Es inmanejable con muchos CPU´s (bus muy ocupado) aunque se solventa parcialmente usando memoria cache y memoria privada Hardware de multiprocesadores Arquitectura de acceso no uniforme a la memoria ( NUMA ) No todos los módulos tienen la misma velocidad de acceso pues la memoria remota es más lenta que la memoria local.

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 El número de cruces aumenta con n 2 por lo que con 1000 CPU´s debe haber 10 6 cruces lo cual es muy costoso. Arquitectura UMA Arquitectura UMA Acceso Uniforme a la Memoria Tener un sólo bus (aun con cache) sigue siendo una limitante a máximo 32 CPU´s. Una solución es usar interruptores de barras cruzadas Tener un sólo bus (aun con cache) sigue siendo una limitante a máximo 32 CPU´s. Una solución es usar interruptores de barras cruzadas

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Todos los programas UMA corren en máquinas NUMA más lentos La NUMA con cache coherente indica donde está cada cache y su estado. Se reparte la memoria por CPU, es decir, cada dato está en un sólo CPU: – 0-16 MB, CPU1 – MB, CPU2 … Si los CPU´s buscan datos debe hacerlo por un directorio y usar las caches Arquitectura NUMA Arquitectura NUMA Acceso no Uniforme a la Memoria Con esta arquitectura se puede aumentar la cantidad de procesadores

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012Multicomputadoras (Clusters) (Clusters) Inicialmente un PC maestro con ratón, teclado y monitor. El resto de los PC con al menos una tarjeta de red de alta velocidad y RAM propia (sin perféricos de interacción). Se conjugan multinúcleos con los clusters... Puede haber hasta una tarjeta de red para el usuario y otra para el kernel Los lenguajes de programación son particulares: MPI y PVM

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Arquitecturas Multicomputadoras Los hypercubos tienen el diámetro más pequeño que una rejilla – Rejilla 1024 sería 32 x 32 con un diámetro de 62 saltos – Hypercubo de 10 dimensiones son 1024 con un diametro de Diámetros más pequeños reducen la latencia entre nodos

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Hypercubo de 4 dimensiones

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Miscelaneos...

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Software en Clusters... El SOP debe proveeer al usuario la sensación de interatuar con un único computador Deben disponer de un middleware para administrar los procesos – Migración de procesos – Balanceo de cargas – Tolerancia a fallos Gestor de colas para administrar procesos vs recursos

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Usos y ejemplos de clusters Beowulf (se contruye con máquinas en desuso) Berkeley NOW (105 SUN Ultra 107 con Myrinet) Cluster PS2 (Universidad de Illinois con cónsolas de Play Station 2) Cluster X (2200 procesadores Apple G5 con Infiniband y Giga Ethernet) Alto rendimiento Alta disponibilidad Balanceo de carga Escalabilidad Alto rendimiento Alta disponibilidad Balanceo de carga Escalabilidad Alto rendimiento Alta disponibilidad Balanceo de carga Escalabilidad

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 Multicomputadoras USB Cluster Miranda: – 228 nodos en su mayoría multinúcleos. – Dos tarjetas de red por cada nodo Infiniband para aplicaciones de usuario (MPI) Giga Ethernet para servicios Cluster Alma mater: – 8 máquinas con procesadores dualCore y HP – Unidas a través de Giga Ethernet Multicomputadoras UCAB Cluster CIDI: – 98 máquinas a dos procesadores (no multinúcleos) – Conectados con Myrinet Cluster Ingeniería: – Alrededor de 80 nodos – Alta disponibilidad

UCAB / USB / UCV Prof. Wílmer PereiraJOINCIC 2012 MPI