Computación de alta disponibilidad Universidad Tecnológica Nacional - FRBA Autor: Gustavo Nudelman.

Slides:



Advertisements
Presentaciones similares
TEMA1. Servicios de Red e Internet. Las Redes de Ordenadores.
Advertisements

Switches, routers, hubs & “patch panels”
Que es y su funcionamiento básico
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Configuración, Evaluación y Explotación de Sistemas Informáticos
Término que se le da al conjunto de equipos de cómputo que se encuentran conectados entre si por medio de dispositivos físicos que envían y reciben -
Servicios de red e Internet
Redes y Comunicaciones
TECNOLOGIA DE NUBES JORLETH POVEDA MURCIA.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Colegio Técnico Profesional de San Sebastián.
ARP Y RARP.
REDES DE COMPUTADORAS LINA MARCELA HERRERA P ASIGNATURA:OFIMATICACARRERA: TECNOLOGIA EN INFORMATICA APLICADA UNIVERSIDAD CATOLICA MANIZALES JUNIO 2 / 2004.
MODELO TCP/IP Conectividad de extremo a extremo especificando como los datos deberian ser formateados,direccionados,transmitidos,enrutados y recibidos.
PROTOCOLOS Un protocolo es un conjunto de reglas que hacen que la comunicación en una red sea más eficiente.
REDES DE COMPUTADORAS.
DIPLOMADO EN OPERADOR DE SOFTWARE BÁSICO
ELEMENTOS DE UNA RED ( Parte I)
Presentación Elaborada Por LENID SUAREZ POSADA CAMILO RAMIREZ CARDONA Presentado A Ing. Carlos E. Molina En Su Materia REDES II.
III. Protocolo RIP Versión 1.
Procesamiento paralelo
 Sincronismo. En toda transmisión debe existir un acuerdo entre el receptor y el emisor, y pueden llegar a él de dos formas: Síncrona, es decir, utilizando.
FUNCIONES GENERALES –SELECCIÓN DE LA MEJOR RUTA –DIRECCIONAMIENTO DE LA RED.
DISPOSITIVOS PARA REDES
Introducción al modelo Cliente-Servidor Carlos Rojas Kramer Universidad Cristóbal Colón.
Especialidad: Tecnologías de la información y la comunicación. Materia: fundamentos de redes Profesor: Homero Gaviño Tema: Diferencia entre el modelo OSI.
High Availability Servicios de alta disponibilidad Surge la necesidad a raíz de la implantación de las empresas en Internet. Queremos conseguir... Mantener.
© 2014 Cisco Systems, Inc. Todos los derechos reservados.Información confidencial de Cisco Presentation_ID 1 Capítulo 11: Traducción de direcciones de.
1°C Eduardo Saldaña Arellano N.L 35
PROTOCOLO DE SPANNING-TREE Semestre 3 Capítulo 7
TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS
Los dispositivos de red son los elementos de hardware los cuales son necesarios para transmitir y recibir información, mejoran el trafico de mensajes,
1 Capítulo 21: Interacción Cliente Servidor ICD 327: Redes de Computadores Agustín J. González.
Telecomunicaciones y Trabajo Distribuido. Sistema Distribuido Recursos Servidor Red Servidor Nodo ANodo C Nodo B.
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO MODULO IV ADMINISTRACIÓN DE BASES DE DATOS Servidor de la Base de Datos E.I. L.E. Prof. Ramón Castro Liceaga SEMINARIO.
Página 1 de 33 REDES. Página 2 de 33 REDES TELEMÁTICA = Telecomunicaciones + Informática Disciplina Emisores - Receptores Canal (Transmisión de Datos)
Escuela Normal “Profr. Darío Rodríguez Cruz”
Topologías de Red.
Departamento de Informática Universidad de Rancagua
1 Ana Mercedes Cáceres Instructor: Raúl Aguilar Año 2006 [Parte I ]
1 Ana Mercedes Cáceres Instructor: Raúl Aguilar Año 2006 [Parte I ]
1 GESTIÓN DE UTILIZACIÓN DE REDES Noviembre 2013 Herramienta de Monitoreo Pandora FMS David González.
CAPA DE RED PROTOCOLOS.
5.7 Servicios no orientados a conexión. 5.8 Ruteadores.
Protocolos del modelo TCP/IP
Nerea Cano Vasickova 4ºA. 1. Conceptos básicos 1.1. Que es una red 1.2. Tipos de redes 2. Topologías de redes 3. Transmisión de datos en las redes 4.
Sustentante: Francis Ariel Jiménez Zapata Matricula: Grupo: 2 Profesora: Jose Doñe Asignatura: Sistema Operativo 2.
Ing. Elizabeth Guerrero V.
LIA. SUEI CHONG SOL, MCE..  1.- SOFTWARE BÁSICO O DE SISTEMA. Conjunto de programas imprescindibles para el funcionamiento del sistema.  2.- SOTWARE.
ARQUITECTURA ALTERNATIVA DE SERVIDORES SISTEMAS OPERTIVOS DE RED En un sistema operativo de red los usuarios saben que están conectados a la red y que.
Protocolos de comunicación TCP/IP
Ing. Elizabeth Guerrero V.
Es un conjunto de equipos informáticos conectados entre sí por medio de dispositivos físicos que envían y reciben impulsos electrónicos, ondas electromagnéticas,
* Por maria jose palacios gomez 6ª presentado a mr Edwar.
Tecnologías Cliente / Servidor Capitulo II Richard Jiménez V. clienteserver.wordpress.com.
UN GRAN SISTEMA DISTRIBUIDO.  Heterogeneidad: Esta plataforma está diseñada para correr diferentes sistemas operativos (Windows XP, Windows.
ROUTER.
UNIVERSIDAD LATINA SEGURIDAD INFORMATICA II
Ing. Horacio sagredo tejerina
Arquitectura OSI  ¿Qué es OSI?  Una sigla: Open Systems Interconnection  Conceptualmente: arquitectura general requerida para establecer comunicación.
SISTEMAS OPERTIVOS DE RED Los usuarios están conectados a la red y que pueden compartir recursos. Cada equipo ejecuta con sus propios recursos su propio.
REDES DE COMPUTADORAS. INTEGRANTES  Nayeli Ifreth Osuna Ramírez  Valeria Sánchez Manzo Segundo Cuatrimestre de Ingeniería Industrial.
Hardware de Comunicación de Datos Integrantes: Cheng, Berta Oliver, Chiru Cesar, Bernal.
Presentado por : Grisales Ramírez Jhonier las capas del modelo osi.
#REDES.. ¿Qué es una red? Conjunto de computadores, equipos de comunicaciones y otros dispositivos que se pueden comunicar entre sí, a través de un medio.
Grupo de Usuarios Linux del Uruguay UYLUG - Mario Bonilla.
Sistemas de Comunicación Magistral Nro. 6 Capa 3: Red La Capa de Red provee principalmente los servicios de envío, enrutamiento (routing) y control de.
DISEÑO DE LAN. Elementos de un Sistemas de Comunicación Emisor Receptor Canal Protocolo de enlace Otros dispositivos (modem, adaptadores, controladores.
Transcripción de la presentación:

Computación de alta disponibilidad Universidad Tecnológica Nacional - FRBA Autor: Gustavo Nudelman

Necesidad de un sistema HA Causas de downtime. (estudio realizado por IEEE) Incidentes provocados por software. (Ej Filesystem full)

Cluster Definición: Sistema distribuido compuesto por un conjunto de computadoras autónomas, interconectadas (acoplamiento fuerte), trabajando juntas en forma cooperativa como un único recurso integrado. Se interconectan, por lo general, por LAN de alta velocidad. Se realizan para aumentar el rendimiento, disponibilidad y confiabilidad de un sistema Menor costo a una supercomputadora.

High Availability (HA): Provee monitoreo de recursos y desencadenamiento de proceso failover. Balanceo de carga: Un sistema externo de monitoreo va distribuyendo el workload en los diferentes sistemas utilizando una determinada métrica HPC: los programas dividen el procesamiento en diferentes nodos del cluster Tipos de cluster Recurso: Unidad de hardware o software que opera a nivel de nodo y es responsable de proveer un servicio. ServiceGroup: Grupo de recursos que permiten que uno o mas nodos brinden un servicio Failover: Proceso por el cual un nodo asume la responsabilidad de otro nodo importando los recursos Comerciales

High Availability (HA): Tolerantes a fallas (failover). Disponibilidad de los servicios que el cluster provee. Redundancia de nodos. Implica redundancia electrica y de networking En general se utiliza la configuración activo-pasivo Cualquier servicio puede ser clusterizable LinuxHA (FREE!!)

High Availability (HA) : Proceso de failover Aplicación Servicio interno (demonio) FS Vol DG IP NIC En un proceso de failover es necesario movilizar a todo el servicegroup como muestra la figura. Los componentes de un servicegroup pueden clasificarse en 3 tipos Programas Dispositivos de Red Storage En caso de failover, deben migrarse todos los elementos de un service group. Y esto se hace comenzando por los niveles mas bajos hacia los mas altos

High Availability (HA) : Agentes Aplicación Servicio interno (demonio) FS (Ej/opt) Vol DG IP NIC Cada sistema corre un agente para monitorear cada recurso Los agentes tienen carácter de deamons y se ejecutan en background Cada Agente actualiza continuamente un recurso compartido por el sistema (IPC) con el status de su recurso que este controlando Los agentes poseen puntos de entrada (funciones) para operar el recurso. Entre ellas las comunes entre los diferentes tipos de agentes son: Online Offline Test Clean (Kill -9) Storage Net App Una vez que los recursos pasaron a ser controlados por el cluster no es de buena conducta la operación directa sobre los mismos.

Tiempo de detección de la falla: esta relacionado con la frecuencia de monitoreo (entre 60s y 300s) y debemos tomar el peor caso. Up Local: Cantidad de reintentos configurados para el agente (usado en las NIC). Bajar recursos: Llevar al resto de los recursos del service group offline. Se configura cuanto tiempo se asigna para llevar a cada recurso offline de modo no forzado. (se debe sumar cada uno de estos tiempos mas el tiempo forzado) Selección de nodo destino: Se trata de las pruebas necesarias para decidir cual es el nodo al que se hace failover. Si dicho nodo esta predeterminado este tiempo es despreciable. Up de servicios en el nodo destino: Muchas veces se deben hacer test de los recursos compartidos que van a ser tomados por el otro nodo: Ej Integridad del Filesystem High Availability (HA) : Calculo de duración del proceso de failover Si el proceso de failover se debe a un incidente. El tiempo de downtime comienza con el dicho incidente

Se trata de una conexión LAN de alta velocidad (generalmente FC configurada en baja latencia con control de errores) Mantiene el membership en cada nodo mediante “heartbeats” (mensajes UDP del tipo keepalive con información de status obtenido de los agentes) Mantiene la configuración del cluster. Los cambios en la configuración se almacenan en cada nodo ya que cualquiera puede estar activo y solo en algún momento. Se recomienda doble enlace (como muestra la figura) de manera de evitar el estado “Split Brain” en la mayoría de los productos, aumentando la confiabilidad. High Availability (HA) : Comunicaciones entre nodos

Modos de trabajo para HA Activo – Pasivo  La totalidad de los recursos se encuentran concentrados en un solo nodo llamado “master”  Es económicamente mas costosa porque se tiene un nodo totalmente pasivado Avtivo – Activo  Hay diferentes servicegroups distribuidos en los nodos  Se aprovecha la posibilidad de trabajar con mayor rendimeinto  En caso de producirse un failover, un solo nodo debe ser capáz de asumir toda la carga

Balanceo de carga Es una técnica mediante la cual se distribuye un cierto trabajo, entre varias partes todas capaces de realizar las mismas tareas Se lo conoce como “server farm” Permite tener redundancia, baja de equipos para mantenimiento programado, y también escalar horizontalmente ampliando recursos según necesidad sin demandar migraciones de datos o interrupciones de servicio. Debe existir independencia de datos entre las tareas individuales. (Esto puede constituir una desventaja)

Métricas para balanceo de carga Round-robin: Se proveen conexiones equitativas a cada servidor y el LB va rotando desde al primero hacia el ultimo a medida que entran conexiones. Analogo al funcionamiento del scheduler. Weighted round-robin: Es similar a Round Robin, pero se puede administrar según las diferentes capacidades de los servidores. La secuencia comenzara con los de mayor prioridad asignada. Least-connection: Se redirigen las conexiones a los servidores en base a cual tiene menos conexiones concurrentes al momento. Load-based: Se redirigen conexiones al servidor que se encuentre con menos Workload.

Topologías para balanceo de carga NAT Tuneling Direct Routing

Balanceo de Carga NAT El Load Balancer recibe la petición del cliente El paquete es reescrito (Nuevo socket) y es reenviado a uno de los servers de la granja El servidor procesa la petición y devuelve el resultado al Load Balancer El Load Balancer reescribe la respuesta al socket inicial que mantiene o no con el cliente. Desventaja: Sobrecarga de trafico en el Load balancer y de CPU del mismo

Balanceo de carga por IP tunneling IP Tunneling consiste en encapsular un datagrama IP dentro de otro y redirigirlo a otra máquina. La máquina receptora debe desencapsular el paquete.

Balanceo de carga por IP tunneling (2) El load balancer recibe la petición del cliente. El paquete es encapsulado y reenviado a uno de los servidores. El servidor desencapsula el paquete, procesa la petición y devuelve los resultados directamente al cliente. Pueden manejarse mas conexiones concurrentes por parte del balanceador y escalar mas servidores No Responder ARP

Balanceo de carga por Direct Routing Todas las máquinas comparten la misma IP. El load balancer enruta el paquete del cliente al servidor elegido basándose en la dirección MAC. Los demás servidores, pese a tener la misma IP, rechazarán el paquete.

Balanceo de carga por Direct Routing (2) El load balancer recibe la petición del cliente. Se elige el servidor adecuado y se enruta el paquete hacia él mediante su dirección MAC. El servidor procesa la petición y devuelve los datos al cliente directamente.

Combinación de LB Y HA Los servidores de granja, por medio del load balancer dividen la atención de las peticiones y cuando es necesario acceden a un sistema HA (En general como base de datos)

Combinación de LB Y HA (2) Load balancer formado por un cluster Activo-pasivo para firewall y distribuir sesiones TCP en farm servers.

Procesamiento paralelo (HPC) Con este tipo de cluster, se Incrementa el rendimiento de un sistema dividiendo una tarea computacional a través de diferentes nodos del cluster Aplicación creciente en Cómputo científico. Genética Sistemas de descifrado de claves de seguridad Procesamiento de imágenes Astronomía Física y matemáticas Este tipo de cluster no esta orientado a servicios comerciales. Por lo que no dispone de topologías físicas estándares. En general se trata de redes LAN de alta velocidad donde un nodo funciona como master. Es decir se encarga de distribuir el trabajo en tareas mas pequeñas para los otros nodos. Finalmente este mismo nodo se encarga de recibir los diferentes resultados, recomponerlos y generar la salida en cuestión

Linux HA Proyecto Open Source iniciado en 1999 Sistema compuesto por procesos “deamons” que controlan los recursos y se comunican con sus pares en otros nodos Bajo consumo de procesamiento < 1% en latencias superiores a 1s