La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Nagios Walc 2008 13 de Noviembre Hervey Allen Con Materias de Carlos Vicente.

Presentaciones similares


Presentación del tema: "Nagios Walc 2008 13 de Noviembre Hervey Allen Con Materias de Carlos Vicente."— Transcripción de la presentación:

1 Nagios Walc 2008 13 de Noviembre Hervey Allen Con Materias de Carlos Vicente

2 Herramienta principalmente de monitorización activa de disponibilidad Posiblemente la más utilizada en la categoría de software libre Interfaz Web CGIs escritos en C para mayor velocidad Soporta miles de nodos/servicios Introducción

3

4 Ventajas La verificación de disponibilidad se delega en plugins La arquitectura es muy simple, por lo que es fácil escribir plugins (en cualquier lenguaje) Existen docenas de plugins, muchos contribuidos por terceros Chequeos en paralelo (usando forking) Version 3 se lo hace ya mejor chequeos en paralelo.

5 Más Ventajas Programación de chequeos inteligente. Busca una distribución equitativa de la carga de la máquina que ejecuta Nagios, y la máquina siendo chequeada Configuraciones (en archivos de texto) muy detalladas y basadas en plantillas Lea su configuración al nivel de directorio. Tu decides como definir los archivos.

6 Ventajas Utiliza información topológica para determinar dependencias Diferenciación entre lo que está 'caído' y lo que está 'inalcanzable' – así no se tratar de hacer chequeos de los maquínas no 'inalcanzable' Permite definir políticas de notificación, basadas en combinaciones de: contactos y listas de contactos dispositivos y grupos de dispositivos servicios y grupos de servicios. horarios definidos por grupos o personas. El estado de servicio:

7 Ventajas Estado de Servicio: En la configuración de un servicio la option notification_options tiene lo siguiente posibilidades: d: DOWN: El servicio o host esta caido u: UNREACHABLE: Cuando el host no es visible o es inalcanzable r: RECOVERY: (OK) Cuando el host se recupero f: FLAPPING: Cuando el host se inicia o detiene, o el estado es indeterminado. n: NONE: No enviar notificaciones

8

9 Ventajas Permite acusar recibo de eventos (acknowledge) El usuario puede agregar comentarios Permite definir períodos de mantenimiento Por dispositivo o grupo de dispositivos Mantiene estadísticas de disponibilidad Detecta flappings y suprime las notificaciones Permite múltiples métodos de notificación via comandos e-mail, pager, SMS, winpopup, audio, etc... Permite definir niveles de escalamiento de notificaciones

10 Mecánica de chequeos Uno nodo o dispositivo (host) consta de uno o más servicios a chequear (PING, HTTP, MYSQL, SSH, etc) Nagios chequea periódicamente cada servicio de cada nodo y determina si ha habido algún cambio de estado: CRITICAL WARNING UNKNOWN A cada cambio de estado, se le puede asignar: Opciones de notificación (como vimos antes) Operaciones de manejo de eventos (event handlers)

11 Mecánica de chequeos Parámetros Intervalo de chequeo normal Intervalo de re-chequeo Número máximo de chequeos Período de chequeo Los chequeos de nodo (host) sólo se ejecutan cuando ninguno de los servicios responde Uno nodo (host) puede estar: DOWN UNREACHABLE

12 Mecánica de chequeos Así se puede demorar hasta que un host cambia su estado a down (no disponible/alcanzable) por el hecho de que Nagios hace un chequeo de servicios primero, después se hace el chequeo de nodo y no se considera que un host esta DOWN hasta que lo hace el chequeo 3 veces (por defecto). Puedes cambiar el numero de chequeos.

13 Concepto de Parents Nodos pueden tener parents Por ejemplo, el parent de un pc conectado a un switch seria el switch. Nos permite especificar los dependencias que hayan en la red entre maquinas, switches, routers, etc. Evita que Nagios manda alarmas si un parent ya no responde.

14 Concepto de Punto de Vista Donde queda tu servidor de Nagios en la red va a cambiar como vea y monitorea nodos y servicios. Nagios apoya el concepto de servidores en paralelo que corren en otro partes de tu red. Asi, probablement mejor que el servidor corre cerca el borde de tu red y no adentro.

15 Concepto de Punto de Vista

16 Archivos de Configuración

17 Ubicado in /etc/nagios2/ Archivos importantes: cgi.cfgControla el interfaz de Web y los opciones de seguridad. commands.cfgLos comandos que usa Nagios para notificaciones. nagios.cfgEl archive principal de configuracion conf.d/*El resto de los archivos de configuracion por servicios, grupos, nodos, etc.

18 Archivos de Configuración Bajo conf.d/* contacts_nagios2.cfgusarios y grups generic-host_nagios2.cfgplantilla host (defecto) generic-service_nagios2.cfg plantilla servicio (defecto) hostgroups_nagios2.cfgdefiniciones de grupos de hosts services_nagios2.cfgque servicios chequear timeperiods_nagios2.cfgcuando chequear y como y quien a notificar

19 Archivos de Configuración Extra o opcionales Bajo conf.d/* host-gateway.cfgdefinicion de ruta por defecto extinfo.cfginformacion extra por nodos servicegroups.cfig grupos de maquínas y servicios localhost.cfgdefinicion de monitoreo por el servidor de Nagios (localhost) pcs.cfgdefinicion de un grupos de nodos switches.cfgdefinicion de un grupo de switches routers.cfgdefinicion de un grupo de routers

20 Configuración de Plugins El paquete de nagios-plugins ya esta instalado en Ubuntu y contiene: apt.cfg breeze.cfg dhcp.cfg disk-smb.cfg disk.cfg dns.cfg dummy.cfg flexlm.cfg fping.cfg ftp.cfg games.cfg hppjd.cfg http.cfg ifstatus.cfg ldap.cfg load.cfg mail.cfg mrtg.cfg mysql.cfg netware.cfg news.cfg nt.cfg ntp.cfg pgsql.cfg ping.cfg procs.cfg radius.cfg real.cfg rpc-nfs.cfg snmp.cfg ssh.cfg tcp_udp.cfg telnet.cfg users.cfg vsz.cfg

21 Configuración Principal Parámetros que afectan al programa globalmente Archivo: /etc/nagios2/nagios.cfg Indicar la ubicación de los demás archivos de configuración Comportamiento de Nagios en general Importante ajustar para asegurar un buen desempeño en instalaciones con cientos de servicios monitorizados Ver: Tunning Nagios for Maximum Performance http://nagios.sourceforge.net/docs/2_0/tuning.html http://nagios.sourceforge.net/docs/2_0/tuning.html

22 Configuración de CGI Archivo: /etc/nagios2/cgi.cfg Configurar directorio de CGIs Autenticación y Autorización Activar autenticación en Apache vía.htpasswd (o Radius/Ldap) Listar los nombres de usuario en las variables de autorización: authorized_for_system_information authorized_for_configuration_information authorized_for_system_commands authorized_for_all_services authorized_for_all_hosts authorized_for_all_service_commands authorized_for_all_host_commands

23 Configuración de Períodos Definir períodos básicos que controlarán los chequeos, notificaciones, etc. 24 horas, 7 días a la semana Horario de trabajo Horario fuera de trabajo # '24x7' define timeperiod{ timeperiod_name 24x7 alias 24 Hours A Day, 7 Days A Week sunday 00:00-24:00 monday 00:00-24:00 tuesday 00:00-24:00 wednesday 00:00-24:00 thursday 00:00-24:00 friday 00:00-24:00 saturday 00:00-24:00 } # '24x7' define timeperiod{ timeperiod_name 24x7 alias 24 Hours A Day, 7 Days A Week sunday 00:00-24:00 monday 00:00-24:00 tuesday 00:00-24:00 wednesday 00:00-24:00 thursday 00:00-24:00 friday 00:00-24:00 saturday 00:00-24:00 }

24 Configuración de comandos de chequeo Definir cómo se van a probar los servicios # 'check-host-alive' command definition define command{ command_name check-host-alive command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 2000.0,60% -c 5000.0,100% -p 1 -t 5 }

25 Comandos de notificación Permite utilizar cualquier método de notificación, siempre que se pueda ejecutar algún comando para ello: # 'notify-by-email' command definition define command{ command_name notify-by-email command_line /usr/bin/printf "%b" "Service: $SERVICEDESC$\nHost: $HOSTNAME$\nIn: $HOSTALIAS$\nAddress: $HOSTADDRESS$\nState: $SERVICESTATE$\nInfo: $SERVICEOUTPUT$\nDate: $SHORTDATETIME$" | /bin/mail -s '$NOTIFICATIONTYPE$: $HOSTNAME$/$SERVICEDESC$ is $SERVICESTATE$' $CONTACTEMAIL$ } From: nagios@nms.localdomain To: grupo-redes@localdomain Subject: Host DOWN alert for switch1! Date: Thu, 29 Jun 2006 15:13:30 -0700 Host: switch1 In: Core_Switches State: DOWN Address: 111.222.333.444 Date/Time: 06-29-2006 15:13:30 Info: CRITICAL - Plugin timed out after 6 seconds

26 Configuración de nodos, servicios, etc Método basado en plantillas (templates) Ahorra mucho trabajo repetitivo Similar a programación OO Crear plantillas con todos los parámetros por defecto nodo genérico servicio genérico contacto genérico

27 Configuración de nodo (genérico) define host{ name generic-host notifications_enabled 1 event_handler_enabled 1 flap_detection_enabled 1 process_perf_data 1 retain_status_information 1 retain_nonstatus_information 1 check_command check-host-alive max_check_attempts 5 notification_interval 60 notification_period 24x7 notification_options d,r contact_groups nobody register 0 } define host{ name generic-host notifications_enabled 1 event_handler_enabled 1 flap_detection_enabled 1 process_perf_data 1 retain_status_information 1 retain_nonstatus_information 1 check_command check-host-alive max_check_attempts 5 notification_interval 60 notification_period 24x7 notification_options d,r contact_groups nobody register 0 }

28 Configuración de nodo define host{ use generic-host host_name switch1 alias Core_switches address 192.168.1.2 parents router1 contact_groups grupo- switches } define host{ use generic-host host_name switch1 alias Core_switches address 192.168.1.2 parents router1 contact_groups grupo- switches }

29 Configuración de Servicio (genérico) define service{ name generic-service active_checks_enabled 1 passive_checks_enabled 1 parallelize_check 1 obsess_over_service 1 check_freshness 0 notifications_enabled 1 event_handler_enabled 1 flap_detection_enabled 1 process_perf_data 1 retain_status_information 1 retain_nonstatus_information 1 is_volatile 0 check_period 24x7 max_check_attempts 5 normal_check_interval 5 retry_check_interval 1 notification_interval 60 notification_period 24x7 notification_options c,r register 0 } define service{ name generic-service active_checks_enabled 1 passive_checks_enabled 1 parallelize_check 1 obsess_over_service 1 check_freshness 0 notifications_enabled 1 event_handler_enabled 1 flap_detection_enabled 1 process_perf_data 1 retain_status_information 1 retain_nonstatus_information 1 is_volatile 0 check_period 24x7 max_check_attempts 5 normal_check_interval 5 retry_check_interval 1 notification_interval 60 notification_period 24x7 notification_options c,r register 0 }

30 Configuración de Servicio define service{ host_name switch1 use generic-service service_description PING check_command check-host-alive max_check_attempts 5 normal_check_interval 5 notification_options c,r,f contact_groups grupo-switches } define service{ host_name switch1 use generic-service service_description PING check_command check-host-alive max_check_attempts 5 normal_check_interval 5 notification_options c,r,f contact_groups grupo-switches }

31 Automatización Mantener estas configuraciones manualmente se convierte rápidamente en una carga La mejor idea es simplificar y automatizar mediante scripts http://ns.uoregon.edu/~cvicente/download/nagios-config- scripts.tar.gz http://ns.uoregon.edu/~cvicente/download/nagios-config- scripts.tar.gz O exportar desde Netdot ;-)

32 Integración de Add-ons Tiempo de ida y vuelta usando APAN

33 Mensajes a Beepers Importante integrar Nagios con un sistema de mensajes a beepers Los problemas también ocurren fuera del horario de trabajo El sistema de envío a beepers debe ser independiente de la red Utilizar un módem y una línea telefónica Pueden utilizarse paquetes como sendpage o qpage

34 Referencias http://www.nagios.org: Sitio web de Nagios http://www.nagios.org http://sourceforge.net/projects/nagiosplug: Sitio web de los plugins de Nagios http://sourceforge.net/projects/nagiosplug Nagios. System and Network Monitoring. Wolfgang Barth. Libro sobre Nagios. Muy completo. http://www.nagiosexchange.org: Sitio web de plugins no-oficiales http://www.nagiosexchange.org http://www.debianhelp.co.uk/nagios.htm: Un Tutorial para Debian de Nagios http://www.nagios.com/: Suporte Comercial para Nagios

35 M á s Recuros Pag í na Principal de Nagios http://www.nagios.org/ Nagios Plugins y Add-Ons Intercambio http://www.nagiosexchange.com/

36 Referencia

37 Dispositivos de Referencia Dhruba Raj Bhandari ( CCNA ) Additions by Phil Regnauld bhandari.dhruba@scp.com.np

38 Nagios – Vista General (Tactical Overview)

39 Pantalla de Status Detail

40 Pantalla de Service Detail

41 Tipos de Servicios

42 Muestra de una Mapa de Estatus

43 Vista General de Estatus (Status Overview)

44 Vista Sumaria de Hostgroups

45 Historia o Tendencias de Hosts

46 Histogram de un Host

47 Event Logs

48 Quien Recibe Notificationes


Descargar ppt "Nagios Walc 2008 13 de Noviembre Hervey Allen Con Materias de Carlos Vicente."

Presentaciones similares


Anuncios Google