S ISTEMA PARA EL A NÁLISIS Y P ROCESAMIENTO DE LOS LOGS DE LOS SERVIDORES DE RED DE LA F ACULTAD DE I NGENIERÍA EN E LECTRICIDAD Y C OMPUTACIÓN (FIEC)

Slides:

Advertisements

Presentaciones similares

Plataforma de Software DocAve S oftware de gestión de infraestructura para Microsoft SharePoint.

Advertisements

Descripción técnica de Microsoft Virtual Server 2005 R2.

ADMINISTRAR EL DESEMPEÑO Y LA CAPACIDAD

Desarrollo de aplicaciones para ambientes distribuidos

I T S S P LIC INFORMATICA SISTEMAS OPERATIVOS WINDOWS 2003 SERVER DOCENTE: L.I RAMIRO ROBLES VILLANUEVA ALUMNOS: ROGELIO CHAIDEZ CORDOBA ZENON ESTRADA.

com Soluciones Avanzadas de Hosting Somos un sitio en la internet que nace con un ideal de tener una mejor alternativa para trabajar.

Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.

Stuart Pérez A12729.

Sistemas Operativos Distribuidos Plataforma Cliente/Servidor

Mario González Díez Jefe de la Unidad de Explotación

Autor: Carlos Gómez Martínez Directores: Nicolás Padilla Soriano

GUÍA PARA LA AUDITORÍA INFORMÁTICA

SILVIA BEATRIZ GAVILANES NARANJO KELLY VERÓNICA CARVAJAL CUJI

“SISTEMA DE PASANTÍAS PARA LA FACULTAD DE INGENIERÍA

MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

Diseño e implementación de un ambiente virtualizado para un Sistema de Administración de Contenidos usando Microsoft SharePoint con cada uno de sus componentes.

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniería en Electricidad y Computación TESINA DE SEMINARIO Presentado por: César Augusto Jara Ordoñez.

¿Qué es ZABBIX? Zabbix esta diseñado para monitorear y registrar el estado de varios servicios de red, Servidores, hardware de red, alertas y visualización.

Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.

Sistema Para GENERAR gráficas a partir de logs tcpdump usando Hadoop

Es un Sistema operativo de red. Es una de las plataformas de servicio más fiable para ofrecer acceso seguro y continuado a la red y los recursos de.

Bases de Datos Distribuidas, Paralelas, Replicación y la WWW

Protección del sistema La protección de la red comienza inmediatamente después de la instalación. Un sistema que cubra muchas necesidades, antes de.

Denisse Cayetano – Christian Rivadeneira

MICROSOFT EXCHANGE PRESENTADO POR: LEONARDO GONGORA HERRERA PRESENTADO A: INGENIERO FABIO Andrés Lasso PARQUE INFORMATICO CARLOS ALBAN TECNICO LABORAR.

Índice Introducción Big Data Arquitectura HDFS

Proyecto de Establecimiento de Servicio E-Learning para PYMES Sistema de e-learning para MIPYME Metodología abierta, colaborativa y participativa.

Redes II M. C. Nancy Aguas García. Redes Planeación Análisis y Diseño Instalación Evaluación Administración de software Mantenimiento de hardware.

PROYECTO CLUSTERS NNOPPIX OPENMOSIX Ruben Albiach Juan Ballester López Freyder Espinosa Valencia Berna Ramon Sergio Fresneda David Malder Rafa SIMR PRIMERO.

Programacion Web Practica 1 Estudio de la aplicación distribuida: Apache Hadoop.

Introducción al modelo Cliente-Servidor Carlos Rojas Kramer Universidad Cristóbal Colón.

Katerin Henao Isaza Karen Muñoz Ossa 11 Informática HARDWARE PC VS SERVIDOR.

Particiones de Disco Prof Jennyfer Briceño.

TRABAJO DE INTERNET 1 Alumno: TORRES EDINSON Profesor: VICTOR ESPINOZA

Alma Rosa Colín González. Las aplicaciones distribuidas se han convertido en un aspecto fundamental en los negocios y la industria a nivel mundial. INTRODUCCIÓN.

Despliegue de la aplicación Web

SPA S ISTEMA DE P LANIFICACIÓN A CADÉMICA Erika Lara – Daniel Plúa FACULTAD DE INGENIERÍA EN ELECTRICIDAD Y COMPUTACIÓN Y COMPUTACIÓN TESIS DE GRADO 2006.

16-mar-08 E-learning Institucional Por: Oskart Ramírez Programador E-learning UNIVERSIDAD VIRTUAL RICARDO PALMA CENTRO DE EDUCACION VIRTUAL.

Escuela Superior Politécnica del Litoral

Integrantes: Jorge Herrera M. Carlos Rodríguez R..

16-mar-08 E-learning Institucional Por: Oskart Ramírez Programador E-learning UNIVERSIDAD VIRTUAL RICARDO PALMA CENTRO DE EDUCACION VIRTUAL.

Informe de Materia de Graduación “Uso de la plataforma Pig sobre Hadoop como alternativa a una RDBMS para el análisis de datos masivos. Prueba de concepto.

Agenda  Introducción  Relevamientos de tecnologías Objetivos de la fase de relevamiento de tecnologías Principales tecnologías disponibles -OpenMosix,

S.O. WINDOWS SERVER 2003.

CENTROS DE DATOS Y COMPUTACIÓN EN LA NUBE

María José Freire Mayra Coello Juan Francisco Pérez

SOFWARE DE SERVIDOR. Administración de Sistemas Operativos en Red.

Windows server 2008 es un sistema operativo para servidores diseñado por Microsoft.

INGENIERIA DEL SOFTWARE DEL COMERCIO ELECTRONICO CLIENTE/SERVIDOR

Ediciones de Windows 2003  Web Edition Servidor Web Servidor Web Servicios WebServicios Web Aplicaciones WebAplicaciones Web Integración con Plataforma.NET.Integración.

UNIVERSIDAD LATINA II. FUNCIONES DEL ADMINISTRADOR.

ARQUITECTURA ALTERNATIVA DE SERVIDORES SISTEMAS OPERTIVOS DE RED En un sistema operativo de red los usuarios saben que están conectados a la red y que.

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniería en Electricidad y Computación “Envío de electrocardiograma a través de Internet usando.

WINDOWS SERVER Servicios para Programas y aplicaciones basadas en Internet. Windows 2000 Server facilita la implementación de: comercio electrónico,

Replicación Bases de Datos Distribuidas Ing. Fernando Ortiz Ahumada.

Propuestas arquitectónicas para servidores Web distribuidos con réplicas parciales Septiembre de 2005 Autor: José Daniel García Sánchez Directores:Jesús.

PRESENTACIÓN. DISEÑO E IMPLEMENTACIÓN DE UN SITIO WEB INTERACTIVO COMO HERRAMIENTA DE APOYO DOCENTE EN LAS ASIGNATURAS DEL PROGRAMA DE INGENIERIA DE SISTEMAS.

APACHE WEB SERVER El proyecto Apache Web Server es un desarrollo de software en colaboración, enfocado en crear una implementación de un servidor HTTP.

Soluciones en Gestión Documental.

SISTEMAS OPERTIVOS DE RED Los usuarios están conectados a la red y que pueden compartir recursos. Cada equipo ejecuta con sus propios recursos su propio.

Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.

“Microsoft Windows Server 2008, diseñado para ofrecer a las organizaciones la plataforma más productiva para virtualización de cargas de trabajo, creación.

¿Cuál especificación hace referencia a la velocidad del microprocesador del equipo? 12 GB 2.0 GHz 24 X 12 GB 2.0 GHz 56 K V x 600 ppp 56 K V.90.

Ayudar a proteger y a administrar contenidos Obtener información y ampliar los conocimientos Información disponible, siempre conectados Organización.

Optativa II Carlos Quilumbaqui. ¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados,

Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.

 Definir conceptos fundamentales de las BDD como DTM y DBMS.  Conocer el esquema actual de la Base de datos de la UNACH.  Analizar cuándo utilizar.

Curso “Capacitación en Tutoría Virtual”

*Pérez Pérez Diana Karen *Sánchez García José Luis *Valdespino Hinojosa Erick.

Fedora es una distribución linux para propósitos generales basada en RPM, que se caracteriza por ser un sistema estable. ¿Quiénes son sus creadores? El.

Transcripción de la presentación:

S ISTEMA PARA EL A NÁLISIS Y P ROCESAMIENTO DE LOS LOGS DE LOS SERVIDORES DE RED DE LA F ACULTAD DE I NGENIERÍA EN E LECTRICIDAD Y C OMPUTACIÓN (FIEC) DE LA ESPOL USANDO HADOOP ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniería en Electricidad y Computación INTEGRANTES: Eddy Roberto Espinosa Daquilema Josué Jefferson Guartatanga Robayo

Datos vs. Información P ROBLEMA A RESOLVER

J USTIFICACIÓN Existen herramientas con precios altos No muestran resultados deseados Rendimiento deficiente / tiempo extenso No son distribuidas ni escalables

A LCANCE Visitas/Recursos/Navegadores Correos Acceso de usuarios/Recursos Información de los servidores: Cedro(HTTP), Ceibo(Maillog) y Palma(Samba).

H ADOOP Plataforma -> aplicaciones escalablesDesarrollador enfoca -> lógica de negocioCorre en cluster / (HDFS)Map/Reduce

H IVE Infraestructura para data warehouse que provee sumarización de datos y soporta Ad-hoc queries Aplicaciones Logs Minería Datos Indexación documentos Inteligencia Negocios Modelamiento predictivo y Prueba de hipótesis

F ORMATO DE L OGS Ceibo genera archivos tipo MaillogPalma posee un servidor Samba.Cedro posee un Servidor Apache HTTP

D ISEÑO DE LA SOLUCIÓN

C LAVES Y V ALORES

C ÓDIGO B ASE : M APPER /R EDUCER DE C EDRO

C ÓDIGO B ASE : M APPER /R EDUCER DE C EIBO

C ÓDIGO B ASE : M APPER /R EDUCER DE P ALMA

T IEMPOS nodos Tiempo (minutos) tiempo (min) carga 37.2 MB / GB Palma ConcatenaPalma AccesosPalma Recursos Nodos # prueba 16,7831,9331,3670,4670,3500,2670,4170,6200,333 26,8331,9671,9830,4500,6200,3170,5330,2200,350 37,0173,0201,6830,5170,2000,3000,5500,2400,350 47,6833,5171,6830,5500,2100,3330,5330,2200,350 56,8334,3501,2670,5170,2700,3000,4330,6000,300 66,3834,4172,0500,7170,2200,3170,5170,2200,317 79,6835,6671,6330,4830,2100,3000,4500,6300,400 86,1674,3171,4830,4670,6000,2830,4500,2400,300 98,6334,2671,2830,4330,5900,4170,5000,6800, ,3505,3671,3330,5170,2300,3170,5170,2000,317 promedio7,2373,8821,5770,5120,3500,3150,4900,3870,333 Var. Std.1,1241,2730,2810,0810,1800,0400,0480,2130,030

A PLICACIÓN NO D ISTRIBUIDA Carga 10 GB

A PLICACIÓN D ISTRIBUIDA

C ONCLUSIONES Estable entre 5 y 10 nodos con carga 1GB. Procesamiento secuencial es extenso con archivos de gran tamaño. El modelo distribuido es una solución escalable y la tolerancia a fallos se puede controlar.

R ECOMENDACIONES Asignar suficiente espacio en disco para la instalación. Familiarizarse con el entorno que ofrece Hadoop y su aplicación Hive.

F IN