Optativa II Carlos Quilumbaqui. ¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados,

Slides:



Advertisements
Presentaciones similares
Agenda ¿Qué es Big Data? ¿Por qué usar Big Data? ¿Quién usa Big Data? Hadoop Arquitectura de Hadoop.
Advertisements

Paper On Demand Server & Designer. ¿Por qué el Bolígrafo y Papel Digital? Porque es la forma más rápida de mover la información desde el punto de captura,
Gestar Survey Sistema de encuestas ¿Cómo puede asegurarse una eficiente y rápida recolección de información, con independencia del tipo y volumen que usted.
Guido Rubin Escalabilidad.
Introducción a servidores
Administración del Datacenter y la Nube La computación en la nube está transformando la forma en que las empresas proveen y consumen servicios de IT, bajo.
I T S S P LIC INFORMATICA SISTEMAS OPERATIVOS WINDOWS 2003 SERVER DOCENTE: L.I RAMIRO ROBLES VILLANUEVA ALUMNOS: ROGELIO CHAIDEZ CORDOBA ZENON ESTRADA.
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
ARQUITECTURA CLIENTE-SERVIDOR
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Stuart Pérez A12729.
Sistemas Operativos Distribuidos Plataforma Cliente/Servidor
INTRODUCCIÓN ESTADO DE LA TÉCNICA PROCESAMIENTO DISTRIBUIDO CON MPI PROCESAMIETNO DISTRIBUIDO DE IMÁGENES GENÉRICO CON VTK PROCESAMIENTO DISTRIBUIDO DE.
Arquitectura Orientada a Servicios (SOA)
Business Intelligence (BI) Software (Software de Inteligencia Impresario)
Modelo de Tecnología para Crédito Educativo en Chile Sistema Crédito Estudios Superiores INGRESA - Chile.
Un paseo por sus características LA NUBE PROVINCIAL Área de Modernización Servicio de Informática.
MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
Diseño e implementación de un ambiente virtualizado para un Sistema de Administración de Contenidos usando Microsoft SharePoint con cada uno de sus componentes.
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Servidores de Archivo SX-520 de XenData Una serie de servidores de archivo LTO basados en estándares IT, diseñados para los exigentes requisitos de la.
1.1.2 Sistemas de información para la gestión y para la ayuda en la toma de decisiones. Los SI contribuyen activamente a la consecución de los objetivos.
HERRAMIENTAS CASE.
Índice Introducción Big Data Arquitectura HDFS
INTEGRANTES: MARTINEZ MISHELL MEDINA ENID MENENDEZ EVELYN INTEGRANTES: MARTINEZ MISHELL MEDINA ENID MENENDEZ EVELYN.
©2013 SAP AG. Reservados todos los derechos.1 Información confidencial Hoja de referencia de SAP Business One para la plataforma SAP HANA Al igual que.
Aplicaciones del Big Data a la Inteligencia del Negocio
Aplicación para la documentación de la red de la UTEZ
OMAR SANCHEZ ROBLES HECTOR PEREZ GARCIA. “Sistemas de cómputo compuesto por un gran número de CPU´s conectados mediante una red de alta velocidad”, Tanenbaum.
DATA WAREHOUSE Equipo 9.
Redes II M. C. Nancy Aguas García. Redes Planeación Análisis y Diseño Instalación Evaluación Administración de software Mantenimiento de hardware.
Programacion Web Practica 1 Estudio de la aplicación distribuida: Apache Hadoop.
Desarrollo de aplicaciones para ambientes distribuidos
O Funcionamiento, ventajas y alcance o ESTUDIANTE: EDWIN ARAY VÉLEZ o PROFESOR: ING. JOSÉ MEDINA o FUNDAMENTOS TECNOLÓGICOS DE INFORMACIÓN.
Organizado por Agustina Tenenbaum Justina Garayzabal.
Servidores Conceptos Generales.
Despliegue de la aplicación Web
Trabajo Practico nº 6 Alumnas: Fiorella Cuervo Reist Agustina.
EL USO Y EVOLUCION DE LOS SISTEMAS DE LA INFORMATICA EN LOS PROCESOS TECNICOS ORGANIZACIÓN PARA INDAGAR SOBRE LOS CAMBIOS QUE SE HAN PRESENTADO EN EL CAMPO.
Unidad 5 EL CENTRO DE PROCESAMIENTO DE DATOS Y LA SEGURIDAD EN LA AUDITORÍA INFORMÁTICA.
Universidad Central de Venezuela Facultad de Ciencias Postgrado en Ciencias de la Computación Sistemas Distribuidos Albany Márquez.
Integrantes: Jorge Herrera M. Carlos Rodríguez R..
TELECOMUNICACIONES Y REDES
Términos y Conceptos Básicos
“Redes”.
BUSINESS INTELIGENCE. ¿PORQUE BUSINESS INTELLIGECE  La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una.
Tecnológico de Estudios Superiores Huixquilucan
COMPUTACIÓN EN LAS NUBES
Factores y Métricas que determinan la Calidad de un producto
Madeleine Zambrano.  Es una aplicación usada para desarrollar formularios de entrada de datos basados en XML.  Programa que facilita y completa a otros.
Como es de saber el mundo se deja llevar mucho por la competencia en el sentido tecnológico, a estas formas de competencia y de relación se les llama.
Cloud Computing July Palma L..
ARQUICTECTURA DE SERVIDORES
ARQUITECTURA ALTERNATIVA DE SERVIDORES SISTEMAS OPERTIVOS DE RED En un sistema operativo de red los usuarios saben que están conectados a la red y que.
Business Intelligence. ¿Por qué Business Intelligence? La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una.
Son los atributos de un sistema que son visibles para un programador, es decir aquellos atributos que impactan directamente en la ejecución lógica de un.
 La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa llegue al éxito.
Tecnologías Cliente / Servidor Capitulo II Richard Jiménez V. clienteserver.wordpress.com.
ARQUITECTURAS DE LOS SERVIDORES El computador tiene 2 aspectos para entender su funcionamiento al nivel de programación: Almacenamiento Procesamiento Para.
VIRUS Características principales
Computación en la Nube.
BUSINESS INTELIGENCE. ¿P OR QUÉ B USINESS I NTELLIGENCE ?  La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido.
Tendencia De Los Sistemas Operativos
SISTEMAS OPERTIVOS DE RED Los usuarios están conectados a la red y que pueden compartir recursos. Cada equipo ejecuta con sus propios recursos su propio.
DEFINICION Es la tecnología anti-malware que utiliza software de agente de peso ligero en el punto final protegido, mientras que la descarga de la mayoría.
Desarrollo de Aplicaciones Informáticas. Somos una empresa de reciente creación que quiere hacerse un hueco en el mercado a base de innovación. Tres integrantes.
BUSINESS INTELIGENCE. La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa.
Conociendo el modelo Cliente-Servidor
Sistemas Distribuidos Conceptos Básicos Propiedades MSI. Nancy A. Olivares Ruiz.
Conociendo el modelo Cliente-Servidor. Introducción En el mundo de TCP/IP las comunicaciones entre computadoras se rigen básicamente por lo que se llama.
Transcripción de la presentación:

Optativa II Carlos Quilumbaqui

¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados, o la combinación de los dos. Estos factores hacen que los Big Data sean difíciles de capturar, extraer, y gestionar usando métodos tradicionales. A partir del año 2012, los clústers ‘grandes’ oscilan el rango de 100 Petabyte.

Las bases de datos relacionales tradicionales, como Informix y DB2, proporcionan soluciones comprobadas para datos estructurados. A través de la extensibilidad, también gestionan datos no estructurados. La tecnología Hadoop trae técnicas de programación nuevas y más accesibles para trabajar en almacenamientos de datos masivos con datos tanto estructurados como no estructurados.

¿Qué es Hadoop? Apache ™ Hadoop ® es un proyecto de software de código abierto que permite el procesamiento distribuido de grandes conjuntos de datos a través de clusters de servidores estandar. Está diseñado para escalar desde un único servidor a miles de máquinas, con un alto grado de tolerancia a fallos. En lugar de confiar en el hardware de gama alta, la resistencia de estos clusters proviene de la capacidad del software para detectar y controlar los errores en la capa de aplicación.

Apache Hadoop tiene dos sub-proyectos principales: MapReduce - El framework que entiende y asigna el trabajo a los nodos de un clúster.MapReduce HDFS - Un sistema de archivos que se extiende por todos los nodos en un cluster Hadoop para el almacenamiento de datos. Se conectan entre sí los sistemas de archivos en muchos nodos locales para convertirlos en un sistema de archivos grandes. HDFS asume nodos fallosos, lo que logra fiabilidad por la replicación de datos a través de múltiples nodosHDFS Hadoop se complementa con un entorno de proyectos de Apache, como cerdo, Colmena yZookeeper, que extienden el valor de Hadoop y mejora su usabilidad.cerdoColmenaZookeeper

Hadoop cambia la economía y la dinámica de computación a gran escala. Su impacto se puede reducir a cuatro características sobresalientes. Hadoop permite una solución informática que es: Escalable - Los nuevos nodos se pueden agregar según sea necesario, y ha añadido sin necesidad de cambiar formatos de datos, cómo se cargan los datos, cómo se escriben empleos, o las aplicaciones en la parte superior. Rentable - Hadoop trae masiva computación paralela para servidores básicos. El resultado es una disminución considerable en el costo por terabyte de almacenamiento, que a su vez hace que sea asequible para modelar todos sus datos.

Flexible - Hadoop es esquema-menos, y puede absorber cualquier tipo de datos, estructurados o no, de cualquier número de fuentes. Los datos procedentes de múltiples fuentes se pueden unir y se agregan de manera arbitraria que permite realizar análisis más profundos que cualquier sistema puede proporcionar. Tolerante de fallas - Cuando se pierde un nodo, el sistema vuelve a dirigir el trabajo a otro lugar de los datos y seguir con el procesamiento sin perder el ritmo. Facilita el almacenamiento de información y permite hacer consultas complejas sobre las bases de datos existentes, resolviéndolas con rapidez.

El 80% de los datos del mundo no es estructurado, y la mayoría de las empresas ni siquiera tratan de utilizar estos datos en beneficio propio. Imagínese si usted podría permitirse el lujo de mantener todos los datos generados por su negocio? Imagínese si usted tenía una manera de analizar los datos? Quienes lo utilizan?? Lo utiliza el buscador de Yahoo.com, companias de Internet como Facebook, Ebay o Twitter.