Conceptos de Hadoop Rogelio Ferreira Escutia

Slides:



Advertisements
Presentaciones similares
Evolución de la Tecnologías para el Desarrollo de Aplicaciones Distribuidas Rogelio Ferreira Escutia.
Advertisements

Búsqueda en la Web Rogelio Ferreira Escutia. 2 Cómo funciona La Web, 2008http:// Anatomía de la Web.
“Problemas con la seguridad”
Tendencias de Construcción Web
“Ingeniería de Software para Ambientes Web”
Redes Sociales Rogelio Ferreira Escutia.
“CSS - Texto” Rogelio Ferreira Escutia.
Android TV Rogelio Ferreira Escutia.
Rogelio Ferreira Escutia
“Android – Comunicaciones con HTTP”
“CSS - Colores” Rogelio Ferreira Escutia.
“Web Services” Rogelio Ferreira Escutia.
“Android – Geolocalización”
“Tendencias 2015: Foro Económico Mundial”
“Análisis de la Situación Actual de la
“Flat Design” Rogelio Ferreira Escutia.
“Tecnologías para Construir el
Rogelio Ferreira Escutia
“HTML – Estructura” Rogelio Ferreira Escutia.
“Definición de CRM” Rogelio Ferreira Escutia.
Módulo de Especialidad en
“Conceptos sobre IOS” Rogelio Ferreira Escutia.
“Análisis de la Situación Actual
“HTML – Imágenes” Rogelio Ferreira Escutia.
“Recomendaciones para el Arranque de Clases”
BIG DATA e INTERNET DE LAS COSAS
“HTML – Manejo de Texto”
“Instalación” Rogelio Ferreira Escutia.
“Grid Computing” Rogelio Ferreira Escutia.
“Análisis de Aplicaciones E-Commerce”
“Android – Distribución de Componentes”
“Internet de las Cosas y Big Data” Rogelio Ferreira Escutia
“Internet de las Cosas”
“Arduino - Herramientas” Rogelio Ferreira Escutia
Múltiples Pantallas Rogelio Ferreira Escutia
“Taller de Videojuegos con HTML 5”
“Viviendo la Era del Big Data”
“Internet de las Cosas en la Salud” Rogelio Ferreira Escutia
“Proyectos de IoT” Rogelio Ferreira Escutia
Marketing - “Presencia Digital” Rogelio Ferreira Escutia
Rogelio Ferreira Escutia
“Tipos de Sensores” Rogelio Ferreira Escutia
“Conceptos de Internet de las Cosas” Rogelio Ferreira Escutia
“Arduino - Historia” Rogelio Ferreira Escutia
“Raspberry Pi - RFID” Rogelio Ferreira Escutia
Almacenamiento con File I/O Ejemplo Rogelio Ferreira Escutia
“Proporción Áurea” Rogelio Ferreira Escutia.
“Creación del Hola Mundo”
Data Centers - “Conceptos” Rogelio Ferreira Escutia
“Tecnologías para construir el Internet de las Cosas”
Marketing - “Posicionamiento” Rogelio Ferreira Escutia
“Herramientas” Rogelio Ferreira Escutia
“Construyendo el Internet de las Cosas”
“Android – Componentes Básicos de la Interface”
Material para “Internet de las Cosas” Rogelio Ferreira Escutia
“Proyectos de Big Data” Rogelio Ferreira Escutia
Conceptos sobre Sistemas Operativos Rogelio Ferreira Escutia
“Funcionamiento” Rogelio Ferreira Escutia.
“Tipos de Antenas” Rogelio Ferreira Escutia.
“Material Design” Rogelio Ferreira Escutia.
“Raspberry Pi - Herramientas” Rogelio Ferreira Escutia
Múltiples Idiomas Rogelio Ferreira Escutia
Marketing - “Modelos de Negocio” Rogelio Ferreira Escutia
MPI - “Programación” Rogelio Ferreira Escutia
Marketing - “Análisis de Sitios” Rogelio Ferreira Escutia
“Amazon Web Services - Conceptos”
“Multiplexado y demultiplexado de señales:
Rogelio Ferreira Escutia
“User Experience” Rogelio Ferreira Escutia.
Evolución de los Sistemas de Bases de Datos Rogelio Ferreira Escutia
Transcripción de la presentación:

Conceptos de Hadoop Rogelio Ferreira Escutia

Conceptos

Google Modular Data Center Desde que apareció Google en 1996, la cantidad de datos que debía almacenar para su algoritmo PageRank de búsqueda y procesamiento de datos fué creciendo. De lo anterior, Google prefirió diseñar y construir su propia tecnología en vez de comprarla y de ahí surge su proyecto “Google Modular Data Center” para empezar a estandarizar y adecuar sus centros de datos. Cada Módulo incluye su propia fuente de poder, aire acondicionado y soporte para 1000 servidores modulares con Linux. 3 "Next Generation Databases", Guy Harrison, Apress Media 2015

Google Modular Data Center 4 "Next Generation Databases", Guy Harrison, Apress Media 2015

Software de Google Google desarrolló el siguiente software para sus propios centros de datos: Google File System(GFS): un sistema de archivos distribuido. MapReduce: un framework de procesamiento distribuido para paralelización de algoritmos. BigTable: un sistema norelacional de base de datos que utiliza GFS para el almacenamiento. 5 "Next Generation Databases", Guy Harrison, Apress Media 2015

Software de Google 6 "Next Generation Databases", Guy Harrison, Apress Media 2015

MapReduce MapReduce es un modelo de programación paralela para propósitos generales que se divide en 2 fases: Mapping: Se dividen las peticiones para ser procesadas por hilos en diferentes computadoras. Reduce: Se combinan las salidas del mapping para obtener una salida final. 7 "Next Generation Databases", Guy Harrison, Apress Media 2015

MapReduce 8 "Next Generation Databases", Guy Harrison, Apress Media 2015

MapReduce 9 "Next Generation Databases", Guy Harrison, Apress Media 2015

MapReduce Tabla comparativa: 10 "Hadoop The Definitve Guide", Tom White, 4 Edición O’Reilly Media

Primeras Implementaciones

Yahoo (2008) Yahoo anunció en 2008 un cluster usando Hadoop con 5 petabytes de almacenamiento y mas de 10,000 núcleos. Este sistema fué utilizado para crear el índice y las búsquedas del motor de Yahoo. 12 "Next Generation Databases", Guy Harrison, Apress Media 2015

Google (1998) Primer servidor de Google: 13 "Google data centers", https://en.wikipedia.org/wiki/Google_data_centers, marzo 2019

Facebook (2008) Facebook empezó a trabajar con Hadoop en el 2007, y en 2008 ya tenía en funcionamiento 2,500 CPUs. En el 2012 el cluster Hadoop de Facebook ya superaba los 100 petabytes en almacenamiento. 14 "Next Generation Databases", Guy Harrison, Apress Media 2015

Rogelio Ferreira Escutia Instituto Tecnológico de Morelia Departamento de Sistemas y Computación Correo: rogelio@itmorelia.edu.mx rogeplus@gmail.com Página Web: http://sagitario.itmorelia.edu.mx/~rogelio/ http://www.xumarhu.net/ Twitter: http://twitter.com/rogeplus Facebook: http://www.facebook.com/groups/xumarhu.net/