Arquitectura de Google

Slides:



Advertisements
Presentaciones similares
Los motores de búsqueda
Advertisements

Rendimiento y dimensionamiento de Microsoft Operations Manager 2005.
Índice ¿Qué es Google? Historia de Google Creadores de Google
GOOGLE Arturo Salas Presentación informática 4ºB. 3ª Ev.
LLUÍS CODINA UPF MÁSTER IDEC 2009 Ciencia 2.0. Web 2.0 Contenido creado por los usuarios Redes sociales Aplicaciones en línea Colaboración L. Codina.
Intranets P. Reyes / Octubre 2004.
CSS Rogelio Ferreira Escutia. 2 Hojas de estilo cascada, mayo 2010 Definición La hojas de estilo en cascada (en inglés.
PLANES DE ESTUDIO 2010 Módulo de Especialidad en Tecnologías Web Rogelio Ferreira Escutia.
Nau Gran dHivern Intr. a la creación y gestión de páginas web Introducción a la web.
Internet y tecnologías web
Conceptos básicos de Internet
CUPS Configuración y Uso de Paquetes de Software
“ Tipos de Redes” POR TAMAÑO.
Hardware y Software de servidor
Caracterización de la red existente
PORTAL DE LA ESTADÍSTICA PANAMEÑA Marvin Aguilar A.
Telecomunicaciones y Redes
CREACION DE ESPACIOS VIRTUALES PARA TRABAJO EN EQUIPO
Hardware.
Aplicaciones Cliente-Servidor
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Virtual PC.
CICLO DE EJECUCION DE UNA INSTRUCCION
Término que se le da al conjunto de equipos de cómputo que se encuentran conectados entre si por medio de dispositivos físicos que envían y reciben -
PROTOCOLOS Y ESTANDARES DE RED
Marta Cecilia Palacio Z. Medellín, Es un sistema de información que nació en 1982 y creció en Es una gran red mundial de ordenadores. Interconectados.
FabricanteMicrosoft TipoVideoconsola de sobremesa GeneraciónSexta generación Lanzamiento 15 nov feb mar 2002 CPUIntel Coppermine Core.
Juan Manuel Velez 1 Bachillerato.  ¿Qué es Google?  Historia de Google  Productos Virtuales.
TALÍA GALARZA SORIA GESTIÓN DE INFORMACIÓN WEB-TALLER2.
SISTEMA OPERATIVO CENTOS
 Una red de computadoras es un conjunto de conexiones físicas y programas de protocolo, empleados para conectar dos o más computadoras.  Aunque hace.
Es un Sistema operativo de red. Es una de las plataformas de servicio más fiable para ofrecer acceso seguro y continuado a la red y los recursos de.
Por: Johana García* 11 Informática 2. En el ámbito de los servidores reinan los procesadores, las memorias y los discos duros, que seguramente en un futuro.
1 Consigna 2006 UPV/EHU Consigna David Fernández Acin CIDIR Bizkaia Euskal Herriko Unibertsitatea / Universidad del País Vasco XXII.
1 Aula de Informática del Centro de Participación Activa para Personas Mayores de El Ejido (Almería). Consejería Territorial de Salud y Bienestar Social.
PAULA ANDREA CHAVEZ C. GRADO: PROFESOR: JOSE WILSON QUINTERO
LA COMPUTACIÓN.
Programas computacionales para el manejo de datos, requisitos para su instalación y aplicación Jaime Escobar Melero Gerente de.
Rogelio Ferreira Escutia
1º Encuentro de EID en Unidades de Internación del INR
Virtualización de bases de datos en bibliotecas de la UNAM con el sistema ALEPH 500 versión 21 M. en I. Marcial Contreras Barrera Ing. Patricia Y. Monzón.
SERVIDORES.
Informática- R.L.G.1 Computadora: Herramienta electromecánica que facilita diversas y muy variadas tareas dependiendo del programa que se utilice. Se caracteriza.
SuperADMINISTRADOR Sistema integral. Más de 40 años recopilando sabiduría nacional con el compromiso de que ambos tengamos los SuperSISTEMAS que hemos.
CONCEPTES AVANÇATS DE SISTEMES OPERATIUS Departament d’Arquitectura de Computadors (apunts de l’assignatura en format transparència) Beowulf Vs Clusters.
GLOSARIO TIC La siguiente presentación recoge algunos términos que se deben conocer en el manejo de la educación virtual…
Katerin Henao Isaza Karen Muñoz Ossa 11 Informática HARDWARE PC VS SERVIDOR.
Ing. Cristhian Quezada Asenjo
¿Qué unidades conforman el procesador?
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO MODULO IV ADMINISTRACIÓN DE BASES DE DATOS Servidor de la Base de Datos E.I. L.E. Prof. Ramón Castro Liceaga SEMINARIO.
Taller 2.  Correo electrónico, o en inglés , es un servicio de red para permitir a los usuarios enviar y recibir mensajes mediante sistemas de.
Redes. Qué es una red? Una red es un conjunto de ordenadores conectados entre sí, que pueden compartir datos (imágenes, documentos, etc.) y recursos (una.
Almacenamiento virtual de sitios web “HOSTS VIRTUALES”
Muchas de las investigaciones sobre el comportamiento de los usuarios de la Web que se están realizando en poblaciones de personas nacidas posteriormente.
ADR – TP Anual. Indice Arquitectura General Disponibilidad 7 x24 Servidores Utilizados Infraestructura Interna Servidores / Pcs Usuario Arquitectura Detallada.
 Un motor de búsqueda, también conocido como buscador es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider»
Introducción a la informática
La administración de dominios
PROCESADORES DAVID ALCALÁ JHONNY POSADA LESLY MARTINEZ LADY MUNAR.
ORGANIZACIÓN DE COMPUTADORAS DRA. LETICIA FLORES PULIDO.
PROCESAMIENTO PARALELO SUPERCOMPUTADORAS, MULTIPROCESAMIENTO, BENCHMARKS CRUZ VAZQUEZ MA.ROSAURA CRUZ VAZQUEZ MA.ROSAURA GUERRERO REBOLLO ARTURO GUERRERO.
APACHE WEB SERVER El proyecto Apache Web Server es un desarrollo de software en colaboración, enfocado en crear una implementación de un servidor HTTP.
Elementos básicos para sistemas WEB. Que es la WEB Web es una tecnología que opera sobre internet que lleva propuesta desde El sistema de documentos.
Internet Internet es una red de alcance mundial, compuesta por redes de datos privadas y públicas que se comunican entre si, independientemente del hardware.
Tema : Selección del tipo de Computadora (Hardware)
Universidad Metropolitana Introducción a la Computación Universidad Metropolitana Introducción a la Computación Septiembre, 2007 Arquitectura Von Newman.
Es un servicio de red que permite a los usuarios enviar y recibir mensajes y archivos rápidamente mediante sistemas de comunicación electrónicos. Correo.
 Software  Humanware  Hardware Conformado por.
COMPUTER DATA SYSTEMS. INTRODUCCION A LA INFORMATICA Tipos de computadoras:
Al seleccionar una red es importante conocer los elementos que la componen, entre estos elementos contamos con: el equipo de cómputo que se estará utilizando.
Transcripción de la presentación:

Arquitectura de Google Universidad de Costa Rica Escuela de Ciencias de la Computación e Informática M.Sc. Kryscia Daviana Ramírez Benavides

Introducción Google fue fundada el 7 de septiembre de 1998 por Larry Page y Sergey Brin. Google se enfocó en: Poner entre las primeras diez páginas lo que el usuario promedio está buscando. Construir un sistema que la mayoría de las personas puedan utilizar sin problemas. Guardar todos los documentos que se encuentren en el rastreo.

Introducción (cont.) Primera oficina de Google. Consiguió hacer funcionar varias máquinas totalmente diferentes con un impresionante rendimiento. Una máquina hecha a medida, con techo de LEGO. Go lego!!!  Google!!! Tomado de http://royal.pingdom.com/2009/03/02/original-google-setup-at-stanford-university/.

Características Sus principales ventajas se deben a que es muy rápido, y sus resultados son relevantes y bastante bien ordenados. Para jerarquizar sus páginas utiliza diversos factores tales como modelo vectorial, texto de enlaces, Page Rank. Google analiza más de 100 factores para determinar la relevancia de una página Web. Entre ellos, destacan el texto del enlace (anchor text), el tamaño de la fuente y la proximidad.

Características (cont.) Google indexa más de 3 mil millones de páginas Web, aunque ofrecen más resultados gracias a los “rastreos profundos”. Hay varios “rastreadores” (crawlers): El general (una vez al mes), que busca en la mayoría de la WWW. El Fresh, que rastrea en las páginas que se actualizan frecuentemente. El de noticias, que rastrea cada 10 minutos.

Características (cont.) Hay 4 tipos de servidores en el clúster de Google, situados en paralelo del servidor Web: Tomado de http://es.wikipedia.org/wiki/Plataforma_de_Google.

Arquitectura de Google Tomado de http://infolab.stanford.edu/~backrub/google.html.

Hardware Especificaciones del hardware del año 2003: Más de 15.000 servidores con velocidades comprendidas entre el Intel Celeron de 533 MHz y el Pentium III a 1,4 GHz dual (a fecha de 2003). Según Paul Strassman, Google tendría en 2005 unos 200.000 servidores mientras que algunas fuentes indican que el número de servidores podría haber alcanzado los 450.000 en 2006. Uno o más discos duros de 80 GB por servidor (en 2003). Entre 2 y 4 GB de memoria por máquina.

Hardware (cont.) El tamaño exacto de los centros de datos que Google utiliza es desconocido, y las cifras oficiales se mantienen poco precisas intencionadamente. Según una estimación del año 2000, la granja de servidores de Google estaba compuesta por 6000 procesadores, 12.000 discos duros IDE (dos por máquina). Cada centro tenía una conexión de fibra óptica de 2488 Mbit/s y otra de 622 Mbit/s. Los servidores ejecutan un software llamado Google Web Server.

Hardware (cont.) Actualmente Google está desarrollando un supercomputador en un centro de datos en Dallas. El proyecto se llama Proyecto O2 y se espera que incremente sustancialmente la capacidad de su red global actual, permitiendo ejecutar miles de millones de búsquedas al día y un catálogo de otros servicios que cada vez crece más.

Topología de Red Se estima que Google mantiene más de 450.000 servidores, ordenados en racks de clusters en varias ciudades del mundo. Es por eso que Google puede ofrecer un servicio más rápido a los usuarios. En el año 2005 Google había indexado 8.000 millones de sitios Web. Cuando se hace conexión a Google, los servidores DNS traducen la dirección www.google.com a varias IP's distintas, permitiendo que se distribuya la carga entre varios clusters.

Topología de Red (cont.) Cada cluster tiene miles de servidores. Los racks de Google están hechos a medida y pueden contener entre 40 y 80 servidores. Cada rack tiene una conexión ethernet a un router local que a su vez se conecta al router central utilizando una conexión de 1 Gigabit. Un rack es algo así como: 88 dual-CPU 2Ghz servidores Intel Xeon con 2Gbytes de RAM y un disco duro de 80Gbytes.

Topología de Red (cont.) Arquitectura típica de un balanceador de carga. Un centro de datos donde se pueden ver varios racks. Tomado de http://es.wikipedia.org/wiki/Plataforma_de_Google.

Operaciones de los Servidores La mayoría de operaciones son de solo lectura. En la actualización de datos, las consultas se envían a otros servidores, para simplificar los problemas de consistencia. Las consultas se dividen en subconsultas y se envían por diferentes canales en paralelo, reduciendo así el tiempo de latencia. En los fallos de hardware se utiliza tecnología RAID. El software también está diseñado para gestionar los fallos. Cuando un servidor se cae, los datos todavía están disponibles en otros servidores. Los racks de Google están hechos a medida y pueden contener entre 40 y 80 servidores. Cada rack tiene una conexión ethernet a un router local que a su vez se conecta al router central utilizando una conexión de 1 Gigabit.

Implementación Los lenguajes de programación utilizados son: La amplia mayoría de los módulos que componen la arquitectura están implementados en C y C++. Ejecución sobre Solaris y Linux. Los Crawlers y el Servidor de URLs están implementados en Perl.

Referencias Bibliográficas La información fue tomada de: http://es.wikipedia.org/wiki/Google. http://en.wikipedia.org/wiki/Google_platform. http://www.maxglaser.net/arquitectura-original-de-google/. http://www.promocionarweb.com/google/arquitectura.htm. http://www-gist.det.uvigo.es/~martin/nst/google.pdf. http://google.dirson.com/. http://royal.pingdom.com/2009/03/02/original-google-setup-at-stanford-university/.