Plataforma de Google
Los centros de datos de Google son grandes instalaciones de procesamiento de datos que Google utiliza para proporcionar sus servicios que, combinan grandes unidades, nodos informáticos organizados en pasillos de racks, redes internas y externas, controles ambientales (principalmente control de enfriamiento y humidificación) y software de operaciones (especialmente en lo que respecta a balance de carga y tolerancia a fallos).
No hay datos oficiales sobre cuántos servidores hay en los centros de datos de Google, sin embargo, Gartner estimó en un informe de julio de 2016 que Google en ese momento tenía 2,5 millones de servidores. Este número está cambiando a medida que la empresa amplía su capacidad y actualiza su hardware.[1]
Ubicaciones
Las ubicaciones de los distintos centros de datos de Google por continente son las siguientes:[2]
- Condado de Berkeley, Carolina del Sur
- Council Bluffs, Iowa
- The Dalles, Oregón
- Condado de Douglas, Georgia
- Henderson, Nevada
- Condado de Jackson, Alabama
- Lenoir, Carolina del Norte
- Condado de Loudoun, Virginia
- Condado de Mayes, Oklahoma
- Midlothian, Texas
- Condado de Montgomery, Tennessee
- New Albany, Ohio
- Papillion, Nebraska
- Condado de Storey, Nevada
- Quilicura, Chile
- Dublín, Irlanda
- Eemshaven, Países Bajos
- Fredericia, Dinamarca
- Hamina, Finlandia
- Middenmeer, Países Bajos
- Saint-Ghislain, Bélgica
- Condado de Changhua, Taiwán
- Singapur[2]
Topología de red
A pesar de que no se conocen las cifras exactas, se estima que Google mantiene más de 2.000.000 de servidores,[3] ordenados en racks de clusters en varias ciudades del mundo. Los principales centros se encuentran en Mountain View (California), Virginia, Memphis Atlanta y Dublín. Hay otras instalaciones en construcción en The Dalles[4] y Saint-Ghislain.[5] En 2009 Google inauguró otra instalación ecológica en Council Bluffs cerca de una fuente abundante de energía eólica y de una red de fibra óptica. Gracias a la dispersión geográfica de sus servidores, Google puede ofrecer un servicio más rápido a los usuarios, lo cual es vital teniendo en cuenta que en el año 2005 Google había indexado 8.000 millones de webs.[6]
Cuando alguien intenta conectarse a Google, los servidores DNS traducen la dirección www.google.com a varias IP's distintas permitiendo que se distribuya la carga entre varios clusters. Cuando un dominio tiene varias IP's, como en el caso de Google, el orden en que los servidores DNS traducen las direcciones IP se calcula mediante el sistema de planificación Round-robin.
Cada cluster de Google tiene miles de servidores, por lo que cuando alguien se conecta a un cluster, se distribuye la carga de nuevo mediante el hardware del cluster para enviar la consulta al servidor web que esté menos ocupado en ese momento.
Los racks de Google están hechos a medida y pueden contener entre 40 y 80 servidores.[7] Cada rack tiene una conexión ethernet a un router local que a su vez se conecta al router central utilizando una conexión de 1 Gigabit.[cita requerida]
Tipos de servidores
La infraestructura de servidores de Google está dividida en varias categorías, cada una con un propósito diferente:[7]
- Los distribuidores de carga aceptan la petición del cliente y la reenvían a uno de los servidores web de Google a través de servidores proxy Squid.
- Los servidores proxy Squid aceptan la petición y devuelven el resultado desde la caché local si es posible y si no reenvían la petición al servidor web.
- Los servidores Web coordinan la ejecución de las consultas enviadas por los usuarios y formatean el resultado utilizando el lenguaje HTML. La ejecución consiste en enviar peticiones a servidores de índices, fusionar los resultados, calcular su rango utilizado PageRank, elaborar un resumen para cada resultado, preguntar por posibles sugerencias a los servidores de ortografía y finalmente obtener una lista de anuncios del servidor de publicidad.
- Los servidores de recolección de datos están dedicados permanentemente a navegar por Internet al estilo araña. Van actualizando el índice y las bases de datos de documentos con las páginas web que van encontrando y aplican los algoritmos de Google para calcular el rango de cada página.
- Los servidores de índices contienen un conjunto de trozos de índice. Devuelven una lista de id's de documentos, llamados "docid", de forma que los documentos a los que identifican contienen la palabra que el usuario está buscando. Estos servidores necesitan menos espacio en disco, pero en cambio soportan una carga de procesador bastante elevada.
- Los servidores de documentos sirven para almacenar los documentos. Cada documento se almacena en docenas de servidores de documentos. Cuando alguien realiza una búsqueda, el servidor de documentos devuelve un resumen de la página basado en las palabras buscadas por el usuario. También puede devolver el documento entero directamente si se lo solicitan. Estos servidores requieren bastante espacio de disco.
- Los servidores de anuncios (ad servers) gestionan la publicidad de los servicios AdWords y AdSense.
Hardware y Software de los servidores
Hardware original
El hardware original que utilizaba Google al poco tiempo de su fundación, cuando aún estaba en la Universidad de Stanford incluía los siguiente:[8]
- Sun Ultra II con procesador de 200MHz dual y 256 MB de RAM. Esta era la máquina principal del sistema original.
- Dos servidores Pentium II duales a 300 MHz donados por Intel que incluían 512 MB de RAM y 8 discos de 9 GB entre los dos servidores. Era en estos servidores donde se ejecutaba la parte principal de la búsqueda.
- F50 IBM RS/6000 donado por IBM que incluía cuatro procesadores, 512 MB de memoria y ocho discos duros de 9 GB.
- Dos armarios adicionales incluían tres discos duros de 9 GB y seis de 4 GB respectivamente que estaban conectados al servidor Sun Ultra II.
- Un armario de expansión de discos de IBM con otros ocho discos duros de 9 GB donados por IBM.
- Armario de disco duros casero que contenía 10 discos duros de 9 GB SCSI.
Hardware de producción
Especificaciones:Más de 15.000 servidores con velocidades comprendidas entre el Intel Celeron[7] de 533 MHz y el Pentium III a 1,4 GHz dual (a fecha de 2003). Según Paul Strassman Google tendría en 2005 unos 200.000 servidores[9] mientras que algunas fuentes indican que el número de servidores podría haber crecido y las cifras oficiales se mantienen poco precisas intencionadamente. Según una estimación del año 2000, la granja de servidores de Google estaba compuesta por 6000 procesadores, 12.000 discos duros IDE (dos por máquina) en cuatro centros físicos: dos en Silicon Valley y dos en Virginia.[10] Cada centro tenía una conexión de fibra óptica de 2488 Mbit/s y otra de 622 Mbit/s. Los servidores ejecutan un software llamado Google Web Server.
A partir de 2014, Google ha utilizado una versión muy personalizada de Debian (Linux). Migraron de un sistema basado en Red Hat de forma incremental en 2013.[11]
Operación de servidores
La mayoría de operaciones son de solo lectura. Cuando se necesita una actualización de datos, las consultas se envían a otros servidores, para simplificar los problemas de consistencia. Las consultas se dividen en subconsultas y cada una de ellas se envía por diferentes canales en paralelo, reduciendo así el tiempo de latencia.[7]
Para reducir los efectos de un posible fallo de hardware, los datos almacenados en los servidores se duplican utilizando tecnología RAID (a fecha de febrero de 2008). El software también está diseñado para gestionar los fallos. Por lo tanto, cuando un servidor se cae, los datos todavía están disponibles en otros servidores.
Impacto medioambiental
El centro de datos más eficiente de Google funciona a 35 grados Celsius (95,0 °F) usando solo enfriamiento de aire fresco, y no requiere aire acondicionado eléctrico.[12]
En diciembre de 2016, Google anunció que, a partir de 2017, compraría suficiente energía renovable para igualar el 100% del uso de energía de sus centros de datos y oficinas. El compromiso convertirá a Google en "el mayor comprador corporativo de energía renovable del mundo, con compromisos que alcanzarán los 2,6 gigavatios (2600 megavatios) de energía eólica y solar".[13][14][15]
Referencias
- «Google Data Center FAQ». Data Center Knowledge (en inglés). 16 de marzo de 2017. Consultado el 23 de septiembre de 2021.
- «Conoce las ubicaciones de nuestros centros de datos». Centros de datos de Google. Consultado el 23 de septiembre de 2021.
- James Pearn. How many servers does Google have?. plus.google.com.
- Carr, David F. "How Google Works." Baseline Magazine. 6 de julio de 2006. Consultado el 10 de julio de 2006.
- "." Invest Wallonia. 27 de abril de 2007. Consultado el 10 de mayo de 2007
- "." Council Bluffs. 9 de julio de 2007. Consultado el 21 de agosto de 2007
- Web Search for a Planet: The Google Cluster Architecture (Luiz André Barroso, Jeffrey Dean, Urs Hölzle)
- "Google Stanford Hardware." Stanford University (provided by Internet Archive). Consultado el 10 de julio de 2006.
- Strassmann, Paul A. "A Model for the Systems Architecture of the Future." 5 de diciembre de 2005. Consultado el 18 de marzo de 2008.
- Hennessy, John; Patterson, David. (2002). Computer Architecture: A Quantitative Approach. Third Edition. Morgan Kaufmann. ISBN 1-55860-596-7.
- Merlin, Marc (2013). «Case Study: Live upgrading many thousand of servers from an ancient Red Hat distribution to a 10 year newer Debian based one». Linux Foundation. Consultado el 9 de junio de 2017.
- Humphries, Matthew (27 de marzo de 2012). «Google's most efficient data center runs at 95 degrees». geek.com. Archivado desde el original el 13 de junio de 2016. Consultado el 13 de junio de 2016.
- Hölzle, Urs (6 de diciembre de 2016). «We're set to reach 100% renewable energy — and it's just the beginning». The Keyword Google Blog. Consultado el 8 de diciembre de 2016.
- Statt, Nick (6 de diciembre de 2016). «Google just notched a big victory in the fight against climate change». The Verge. Vox Media. Consultado el 8 de diciembre de 2016.
- Etherington, Darrell (7 de diciembre de 2016). «Google says it will hit 100% renewable energy by 2017». TechCrunch. AOL. Consultado el 8 de diciembre de 2016.