Google … un vero gigante!

Che Google sia il gigante indiscusso dei motori di ricerca e’ risaputo … ma vi siete mai chiesti come fa questo motore di ricerca ad essere cosi’ efficiente e quante richieste vengono processate dai server in una giornata??

Due scienziati della ricerca sul web, Jeffrey Dean e Sanjay Ghemawat, hanno condotto uno studio su alcuni dei meccanismi che stanno alla base della capacita’ di calcolo di Google ed ecco il risultato :

I server di Mountain View processano una quantita’ di dati che supera i 20 Petabyte al giorno … sono piu’ di 20.000 Terabyte in 24 ore!! Ma come e’ possibile gestire una data processing cosi’ elevato?

Beh il modello utilizzato da Google si chiama MapReduce e consente di suddividere e parallelizzare il carico di lavoro su cluster di centinaia di macchine, sfruttando cosi’ l’enorme velocita’ di calcolo a disposizione …. considerate che vengono giornalmente eseguiti circa 100.000 MapReduce su circa 400 server ( se non di piu’ ).

Il MapReduce viene utilizzato da Google dal 2003 con un aumento esponenziale della capacita’ di cercare, registrare e processare le informazioni … e si vede! Anche Microsoft con Live Search e Yahoo! stanno migliorando, ma non hanno ancora raggiunto una simile capacita’ di elaborazione, ma soprattutto di utenti!

Fonte : MegaLab