El anterior índice de Google tenía varias capas, algunas de las cuales se refrescaban más frecuentemente que otras. Por ejemplo, la capa principal se actualizaba cada dos semanas. Para refrescar una capa del índice anterior, se analizaba la página web entera, lo cual significaba que había un retraso significativo entre el momento en el que se encontraba una página y el momento en el que Google la hacía disponible para todo el mundo.

caffeine

Con Caffeine, el nuevo sistema de indexación, se analiza la web en pequeñas porciones y se actualiza el índice de búsqueda continuamente, de manera global. A medida que Google encuentra nuevas páginas o información nueva en páginas existentes, se pueden añadir directamente al índice. Ésto significa que podremos buscar información más reciente que antes.

Con esta mejora, Caffeine permite a Google indexar páginas web a una escala mucho mayor. De hecho, Caffeine procesa cientos de miles de páginas en paralelo por segundo, de forma que Caffeine ocupa unos 100 millones de gigabytes de almacenamiento en una base de datos y añade información nueva por una cantidad de cientos de miles de gigabytes por cada día.

¿Qué os parecen las mejoras introducidas en el sistema de indexación de Google? ¿Notáis que los resultados de búsqueda están más actualizados que antes?


Fuente: softzone