Google Cache: cos’è, a cosa serve e come interpretarla?

Google cache

Voglio iniziare il presente argomento spiegando innanzitutto cos’è una memoria cache e come funziona e successivamente andare a delineare bene l’argomento che un SEO Specialist deve conoscere in tutte le sue sfaccettature che è la Google Cache.

In informatica la memoria cache consiste in una memoria veloce, relativamente piccola che memorizza i dati recentemente usati da una memoria di lavoro principale e svolge la funzione di velocizzare gli accessi alla memoria principale aumentando le prestazioni del sistema.

Quindi come indica la traduzione letterale del termine stesso, la memoria cache consiste in un “nascondiglio” nel quale recuperare velocemente informazioni salvate e facilitare il lavoro dell’interno sistema.

Ho voluto fare questa premessa in quanto la memoria cache non viene utilizzata solamente da Google ma è utilizzata da molti altri sistemi come i browser di ricerca e anche da noi SEO Specialist!

Cos’è e come funziona la copia cache di Google?

La copia cache è un’istantanea immagazzinata da Google che conserva all’interno dei propri server, l’idea che sta alla basa di questo strumento è semplicemente quella di offrire agli utenti uno strumento in più per poter visitare una pagina web quando essa per qualche motivo è inattiva.

Vediamo insieme come funziona la memoria cache di Google. Google immagazzina appositamente le copie delle pagine web in modo da non appesantire troppo le richieste al server e quindi alla Main Memory, la memoria principale di lavoro.

Di seguito un piccolo schema sulla logica funzionale della memoria cache di Google:

  1. Durante le operazioni di lettura della memoria principale (MM), Google verifica come prima cosa se il dato è già memorizzato nella cache;
  2. in caso di esito positivo (Hit) il dato è velocemente trasferito dalla cache al processore senza coinvolgere la MM;
  3. in caso invece di esito negativo (Miss) il dato è letto dalla MM e processato dai server di Google.
come funziona google cache

L’obiettivo della memoria cache oltre a quello di facilitare l’utente nel recupero delle pagine, è quello di facilitare a Google l’immagazzinamento del mare magnum di pagine che incontra sul web rendendo veloce e tempestiva la presentazione dei contenuti.

Andiamo a vedere ora come si visualizza la copia cache di Google.

Come visualizzare la copia cache?

Dove posso trovare le copie delle pagine che ha salvato Google del mio sito web? Questa ricerca è molto semplice ed è possibile trovarla in differenti modi, di seguito ti mostro 3 semplici metodi di visualizzazione della Google Cache:

  • Fare click sulla freccia verde rivolta verso il basso a destra dell’URL di tuo interesse che ti restituisce direttamente la SERP di Google (Search Engine Result Page). Cliccando su “Copia cache” il browser ti apre la versione memorizzata della pagina da Google.

come visualizzare la cache in serpLa pagina da te selezionata verrà aperta con l’URL webcache.googleusercontent.com anziché con l’URL live o normale. La cache che stai visualizzando è effettivamente archiviata sui server di Google, motivo per cui ha questo strano indirizzo e non l’URL della pagina.

  • Un secondo metodo ancora più veloce per trovare la copia cache di Google è utilizzare l’operatore di ricerca “cache:” insieme URL della pagina che si vuole visualizzare la copia, di seguito un esempio pratico: cache:www.seospecial.it
  • Infine per chi come me è sempre alla ricerca di Plug-in al seguente link potrai scaricare Web Cache Viewer, Plug-in per Google Chrome che ti consente tramite il tasto destro del mouse di vedere sia la cache che il wayback machine ovvero la storicità della pagina web.

Quali informazioni ti restituisce la copia cache?

La copia Cache di Google ti restituisce le seguenti informazioni:

  1. Data dell’istantanea della pagina;
  2. la pagina corrente con le ultime modifiche;
  3. la versione completa;
  4. la versione solamente testo;
  5. la visualizzazione del sorgente di pagina.

informazioni della copia cache

La prima voce ovvero la “data dell’istantanea della pagina” che ti restituisce Google come molti possono pensare NON è la data effettiva con cui lo spider ha scansionato l’ultima volta la pagina web.

E’ importate capire questo concetto in quando la copia cache di Google può utilizzare una versione precedente di una pagina web che non coincide per forza con la data dell’ultima scansione del Bot di Google. Per capire questo concetto ti mostro i seguenti due fermi immagine che ho fatto mentre scrivevo il presente articolo:

copia cache seo special
ultima scansione search console

Le immagini ci mostrano come il 27 Ottobre 2018 la copia cache mi indicava il rilevamento della Home Page risalente al 15 Ottobre, tuttavia vediamo come la Search Console di Google ci indica che l’ultima scansione della Home Page risale al 24 Ottobre.

Con questo piccolo esperimento confermiamo che la data della Copia cache di Google non è la data dell’ultima scansione, come del resto afferma lo stesso John Muller in un passato Tweet: “Io ignoro la data della Cache!

Continuando con le informazioni che ci restituisce la Google cache siamo arrivati alla voce: “versione completa della pagina”. Questa versione completa non consiste nella fotocopia di ciò che ha scansionato lo spider, ma è una vista reindirizzata della pagina dal browser di ricerca e non da Google!

Di seguito un piccolo esempio che spiega ciò:

visione completa google cache
Come puoi notare dall’immagine l’ora restituita dall’orologio al centro della pagina web coincide esattamente con l’ora del segnalata in basso a destra dal mio PC che a sua volta è differente dall’orario della copia cache di Google.

L’orologio ci mostra come la cache ci sta mostrando il contenuto in tempo reale e non la versione “scansionata da Google”.
Se la pagina fosse stata sottoposta a rendering da Google, l’ora e la data dovevano essere congelate ed essere le stesse che ci indica Google sopra alla casella grigia della copia cache!

Questi esempi ci dimostrano come la copia cache è una versione reindirizzata della copia cache di Google dal Browser di ricerca che si sta utilizzando.

Proseguendo con le informazioni che ci restituisce la cache troviamo una quarta voce dal nome: “visualizzazione solo testo”, questa rappresenta un’istantanea della pagina senza CSS e JavaScript, solamente i link interni al sito e il testo della pagina.

Infine l’ultima informazione la “visualizzazione del sorgente” ti consente semplicemente di vedere il codice sorgente che ha generato la creazione della pagina.

Quindi se la copia Cache di Google non ci indica ciò che realmente vede il motore di ricerca, allora cosa ci facciamo con queste informazioni? A cosa possono esserci utili?

Come utilizzare la copia cache di Google?

Ok, ma allora a cosa può tornare utile la copia cache di Google?

Siccome si tratta sempre di una utility interna al motore di ricerca la copia cache può farci accedere alcuni campanelli d’allarme. Di seguito un elenco di informazioni utili che possiamo ricavare dalla copia cache di Google.

La cache è vuota!

Siti web alimentati da JavaScript non offrono i contenuti al motore di ricerca con pre-rendering (rendering lato server) ovvero non eseguono un rendering del contenuto in modo tale da offrire a Google la versione reindirizzata.

Detto in parole più semplici se il codice HTML viene caricato solamente dopo l’esecuzione di file JavaScript, Google visualizza un codice HTML non elaborato e di conseguenza non avrà nulla da mostrare, questo si traduce in una copia cache vuota.

Tuttavia anche se vedi una cache vuota, ciò non significa che il contenuto non sia lo stesso indicizzato. Ormai come affermato già da tempo da John Mueller, Google in linea generale è in grado di effettuare il rendering e capire le pagine web come i moderni browser.

La regola riguardante le due ondate di indicizzazione rende così che qualunque cosa tu voglia caricare con JavaScript probabilmente verrà indicizzata, ma potrebbe essere differita. Nella prima ondata, Google indicizza la pagina senza eseguire JavaScript. Nella seconda ondata, JS viene eseguito in modo che Google possa indicizzare il contenuto correttamente.

Da un punto di vista tecnico, è perfettamente corretto che l’HTML dei siti Web con JS non abbia troppi elementi da visualizzare prima di eseguire JavaScript. Tuttavia, dati tutti i problemi con l’indicizzazione JS, non mi affiderei al rendering del mio sito web JavaScript da parte di Google, a causa dei ritardi nell’indicizzazione. L’indicizzazione del contenuto può essere differita per alcuni giorni o addirittura mesi!

La cache mostra un dominio diverso

Una delle situazioni più confuse della copia cache di Google e quando ci presenta un dominio completamente diverso, questo significa che Google sta confondendo il sito con un altro.

A volte Google cerca di valutare l’unicità del contenuto solo guardando i pattern negli URL (e probabilmente alcuni altri segnali, ma non visitano una determinata pagina). Ad esempio, se due siti di e-commerce hanno quasi la stessa struttura di URL e condividono gli stessi ID di prodotti, Google potrebbe raggrupparli.

Un altro scenario che porta agli stessi risultati è quando qualcuno ha implementato un tag rel = canonical in modo errato. Ad esempio, se un webmaster aggiunge un tag canonical verso un dominio differente, molto probabilmente si traduce nella visualizzazione di una pagina diversa nella visualizzazione di Google Cache. In questo caso, hai inviato a Google il segnale che queste due pagine sono identiche e dovrebbero raggrupparle insieme.

La cache della pagina non esiste

L’utilizzo di un meta tag noarchive impedisce a Google di creare istantanee che potrebbero essere visualizzate in Google Cache. Nella maggior parte dei casi, è un passo intenzionale. Sta istruendo gli strumenti o le applicazioni che non dovrebbero memorizzare le istantanee della pagina.

Questo potrebbe essere utile se la pagina presenta dati sensibili che non dovrebbero essere accessibili. Se decidi di utilizzare un meta tag noarchive, questo non ha alcun impatto sulle classifiche, ma solo se viene creata e mantenuta un’istantanea.

Copia cache con uno status code 404

Stavo guardando la copia cache della mia pagina web e tutto ad un tratto la Google cache mi risponde con uno status code 404?!?
google cache 404 not found
Aiuto!! Cosa sarà mai successo? Ora perderò il mio posizionamento online! Niente allarme! Non è successo niente al tuo sito web, Google lo continua a leggere esattamente come lo leggeva prima!

Cerco sul web e improvvisamente sulla community SEO tra Twitter, Google Webmaster Forum girano voci che la Google Cache è vuota e molti si lamentano per le pagine che restituiscono un errore 404 in Google cache.

Come afferma John Muller su Twitter la pagina 404 della copia cache non impatta sul ranking di un sito web. Continua affermando che questa sfilza di errori della copia cache sono successivi all’ondata del recente spostamento sul mobile first index della gran parte dei portali.

OK tutto chiaro Google ci conferma che questo non impatta assolutamente sul crawling, sull’indicizzazione e sul ranking, ma ora come faccio a visualizzare correttamente la mia copia cache?

Di seguito ti mostro un trick semplicissimo se per ripristinare la copia cache che presenta uno status code 404.
Andando in SERP su l’URL per il quale ti interessa vedere la cache di Google e selezionando la sempre freccia verde, ti basta modificare con qualsiasi carattere l’URL della cache che risponde con lo status code 404 (webcache.googleusercontent.com).

Ricaricando la pagina il browser ti farà vedere nuovamente la copia cache della pagina.

Conclusione

In conclusione come abbiamo visto dalle informazioni che ci rimanda la cache di Google non sono sempre attendibili e sinonimo di ciò che realmente ha scansionato e metabolizzato Google.

Tuttavia con questo non voglio scoraggiarti nel controllare ugualmente la copia cache durante il check on-site di un sito web, infatti come abbiamo visto le relative copie create da Google possono spronarci ad eseguire ulteriori approfonditi controlli al sito web che si sta analizzando.

Infine in contemporanea all’utilizzo della cache di Google è bene analizzare la situazione a 360 gradi utilizzando ulteriori strumenti che Google stesso ci mette a disposizione “Feetch as Google” di Google Search Console, abbinato allo spider che tutti noi conosciamo con il nome di Screaming Frog!

0 commenti

Lascia un Commento

Vuoi partecipare alla discussione?
Fornisci il tuo contributo!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.