Email info@seoleader.digital Chiama ora! 347.6291162 - 02.99749627

Se i fattori di ranking di Google sono in parte sconosciuti per esplicita volontà da parte di team di Mountain View, fortunatamente altrettanto non si può dire del funzionamento tecnico del Googlebot. Vediamo quindi quali sono le due anime che lo costituiscono e come, insieme, contribuiscano all’indicizzazione delle pagine di un sito internet.

Che cosa è lo spider di Google?

Prima di cominciare, è opportuno ribadire che cosa sia uno spider: nel linguaggio informatico questo termine – noto anche con i sinonimi di web crawler o robot – indica un software che “scannerizza” i contenuti del database in maniera automatizzata per conto del motore di ricerca.

Questo significa che lo spider di Google è lo strumento del motore di ricerca per analizzare tutte le pagine web esistenti online e, successivamente, attribuire loro un ranking.

Per questo viene chiamato anche spider, utilizzando una metafora: infatti il ragno è noto in Natura per muoversi attraverso la sua ragnatela che viene intessuta in maniera precisa ma spesso imprevedibile, passando e ripassando sopra ai singoli filamenti per verificarne la tenuta. Allo stesso modo lo spider di Google, si sposta all’interno delle pagine delle singole pagine verificandone lo stato di aggiornamento.

Lasciando da parte un attimo le metafore zoologiche e concentrandosi sul funzionamento tecnico dello spider, è possibile affermare che Googlebot non è altro che un termine generico che è stato assegnato ai due web crawler del motore di ricerca. Un primo crawler simula l’utente che usa il dispositivo desktop e un secondo crawler che simula la navigazione da mobile.

Come funziona Googlebot?

Lo scopo del Googlebot è eseguire due principali azioni:

Crawling: con questo termine si identifica l’analisi approfondita del web alla ricerca di pagine e contenuti nuovi;

Indicizzazione: a questo proposito è importante differenziare tra l’attività di indicizzazione vera e propria e quella di posizionamento. Infatti nel primo caso si indica la “registrazione dell’esistenza” delle pagine sul motore di ricerca, mentre nel secondo caso l’assegnazione di un punteggio tale da collocare le pagine del sito internet all’interno della SERP.

Per completezza, è opportuno sottolineare che a questi primi due passaggi, ne segue un terzo – non eseguito dal Googlebot – noto come Ranking. Su questo aspetto Martin Splitt, noto Googler, ha chiarito di recente che, per quanto questa attività non sia svolta all’atto pratico dallo spider, tuttavia è informata dal bot stesso.

Oltre a comprendere il funzionamento del Googlebot, cosa è importante sottolineare? Che il tuo sito internet ancora prima di essere user friendly e navigabile da smartphone, deve essere facilmente analizzabile dallo spider.

Come lo spider arriva al tuo sito internet?

Secondo quanto è stato recentemente chiarito, lo spider di Google arriva alla pagina di un determinato sito attraverso un link presente in una pagina terza (ribadendo ancora una volta l’importanza dell’attività di Link Building e di Digital PR).

In alternativa, il bot può arrivare al tuo sito perché un consulente digitale o un tecnico SEO hanno inserito una SiteMap: questa, come suggerisce il nome stesso, è una mappa del sito stesso che suggerisce il percorso da compiere allo spider stesso, facilitando il processo di lettura del database delle pagine portato avanti dallo spider.

Budget dello Spider di Google (Crawl Budget)

Una volta chiariti i meccanismi di funzionamento dello spider, ci si potrebbe chiedere: ma quanto spesso il bot passa dal mio contenuto?

Per rispondere a questa domanda bisogna prima di tutto ricordare che Google è un’azienda e, in quanto tale, assegna un budget a determinate attività: questo prende il nome di crawl budget.

Per ottimizzare questo budget, lo spider valuta quali pagine scansionare per prima: infatti, non le passa in rassegna contemporaneamente per il rischio di creare errori o sovraccarichi nel sistema, ma al contrario si concentra su quelle che sono considerate più interessanti per lui ossia quelle nuove.

Tra gli elementi che probabilmente inducono il bot a passare dalla pagina del tuo website c’è la frequenza con cui vengono immessi nuovi contenuti: a seconda che la risposta sia affermativa o meno il tuo sito internet, il Googlebot lo sottopone a scansioni più frequenti per un determinato periodo di tempo. Al contrario se si accorge che il tuo sito presenta pagine corrotte (cioè che, in estrema sintesi, impiegherebbe troppo tempo a scansionare per le ragioni più disparate) può addirittura non passarci più, come accade nel caso di penalizzazioni.

Da quanto si è potuto capire da questa breve rassegna del funzionamento dello spider di Google, appare evidente quanto sia importante per le aziende che fondano il proprio business sulle vendite online avere al proprio fianco un consulente SEO in grado di fornire preziosi suggerimenti nonché esecuzioni tecniche affinché il bot sia facilitato nella scansione delle pagine del sito.