Se sei qui, molto probabilmente stai cercando di
ottimizzare il tuo sito web perché sia
visualizzato correttamente sui motori di ricerca e, possibilmente,
sia posizionato da Google nella parte alta del suo indice, dove potrà essere trovato. Ti sarai certamente reso conto, allora, che - insieme all’
ottimizzazione dei contenuti - bisogna considerare una serie di
interventi tecnici che manifestano a Google
quali pagine del sito vorremmo fossero indicizzate.
Abbiamo parlato, infatti, di altri
due strumenti fondamentali da utilizzare per comunicare con GoogleBot (il crawler che Google utilizza per l’indicizzazione): la
sitemap e il file
robots.txt. In quest’articolo completiamo questo argomento spiegandoti come utilizzare il
tag rel="canonical", molto utile quando si vuole
evitare la presenza di pagine duplicate su Google. Se non ne hai mai sentito parlare non preoccuparti, ti sarà tutto più chiaro dopo la lettura di questa guida.
Per prima cosa, cerchiamo di dare una
definizione di URL canonico.
Che cos’è un URL canonico
Secondo la
definizione ufficiale di Google "un URL canonico è l’URL della pagina che Google ritiene più rappresentativo tra un insieme di pagine duplicate sul tuo sito." Si tratta perciò, dell’
URL che Google indicizza tra le varie versioni di una stessa pagina web con contenuto identico o solo leggermente diverso.
Sappiamo già quale domanda hai in testa a questo punto:
ma come può accadere che il mio sito web abbia pagine duplicate se io creo solo una versione per ogni pagina?
Te lo spieghiamo subito. Può accadere che si creino delle
pagine duplicate del tuo sito web per
diversi motivi. Ad esempio, può essere richiamato dal browser il tuo sito sia nella versione con e senza "www", oppure nelle versioni "http" e "https". Oppure, soprattutto nella gestione dei permalink dinamici, può capitare che, a seconda delle occasioni, le stesse pagine vengano mostrate con un URL diverso.
Trovi di seguito una
lista non esaustiva di URL duplicati di esempio:
- Versioni http e https:
https://www.sitoesempio.com/categoria-a/
http://www.sitoesempio.com/categoria-a/ - Senza www:
https://sitoesempio.com/categoria-a/ - Versione mobile:
https://m.sitoesempio.com/categoria-a/ - Sintassi leggermente diversa:
https://www.sitoesempio.com/categoria-a
https://www.sitoesempio.com/categoria-A/ - URL dinamici (utilizzati per pagine che, ad esempio, prevedono filtri di ricerca):
https://www.sitoesempio.com/products?category=shoes&color=blue - Post salvati in più sezioni nelle categorie di un blog:
https://www.sitoesempio.com/categoria-a/post-1
https://www.sitoesempio.com/categoria-b/post-1
Tutti questi risultati, per Google,
rappresentano pagine diverse e costituiscono
duplicati. Uno o più di questi risultati potrebbero venire, perciò, indicizzati al posto di quello che noi consideriamo l’URL principale. Per risolvere questo problema il modo migliore è quello di comunicare a Google
qual è l’URL canonico, ed effettuare quindi la
"canonicalizzazione" dell’URL. Vediamo insieme
come si fa.Come comunicare a Google l’URL canonico
Per
comunicare al crawler l’URL canonico, bisogna includere nel tag della pagina la
stringa seguente:
In questo modo
il crawler sarà in grado di distinguere quali, tra i vari URL presenti,
sono considerati come maggiormente rappresentativi dal gestore del sito web, e muoversi di conseguenza.
Nell’effettuare questa
"canonicalizzazione" dell’URLbisogna tenere in considerazione i seguenti accorgimenti:
- È opportuno inserire gli URL canonici anche nel file sitemap.xml;
- Non è indicato, invece, l’utilizzo del file robots.txt e dell’attributo "noindex" per l’esclusione delle pagine canoniche;
- Per l’esclusione degli URL non canonici, non bisogna utilizzare lo strumento di rimozione degli URL di Google Search Console;
- Per gli URL canonici, gli URL con HTTPS sono da preferire;
- Ogni pagina deve avere un solo tag rel="canonical";
- L’URL canonical non è una direttiva che il crawler utilizza obbligatoriamente, ma di un’indicazione, un suggerimento che il motore di ricerca può decidere di non utilizzare;
- Puoi verificare l’URL canonical nello strumento di controllo degli URL di Google Search Console;
- L’URL canonical è uno strumento diverso dal redirect 301, che invece serve per trasferire il traffico e link da una pagina obsoleta a un’altra più nuova.
Perché è importante utilizzare il tag "canonical"
Ora che hai visto
come utilizzare correttamente il tag canonical, di seguito trovi alcuni
motivi per cui dovresti utilizzarli:
- Per avere una presenza più "pulita" e coerente nel motore di ricerca con possibilità di analizzare al meglio le proprie performance;
- Per ottimizzare le risorse di crawling (crawl budget): infatti, le pagine canoniche vengono scansionate dal crawler più frequentemente rispetto alle pagine duplicate.
Vuoi approfondire?
Ora che hai imparato
come utilizzare il tag rel="canonical", la
gestione delle pagine duplicate su Google non ha più segreti per te. Se vuoi approfondire, abbiamo scritto qualcosa in più su come
agevolare l’indicizzazione del proprio sito web su Google e
scrivere un articolo ottimizzato per Google sul tuo
blog aziendale.
Non dimenticare, inoltre, che
Google aggiorna continuamente il proprio algoritmo e
c’è sempre qualcosa di nuovo da scoprire. Di recente, abbiamo parlato del nuovo aggiornamento
Google Page Experience. Ne hai mai sentito parlare?
Se ancora non ti basta,
noi siamo qui. I nostri
consulenti sono
sempre a disposizione per parlare delle
opportunità offerte dal SEO e analizzare con te
i migliori strumenti diweb marketing per cogliere tutte le opportunità offerte dal digital.
Contattaci