Contenuti duplicati e SEO

Quando si parla di siti seo-friendly si vuole indicare quei siti web realizzati attraverso la creazione di elementi (layout, navigazione, contenuti) ottimizzati per essere “compresi” al meglio dai motori di ricerca.

Questo significa realizzare una struttura e dei contenuti che siano da una parte usabili per l’utente, dall’altra ottimizzati per i motori di ricerca, affinché il sito possa essere scansionato correttamente dagli spiders e indicizzato al meglio.

Uno dei problemi inerenti l’indicizzazione di un sito riguarda l’esistenza di contenuti duplicati, ovvero di pagine del sito uguali (e per uguali si intende una copia speculare di una pagina), raggiungibili da url diversi. L’esistenza di questi contenuti, anche se può sembrare un problema relativo, in realtà può portare a seri problemi SEO in quanto un motore di ricerca, trovando due identici contenuti, non sa come comportarsi e quale delle due versioni è più rilevante per la query cercata dall’utente.

Contenuti duplicati e SEO

Cosa comporta ciò? Quando il motore di ricerca trova due o più versioni dello stesso contenuto non riesce a distinguere tra l’originale e le copie, e quindi può non indicizzare o indicizzare in maniera non corretta le varie pagine.

Per evitare ciò è importante non permettere la creazione di pagine duplicate o altrimenti evitarne l’indicizzazione attraverso i metodi che vedremo sotto.

Quando si creano contenuti duplicati?

Partiamo dal fatto che un contenuto duplicato, come detto sopra, è rappresentato da due o più pagine identiche presenti in un sito raggiungibili però da url diversi.

La duplicazione di contenuti può avvenire per varie ragioni ed in vari casi, ad esempio:

  • versione con www e senza www (es: stessa pagina raggiungibile da www.esempio.com e esempio.com);
  • diversi protocolli (es: stessa pagina raggiungibile da http://www.esempio.com e https://www.esempio.com);
  • duplicati della home page (es: www.esempio.com e www.esempio.com/index.html);
  • parametri di sessione (es: www.esempio.com e www.esempio.com?sessione=1746);
  • parametri di ordinamento (es: www.esempio.com/hotel e www.esempio.com/hotel?prezzo-magg);
  • parametri di ricerca (es: www.esempio.com/search.php?categoria=hotel e www.esempio.com/search.php?categoria=hotel?prezzo=100);
  • path duplicate (es:www.esempio.com/bici-rosse e www.esempio.com/tag/bici-rosse);
  • paginazione (es: www.esempio.com/search.php?categoria=hotel e www.esempio.com/search.php?categoria=hotel?pagina=2);

Oltre alle ipotesi citate sopra esistono altre diverse possibilità in cui per diversi motivi è possibile incorrere alla creazione di pagine duplicate; a prescindere dal motivo, l’importante è, analizzando il sito, capire come e dove si sono create più versioni della stessa pagina.

Come trovare contenuti duplicati?

Esistono, per nostra fortuna, diversi strumenti e diversi metodi per analizzare l’eventuale esistenza di contenuti duplicati, eccone alcuni tra i più utilizzati:

  • Google Search Console (nella sezione Diagnostica -> suggerimenti HTML è possibile vedere se esitono title o meta descrizioni duplicate);webmaster-tool
  • Operatore di ricerca site: (controllare tutte le pagine indicizzate tramite una ricerca site:esempio.com; A volte è Google stesso che ci avverte dell’esistenza di pagine simili che potrebbero essere contenuti duplicati;risultati-omessi
  • Utilizzare tool come Seo Spider attraverso il quale è possibile vedere se esistono diverse versioni della stessa pagina.

 

Come risolvere il problema dei contenuti duplicati?

I contenuti duplicati, per la struttura stessa del sito che li crea, non devono essere rimossi, basta configurare i diversi contenuti affinché il motore di ricerca possa capire quali sono le versioni orginali della pagine e quali no.

  • Noindex, Nofollow: il file robots.txt ci viene in aiuto per indicare al motore di ricerca quali sono le sezioni del nostro sito che non devono essere scansionate, questo metodo è utile nel caso delle path duplicate (es: miosito.com/bici-rosse e miosito.com/categoria/bici-rosse);
  •  Tag rel=canonical: impostare qual’è la versione canonica della pagina tramite il tag canonical (questa soluzione è utile in tutti i casi di parametri (es: www.esempio.com/hotel e www.esempio.com/hotel?prezzo-magg);
  • Tag rel=”next” and rel=”prev”: utile nei casi di contenuti duplicati per paginazione (es: www.esempio.com/search.php?categoria=hotel e www.esempio.com/search.php?categoria=hotel?pagina=2);
  • Redirect 301: reindirizzare la pagina duplicata alla versione originale (questo metodo può essere utile nei casi di cambiamenti strutturali del sito che hanno portato a modifiche permanenti degli url (es: miosito.com/blog/articolo-1 e miosito.com/blog/2012/11/articolo-1);
  • Utilizzare Google Search Console per impostare la versione di dominio preferito (Search Console -> Configurazione sito -> Impostazioni) (utile nel caso di stessa pagina raggiungibile da www.esempio.com e esempio.com);
  • Impostare il noindex per i parametri url che conosciamo e che provocano contenuti duplicati (sempre tramite Search Console -> Configurazione sito -> Parametri Url possiamo dire a Google quali sono ler pagine che utilizzano dei parametri che non devono essere indicizzate perché contenuti duplicati) (attenzione: utilizzare solo se si conosce l’esatta funzione del parametro).
Inserito in:
L'Autore

Stefano Salustri

Sono un Consulente in Digital Marketing con oltre 10 anni di esperienza. Mi occupo di progettare e sviluppare strategie digitali per Piccole e Medie Imprese per aiutare le aziende ad ottenere il massimo ritorno dagli investimenti nei canali online. 📈

12 commenti

              Lascia un commento

              Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *