Contenuti duplicati e SEO

Quando si parla di siti seo-friendly (o più correttamente search engine friendly) si vuole indicare quei siti web realizzati attraverso la creazione di elementi (layout, navigazione, contenuti) ottimizzati per essere “letti” al meglio dai motori di ricerca.

Questo significa realizzare una struttura e dei contenuti che siano da una parte usabili per l’utente, dall’altra ottimizzati per i motori di ricerca, affinché il sito possa essere scansionato correttamente dagli spiders e indicizzato al meglio.

Uno dei maggiori problemi inerenti la corretta indicizzazione di un sito dipende spesso dall’esistenza di contenuti duplicati, ovvero di pagine del sito uguali, raggiungibili da url diversi. L’esistenza di questi contenuti, anche se può sembrare un problema relativo, in realtà provoca gravi danni in termini di indicizzazione, in quanto il motore di ricerca, trovando due identici contenuti, non sa come comportarsi e quale delle due versioni è più rilevante per la query cercata dall’utente.

Contenuti duplicati e SEO

Cosa comporta ciò? Quando il motore di ricerca trova due o più versioni dello stesso contenuto non riesce a distinguere tra l’originale e le copie, e quindi può non indicizzare o indicizzare in maniera non corretta le varie pagine.

Per evitare ciò è importante non permettere la creazione di pagine duplicate o altrimenti evitarne l’indicizzazione attraverso i metodi che vedremo sotto.

Quando si creano contenuti duplicati?

Partiamo dal fatto che un contenuto duplicato, come detto sopra, è rappresentato da una stessa pagina (porzione di codice uguale) raggiungibile da url diversi. Un contenuto può essere duplicato quando esistono più versioni della stessa pagina perché:

  • www e non-www (es: stessa pagina raggiungibile da www.esempio.com e esempio.com);
  • diversi protocolli (es: stessa pagina raggiungibile da http://www.esempio.com e https://www.esempio.com);
  • duplicati della home page (es: www.esempio.com e www.esempio.com/index.html);
  • parametri di sessione (es: www.esempio.com e www.esempio.com?sessione=1746);
  • parametri di ordinamento (es: www.esempio.com/hotel e www.esempio.com/hotel?prezzo-magg);
  • parametri di ricerca (es: www.esempio.com/search.php?categoria=hotel e www.esempio.com/search.php?categoria=hotel?prezzo=100);
  • path duplicate (es:www.esempio.com/bici-rosse e www.esempio.com/tag/bici-rosse);
  • paginazione (es: www.esempio.com/search.php?categoria=hotel e www.esempio.com/search.php?categoria=hotel?pagina=2);

Oltre alle ipotesi citate sopra esistono altre diverse possibilità in cui per diversi motivi è possibile incorrere alla creazione di pagine duplicate; a prescindere dal motivo, l’importante è, analizzando il sito, capire come e dove si sono create più versioni della stessa pagina.

Come trovare contenuti duplicati?

Esistono, per nostra fortuna, diversi strumenti e diversi metodi per analizzare l’eventuale esistenza di contenuti duplicati, eccone alcuni tra i più utilizzati:

  • Webmaster Tool (nella sezione Diagnostica -> suggerimenti HTML è possibile vedere se esitono title o meta descrizioni duplicate);webmaster-tool
  • Operatore di ricerca site:(controllare tutte le pagine indicizzate tramite una ricerca site:esempio.com; A volte è Google stesso che ci avverte dell’esistenza di pagine simili che potrebbero essere contenuti duplicati;risultati-omessi
  • Utilizzare tool come Seo Spider attraverso il quale è possibile vedere se esitono diverse versioni della stessa pagina.

 

Come risolvere il problema dei contenuti duplicati?

I contenuti duplicati, per la struttura stessa del sito che li crea, non devono essere rimossi, basta configurare i diversi contenuti affinché il motore di ricerca possa capire quali sono le versioni orginali della pagine e quali no.

  • Noindex, Nofollow: il file robots.txt ci viene in aiuto per configurare quali sono le sezione del nostro sito che non devono essere indicizzate, questo metodo è utile nel caso delle path duplicate (es: miosito.com/bici-rosse e miosito.com/categoria/bici-rosse);
  •  Tag rel=canonical: impostare qual’è la versione canonica della pagina tramite il tag canonical (questa soluzione è utile in tutti i casi di parametri (es: www.esempio.com/hotel e www.esempio.com/hotel?prezzo-magg);
  • Tag rel=”next” and rel=”prev”: utile nei casi di contenuti duplicati per paginazione (es: www.esempio.com/search.php?categoria=hotel e www.esempio.com/search.php?categoria=hotel?pagina=2);
  • Redirect 301: reindirizzare la pagina duplicata alla versione originale (questo metodo può essere utile nei casi di cambiamenti strutturali del sito che hanno portato a modifiche permanenti degli url (es: miosito.com/blog/articolo-1 e miosito.com/blog/2012/11/articolo-1);
  • Utilizzare il webmaster tool per settare la versione di dominio preferito (Webmaster Tool -> Configurazione sito -> Impostazioni) (utile nel caso di stessa pagina raggiungibile da www.esempio.com e esempio.com);
  • Impostare il noindex per i parametri url che conosciamo e che provocano contenuti duplicati (sempre tramite il Webmaster Tool Configurazione sito ->Parametri Url possiamo dire a Google quali sono ler pagine che utilizzano dei parametri che non devono essere indicizzate perché contenuti duplicati) (attenzione: utilizare solo se si conosce l’esatta funzione del parametro).
Inserito in:

Lascia un commento

2 commenti

  1. Salve, articolo interessante. A proposito dei contenuti duplicati. Avrei una domanda riguardo la tecnica di proliferazione degli URL utilizzata da Magento (con il tag canonical). In pratica Magento nelle pagine di “categoria” per ogni combinazione di filtri crea un URL diretto. Ad esempio se visualizza la categoria scarpe avrò un URL miosito.it/scarpe, se filtro per scarpe donna avrò un URL miosito.it/scarpe/donna la pagina è “la stessa” ma con i contenuti filtrati. Questo a tutti gli effetti si traduce in contenuti duplicati. Per i siti e-commerce pare che Google apprezzi e premi questa tecnica di proliferazione, la stessa cosa la possiamo applicare anche ai siti non puramente ecommerce? Un catalogo senza carrello? O si rischia la penalizzazione?

    • Ciao Gianni,
      un contenuto può essere ritenuto duplicato se lo stesso identico contenuto è raggiungibile da url diversi. Il caso più comune in abito ecommerce è l’ordinamento dei prodotti.
      Se gli stessi prodotti ordinati per prezzo generano un url e ordinati per voto ne generano un altro, quelle due urls rappresentano un contenuto duplicato.
      Nel tuo caso l’applicazione di un filtro sui prodotti genera un cambio dei prodotti visibili in pagina, per questo la pagine scarpe e la pagina scarpe/donna avranno all’interno prodotti diversi e quindi non duplicati.
      Potresti essere a rischio duplicazione solo nel caso in cui la pagina scarpe contenga solo scarpe da donna e quindi il filtro su scarpe donna non genera nessun cambiamento dei prodotti in pagina.
      Nel caso in cui le i filtri in pagina fossero gestiti con dei parametri, puoi utilizzare la Search Consolle per indicare a Google a cosa servono i parametri ed evitare quindi duplicazioni.
      Nel tuo caso, solo per situazioni a rischio (tipo quella che ti ho indicato sopra) il mio consiglio è lavorare con il tag canonical.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Loading Facebook Comments ...