Seleziona una pagina

CONTENUTI DUPLICATI

Cosa sono, come si creano e come evitarli

 

Avere contenuti duplicati sul web può causare vari problemi.
L’originalità di un contenuto sul web è sempre stato un argomento di interesse per chi si occupa di SEO e per i motori di ricerca, che cercano di fornire un servizio di qualità ai propri utenti. Con l’introduzione nel 2011 di Panda, l’algoritmo di Google che penalizza i contenuti duplicati o comunque di scarsa rilevanza per gli utenti, questo tema è tornato a farsi sentire a causa della possibilità di ricevere una penalizzazione Google e non riuscire a posizionarsi al meglio tra i risultati della SERP. I motori di ricerca posizioneranno tra i primi risultati della SERP ciò che porta un maggior valore aggiunto all’utente e tutto ciò che è originale, a discapito dei contenuti duplicati.
Nel caso in cui questi esistano, quello che è stato indicizzato cronologicamente per primo avrà la precedenza e verrà ritenuto più autorevole dal motore di ricerca, ricevendo di conseguenza un posizionamento migliore.

Nonostante non esista una vera e propria penalizzazione da parte di Google (almeno non nel significato che solitamente si attribuisce a questa parola), potresti avere difficoltà a posizionare i tuoi contenuti nei primi risultati della SERP.
Nel 2008 Google ha pubblicato un articolo sul Webmaster Central Blog nel quale cerca di chiarire la questione della penalizzazione derivante dalla presenza di contenuti duplicati sul web. In sostanza, Google pone le cose in chiaro: la penalizzazione può avvenire nel caso in cui un contenuto sia stato copiato da un sito esterno o se sia ripubblicato dallo stesso sito senza apportare alcun valore aggiunto.
Contenuti duplicati, tuttavia, non significa solo fare copia e incolla; ci sono altri casi in cui i motori di ricerca possono rilevare il tuo contenuto come “duplicato” e, di conseguenza, cercheranno di porvi rimedio. Questo avviene perché i motori di ricerca cercano sempre di offrire la migliore esperienza utente possibile ed evitano di proporre risultati simili o a maggior ragione identici all’interno della stessa SERP. Filtrando ciò che è ridondante, Google garantisce risultati eterogenei ad ogni query inserita dai propri utenti.

Non parliamo solo di capitoli e paragrafi, ma anche di meta descrizioni duplicate, tag title duplicati e così via. Per questo motivo, è sempre buona abitudine effettuare dei test per controllare la presenza di contenuti duplicati sul proprio sito e apportare le opportune modifiche, per esempio miglioramenti html delle meta descrizioni duplicate. E’ opportuno capire in quali casi si rischia di generare dei contenuti duplicati. Infine, come controllare se qualcuno ha duplicato il nostro contenuto sul web?

 

Contenuti duplicati

 

Cosa sono i contenuti duplicati

Con l’espressione contenuti duplicati ci si riferisce a porzioni o blocchi di testo uguali presenti su pagine diverse, siano esse parte del tuo sito (contenuto duplicato interno) oppure appartenenti a siti differenti. Tralasciando il caso in cui si faccia direttamente copia e incolla di un contenuto già presente sul web per poterlo pubblicare sul proprio sito o blog (strategia che sicuramente non paga), i contenuti duplicati possono essere di vario tipo: parliamo innanzitutto di estratti di articoli o pagine ma anche di meta descrizioni duplicate o tag title duplicati. Non dimentichiamo inoltre che gli url parametrici creano a tutti gli effetti una copia della pagina originale: basti pensare ai siti di e-commerce, sui quali è possibile impostare dei filtri (colore, taglia, etc.) per visualizzare gli articoli in vendita. Ogni volta che imposti un filtro, noterai che quest’ultimo viene aggiunto all’URL: di conseguenza, verranno create due pagine con la maggior parte del contenuto in comune. 

 

Perché controllare i contenuti duplicati

Immagina di essere un motore di ricerca e che ti venissero chieste informazioni in merito a cosa sono i contenuti duplicati. Cominceresti a cercare sul web tutto ciò che riguarda questo argomento e potrebbe capitare di trovarti di fronte a due contenuti identici. Cosa faresti?
Molto probabilmente dovresti fare delle scelte:

  • quale delle due versioni ritengo valida per l’indicizzazione?
  • a quale delle due versioni assegno i parametri di ranking?
  • quale delle due versioni posiziono nei risultati della SERP?

Immagina ora di essere il proprietario di un contenuto duplicato pubblicato sul web e che Google abbia dovuto decidere in autonomia a quale delle due versioni dare la priorità, penalizzando di fatto la seconda. Probabilmente avrai dei riscontri negativi in termini di posizionamento e una diminuzione del traffico, perché Google potrebbe aver considerato come più autorevole la versione sbagliata o, peggio ancora, aver diviso il traffico in entrata su entrambe le pagine. Questa seconda possibilità è ancora più rilevante se pensiamo al caso in cui i link inbound che ricevi non dovessero puntare tutti allo stesso contenuto, causando così una dispersione del traffico e una cattiva interpretazione dei dati in Google Analytics.

 

Come si creano i contenuti duplicati 

Arrivati a questo punto, potresti chiederti perché qualcuno dovrebbe correre tutti questi rischi solo per risparmiare tempo ed evitare di scrivere un contenuto originale. Secondo uno studio del 2015, il 29% delle pagine web sono in realtà contenuti duplicati ma, a differenza di ciò che potrebbe sembrare ovvio, contenuti duplicati non significa solo copia e incolla!
La domanda sorge spontanea: come si creano i contenuti duplicati? Analizziamo alcuni casi.

  • Variazioni dell’URL: se usi Google Analytics, potresti aver creato un link per tracciare il traffico proveniente da una specifica risorsa. Di conseguenza, ti troveresti con un link parametrico che va a duplicare quello originale. Lo stesso accade sui siti di e-commerce, dove puoi filtrare i prodotti in vendita per colore, taglia etc. creando in questo modo URL (e quindi pagine) con lo stesso contenuto;
  • se il tuo sito esiste sia come www.tuodominio.it che come tuodominio.it, avrai due pagine duplicate. Lo stesso accade nel caso in cui la tua pagina è presente sul web sia in versione http:// che in versione https://, senza dimenticare il caso in cui tu abbia una pagina che è online sia con URL che termina con o senza slash (/) finale;
  • sempre sui siti di e-commerce può capitare che le schede prodotto si ripetano. Lo stesso accade se un distributore copia le informazioni di prodotto di un articolo presente sul sito del fornitore originale.

 

Come evitare i contenuti duplicati

Partendo dalla peggiore delle ipotesi (il plagio), per evitare duplicati è buona norma creare contenuti originali e che creino valore aggiunto per l’utente al quale sono indirizzati. In tutti gli altri casi elencati nel paragrafo precedente, ci sono alcuni accorgimenti che è utile applicare se vogliamo stare tranquilli e preoccuparci solo di fare una buona ottimizzazione SEO. In sostanza, dobbiamo dire a Google quale delle due versioni esistenti è quella a cui deve dare priorità e considerare, in termini tecnici, canonica.
Per raggiungere questo risultato puoi ricorrere ad alcuni accorgimenti:

  • applicare un 301 redirect alla pagina duplicata (scopri qui come fare un redirect), in modo che il traffico venga reindirizzato sulla pagina principale. I due contenuti non saranno più in competizione e quello promosso riceverà gli eventuali benefit a livello SEO (es. authority);
  • specificare un URL canonico, perché nel caso in cui tu abbia due pagine identiche (ad esempio una standard e una ottimizzata per mobile), è bene specificare quale sia quella che Google deve considerare come canonica e da indicizzare, altrimenti verranno rilevati due contenuti duplicati. Evita quindi di avere una pagina duplicata senza tag canonical;
  • inserire il meta tag “noindex”, per evitare che venga indicizzata una pagina scansionata dal crawler di Google e che possa rischiare di essere penalizzata;
  • applicare l’attributo “nofollow” alle pagine duplicate. In questo modo, il crawler di Google eviterà di indicizzare le pagine oggetto di nofollow al momento della scansione del sito;
  • includere l’URL preferito nella Sitemap.

Tieni presente che per molto tempo è stato possibile impostare il dominio preferito anche da Google Search Console ma, in seguito ad un recente aggiornamento, il motore di ricerca sceglierà in autonomia in base a vari parametri. Per questo motivo, è opportuno ricorrere ad uno degli strumenti che abbiamo elencato qui sopra.
Puoi comunque continuare ad utilizzare Google Search Console per rilevare i posizionamenti SEO nelle SERP di Google.

Un ultimo suggerimento: controlla sempre i tuoi link interni. E’ fondamentale che i tuoi link puntino sempre allo stesso URL (quello corretto); non perdere l’occasione di fare periodicamente una SEO Audit per controllare l’ottimizzazione del tuo sito!
Non sai come controllare l’esistenza di contenuti duplicati? Prova uno dei tanti SEO tools a disposizione sul web!

Hai ancora qualche dubbio? Iscriviti subito ai corsi di Digital-coach!

Corso SEO base  Corso SEO specialist    Corso SEO advanced  

 

 

[wprs-box]

Valutazione Digital Coach su Google