Da ormai diversi anni la generazione di contenuti originali e di qualità è parte fondante di ogni strategia SEO onsite. Google dal 2011 ha avviato una lotta ai contenuti duplicati, rilasciando, ad esempio, Google Panda, l’aggiornamento dell’algoritmo che fra le altre cose penalizza i siti che presentano contenuti non originali.
Il primo chiarimento da fare è sulla definizione di contenuto duplicato. Questo termine può interessare il sito internamente ed esternamente. Un contenuto duplicato internamente può essere causato da diversi fattori, i più frequenti:
- Un restyling del sito, con conseguente modifica degli URL, senza implementazione dei corretti redirect 301.
- Presenza di contenuti identici a causa di una generazione di URL con parametri, senza implementazione del rel canonical.
- Presenza di contenuti identici in diverso formato (HTML e PDF, ad esempio), senza noindex per uno dei due.
In tutti questi casi l’intervento da fare è sul codice del proprio sito, che presenta delle problematiche.
Quando la duplicazione dei contenuti è esterna, ovvero tra domini diversi, il discorso cambia. In questo caso, infatti uno solo dei siti ha pubblicato il contenuto originale, gli altri hanno copiato.
In questo articolo vogliamo fornirti strumenti e indicazioni per capire se il tuo sito raccoglie contenuti duplicati e nel caso come rimediare.
SEO e contenuti duplicati
In generale, quando si vuole avviare una strategia SEO per un sito web occorre effettuare un’analisi dei contenuti, per verificare la loro originalità. Come abbiamo visto i contenuti duplicati possono vanificare anche importanti sforzi di ottimizzazione, in quanto il motore di ricerca, che è in grado di risalire all’anzianità di pubblicazione di un testo, difficilmente consente a un testo copiato di essere fra le prime posizioni (e volendo anche fra le prime pagine).
Nei rari casi in cui ci accorgiamo che i contenuti duplicati possono essere visualizzati con l’intento di manipolare il posizionamento e ingannare i nostri utenti, apportiamo le necessarie modifiche all’indicizzazione e al posizionamento dei siti interessati. Di conseguenza, il posizionamento dei siti può subire effetti negativi oppure il sito può essere rimosso completamente dall’indice di Google, in modo che non compaia più tra i risultati di ricerca.
Non sempre ci si trova davanti a un copia-incolla intenzionale, a volte si tratta di leggerezza o inconsapevolezza del fatto che si sta compiendo un’azione controproducente per il proprio business. Pensiamo agli e-commerce che inseriscono le descrizioni fornite dai produttori o ai siti che contengono una rassegna stampa e riproducono fedelmente testi pubblicati sulle testate giornalistiche. Google non prende sempre misure drastiche, solo quando individua un intento manipolatorio del posizionamento passa alla vera e propria penalizzazione, negli altri casi si limita a non mostrare i siti che non ritiene utili per gli utenti. Ciò significa che se sul tuo sito ci sono contenuti duplicati, difficilmente otterrai un buon posizionamento.
Tool per trovare contenuti duplicati
Esistono alcuni tool gratuiti online che consentono di effettuare un controllo sui contenuti duplicati. Ecco una nostra Top5:
#1 – Copyscape
Copyscape è uno dei più famosi tool per il controllo dei contenuti duplicati. Nella versione free è sufficiente inserire l’URL della pagina da controllare e cliccare su Go. Esiste una versione a pagamento che consente di inserire il testo da controllare, di avviare la ricerca su oltre 10.000 pagine, di escludere alcuni domini dalla ricerca e molto altro ancora. Il costo è di 0,05$ per ricerca.
#2 – Dupli Checker
Dupli Checker permette di controllare un testo inserito manualmente o caricato da un file. È possibile poi effettuare un confronto con i risultati rilevati, scoprendo la percentuale di testo uguale.
#3 – Plagiarisma
Plagiarisma consente di effettuare un controllo su Google solo a seguito della registrazione gratuita. Si potrà inserire il testo da controllare oppure l’URL della pagina. Esiste una versione a pagamento che dà accesso a ulteriori funzioni, il costo è di 0,05$ per ricerca.
#4 – Plagium
Plagium ha due versioni: free e a pagamento. La prima che offre un numero limitato di ricerche e funziona solo inserendo il testo che si vuole controllare. La seconda ha un costo di 0,07$ a ricerca e consente di ottenere un numero maggiore di risultati, poiché viene effettuata una ricerca più approfondita, inoltre è possibile effettuare un controllo anche per documenti in formato Word o PDF.
#5 – Plag Scan
PlagScan è un servizio molto completo, ma a pagamento, con piani che vanno da 4,99$ per ricerche su 5000 parole. Oltre a individuare le pagine che contengono testo duplicato, è possibile anche visualizzare dove si trova e confrontare le varie pagine.
Soluzioni per i contenuti duplicati
Vediamo alcune soluzioni applicabili nel caso in cui si individuino dei contenuti duplicati all’interno o all’esterno del sito:
- Mantieni una struttura URL coerente e corrispondente al contenuto della pagina, evita quindi https://www.tuosito.it/page
- Quando possibile utilizza domini di primo livello per gestire i siti multilingua.
- Controlla la diffusione dei contenuti che pubblichi, se sei tu a richiedere che questi vengano pubblicati altrove assicurati che ci sia sempre il link che rimanda al tuo sito e se possibili chiedi che venga inserito il tag noindex, in maniera da non permettere l’indicizzazione dei contenuti.
- Utilizza Search Console per indicare qual è la versione che preferisci per l’indicizzazione, ad esempio con o senza www.
- Riduci la ripetizione di testi standard, ad esempio per le informazioni sul copyright o sulla privacy policy crea un link a una pagina apposita, senza riportarle uguali su tutte le pagine del sito.
- Non pubblicare pagine per le quali non ci sono ancora contenuti, se lo fai assicurati di inserire il tag noindex.
- Accertati di conoscere e di impostare correttamente il CMS del tuo sito, al fine di evitare una duplicazione inconsapevole dei contenuti.
- Riduci al minimo i contenuti simili.
Se hai identificato contenuti duplicati nel tuo sito web contattaci per trovare una soluzione.