Come eliminare lo spam da Google Analytics

Google Analytics è uno dei sistemi di analytics più conosciuto ed utilizzato al mondo e permette di svolgere analisi puntuali sul traffico al proprio sito web grazie a dati quali provenienze delle visite, tempo di permanenza sulle pagine, pagine viste e così via. Il problema dell’analisi dei dati sta nel cercare di avere un dato “pulito” che corrisponda esattamente al comportamento che gli utenti hanno sul nostro sito web.

Questo dato a volte (ultimamente sempre più spesso) è “sporcato” da visite che non fanno riferimento ad utenti reali bensì a a dei sistemi automatici che visitano il nostro sito per svariati motivi e che vengono tracciati da Google Analytics. Uno degli esempi più classici di tali sistemi sono gli spider dei motori di ricerca che visitano i siti web con l’obiettivo di scansionarne i contenuti per arricchire l’indice dei Search Engine.

Tra le visite non umane ai siti rientrano anche tutta una serie di visite SPAM generate sia da crawler spam che da referrer fantasma; mentre i primi sono veri e propri crawlers (software che analizzano i contenuti) che visitano il sito, i secondi sono sistemi che non interagiscono direttamente con il sito ma solo con Google Analytics inviando dati fittizi direttamente ai server di GA.

Un modo per vedere e quantificare il numero ed il tipo di visite spam rilevate sul nostro sito è quello di andare nei report Googlae Analyics ed accedere alla sezione Referral.

  1. Accedere a Google Analytics;
  2. Andare nella sezione Acquisizione;
  3. Cliccare su Referral.

In questa sezione vengono elencate tutte le proprietà che portano traffico al nostro sito web, ad esempio tramite un link; all’interno di questo report è possibile vedere tutto il traffico anomalo.

Distinguere il traffico reale da quello anomalo è abbastanza semplice; solitamente il traffico spam è caratterizzato da una frequenza di rimbalzo alta (spesso 100%)  e da una durata di sessione zero.

Referral Spam

Come bloccare Crawler Spam e Referrer Fantasma

Vista la sostanziale differenza tra i due sistemi di spamming esistono due diversi modi per bloccarli. I crawler spam sono dei bot che effettuano delle richieste al nostro server e per questo possono essere eliminati a monte impedendo al bot di accedere al sito.

Blocco dei Crawler Spam

Per bloccare i Crawler Spam ci viene in aiuto il file .htaccess del nostro sito. Il file si trova nella root principale del nostro server.

htaccess

Aprite il file .htaccess con un editor e al suo interno scrivete la seguente regola:

RewriteCond %{HTTP_REFERER} semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} best-seo-solution\.com [NC,OR]
RewriteCond %{HTTP_REFERER} best-seo-offer\.com [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC]
RewriteRule .* - [F]

Lo snippet sopra corrisponde ad una regola di redirect per il nostro server che in parole povere dice: nel momento in cui ricevi richiesta da parte del referrer X (in questo caso semalt o buttons-for-website ma potete inserire tutti i referre che volete) restituisci uno status code 403 (forbidden) in modo che al bot non sia consentito l’accesso al sito.

Attenzione: effettuate sempre un backup del file .htaccess prima di effettuare della variazioni, un piccolo errore nel file può provocare la non visualizzazione dell’intero sito web.
Blocco dei Referrer Fantasma

Al contrario dei bot i referrer spam non visitano realmente il nostro sito ma si “limitano” ad inviare dati fittizi a Google Analytics simulando visite ed altri azioni (a volte è possibile trovare dati anomali anche all’interno della sezione eventi di GA).

In questo caso il blocco tramite .htaccess non funziona quindi l’unico modo per ripulire il dato su Google Analytics è utilizzare un filtro avanzato che ci permetta di escludere i dati dei referrer fantasma.

Per crear un filtro avanzato entrare in:

  1. Amministrazione;
  2. Filtri;
  3. Nuovo Filtro.

A questo punto creiamo un filtro il cui scopo è quello di eliminare le sorgenti di traffico che abbiamo individuato nel precedente rapporto.

Filtro spam

Per escludere tutte le fonti referrer spam utilizziamo un espressione regolare separando i nomi delle sorgenti con il simbolo pipe (|) e utilizzando il simbolo backslash (\) come carattere di escape per il punto (.).

Attenzione: in un filtro GA è possibile inserire fino a 255 caratteri per le espressioni regolari; cercate sempre di trovare delle regole che possano andar bene per vari referrer in modo da limitare il n° di caratteri utilizzato.
Inserito in:

Lascia un commento

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Loading Facebook Comments ...