O que é Referrer Spam?

O que é Referrer Spam?

UPDATE: 21/12/2015

Estas instruções estão ultrapassadas e complicadas demais! Agora existe uma ferramenta para bloquear refferer spam. Dá uma conferida! Este post vai ficar no ar apenas para referência sobre o que é o referrer spam.

E como remover o referrer spam dos seus relatórios no google analytics?

Em um belo dia você abre o seu relatório no Google Analytics, e lá está – suas visitas tiveram um incremento fantástico de uma hora para outra!

Infelizmente esse momento de alegria logo se transforma em frustração. Ao checar os referrers (o site, as páginas ou domínios que originaram determinado tráfego), você logo percebe que tem algo errado.

São diversas visitas provenientes de domínios estranhos, tais como www1.social-buttons.comsemalt.com, darodar, sharebutton.org.

Você fica curioso e visita estes endereços, para ver do que se trata.

Pegadinha-do-malandro-2

Acessou? Caiu na pegadinha do Mallandro!

Ao acessar estes sites,  você foi mais uma vítima do referrer spam, também conhecido como log spam, referrer bombing, referral spam ou referral fantasma (ghost referral). Os termos são muitos, e as origens do tráfego também.

Como funciona o referrer spam?

E para começar, o que é um referrer?

Um referrer é um pedaço de informação que diz para o seu servidor de onde está vindo determinada visita. Esta informação vai para os seus logs de acesso, e assim você pode saber quais as principais origens do seu tráfego.

Continuando, estes spammers possuem diversos robôs que acessam o seu site e informam um referrer falso. Ao acessar os seus logs e relatórios de acesso, você verá dezenas de acessos destes sites. Então, por curiosidade, você entra nestes sites – apenas para descobrir que eles vendem produtos, geralmente focados para webmasters (plugins de wordpress, serviços de hospedagem, mecanismos de buscas chineses, etc).

Quais as implicações?

O referral spam pode parecer inofensivo, mas podemos dizer que é no mínimo chato, e pode deturpar as suas lindas estatísticas. Se você leva a sério os seus relatórios, então isto é inaceitável.

Veja bem, este spam não apenas infla os seus acessos – mas ele também acaba corrompendo os seus relatórios de conversão e de rejeição, por exemplo. Em alguns sites nossos, a rejeição (quantidade de visitantes que entram no seu site mas não interagem) pulou de 30% para mais de 55% em apenas um dia! Não preciso dizer que você pode tomar decisões erradas a partír destes números, e estratégias erradas podem se converter em menos vendas, conversões, metas.

E olha que ainda não estamos falando na possibilidade da disseminação de virus e malwares via referral spam (é melhor nem dar a ideia).

Como remover o referral spam?

É meio chato, mas vale a pena.

Obs: instruções válidas para o Google Analytics, em português.

Em primeiro lugar, não adianta simplesmente bloquear o acesso (via .htaccess ou javascript, por exemplo). Isto porque muitos destes caras acabam nunca acessando o seu site. Utilizando alguma forma de magia negra (ou seja, não faço a menor ideia), estes spammers acabam inserindo pageviews falsos no seu relatório do Google Analytics, sem acessar fisicamente o seu servidor. São os ghost referrals.

Existem outros que realmente vão acessar o seu servidor, e também existem os bots verdadeiros e úteis (como os bots dos mecanismos de busca, que acessam o seu site para fazer a indexação).

Portanto, tenha cuidado e não saia filtrando tudo no google analytics, sem testes. Use o bom senso.

Então, vamos trabalhar cada caso separadamente…

1. Ghost referrals

São as “origens de tráfego” que não acessaram o seu servidor fisicamente, mas que aparecem nos relatórios do google analytics.

Ex: darodar.com / econom.co / ilovevitaly.co / priceg.com / blackhatworth.com / hulfingtonpost.com

Atenção! Não vou me ater aos detalhes sobre como funciona um ghost refferal. Se você quiser saber mais detalhes, sugiro acessar este excelente artigo (no qual estamos nos baseando):

http://www.analyticsedge.com/2014/12/removing-referral-spam-google-analytics/

Vamos direto ao assunto – e sugerimos que você siga estes passos com atenção, para não excluir tráfego legítimo do seu relatório!

  • Acesse o seu Google Analytics e defina um período de tempo suficientemente grande (dois anos, por exemplo)
  • Após, siga este caminho: Público Alvo >> Tecnologia >> Rede >> Nome do Host

screen_1

clique na imagem para ampliar

 

  • Confirme os nomes que são válidos e aqueles que você não reconhece!
  • Crie uma expressão regular com os nomes válidos – e inclua todos os nomes que fazem parte do seu “ecosistema” – por exemplo, webservices de sistemas de cobrança ou de sistemas de comércio eletrônico, youtube, google translate, e assim por diante.
  • Siga o exemplo:
  • |www.warpnet.com.br|warpnet.com.br|blog.warpnet.com.br|
  • Para formar a expressão corretamente, precisamos colocar uma barra invertida antes dos pontos:
  • | www\.warpnet\.com\.br|warpnet\.com\.br|blog\.warpnet\.com\.br|
  • Crie um filtro utilizando uma vista nova! Se não souber criar uma vista nova, acesse “adicionar uma nova vista” na ajuda do Google. Após, siga os passos da imagem abaixo:

screen_2

clique na imagem para ampliar

  • Caminho: Administrador (1) >> Todos os filtros (2) >> Nome do filtro (neste caso hostname)(3) >> Tipo do filtro (personalizado)(4) >> Campo do filtro (nome do host)(5) >> Padrão do filtro (cole a expressão criada acima)(6) >> Selecione a vista criada anteriormente (neste caso Hostnames Filtrados)(7) >> Adicionar(8) >> Salvar.

Após completar estes passos, não esqueça de testar muitas vezes! Compare nova vista com a vista padrão (sem filtros), e em caso de erros, preste atenção e refaça os passos.

2. Crawlers e Referrals Falsos

Neste tipo de situação, conforme sugerido no site Analyticsedge, a solução é identificar os hosts que estão poluindo o seu relatório, e criar um filtro.

Se você já passou pelo passo #1, agora ficará mais facil. Veja esta imagem e siga os passos.

 

screen_3

clique na imagem para ampliar
 Fonte: Analyticsedge

 

Exemplo de filtro:

12masterov.com|med-zdorovie.com.ua|onlywoman.org|trion.od.ua

3. Bots e Spiders bem comportados

Estes são os robôs que estão cruzando a web em busca de conteúdo novo. Eles que vão indicar para os mecanismos de busca novos conteúdos para serem indexados. Então, é importante que você permita o acesso destes robôs.

O legal é que o Google Analytics pode excluir os acessos destes bots dos relatórios. Para isso, basta seguir o seguinte caminho:

Admin >> Visualizar >> Escolha a vista desejada >> Visualizar Configurações >> Filtragem de Bots

E marque: “Excluir todos os hits de bots e indexadores conhecidos”.

Conclusão

É chato, mas é importante utilizar os três métodos listados aqui. Se você leva a sério os seus relatórios, deve fazer isto obrigatoriamente.

Dúvidas, problemas, sugestões?

Entre em contato ou deixe um comentário. Não esqueça de compartilhar este post!

 

Se você for cliente da Warpnet, entre em contato com nosso suporte e faremos este serviço como cortesia, junto com uma avaliação de performance e SEO!

 

Fontes:

Definitive Guide to Removing Referral Spam por Analytics Edge

Removing Referral Spam from Google Analytics por Ben Travis