Você provavelmente já se deparou com o termo conteúdo duplicado com frequência, mas o que é? Conteúdo duplicado é aquele que vive em vários locais – ou seja, URLs. Isso pode prejudicar sua classificação e muitas pessoas dizem que em grandes quantidades podem até levar a uma penalidade do Google. Mas isso não é verdade. Não há penalidade, mas ter um monte de conteúdo duplicado ou copiado pode fazer com que o Google influencie sua classificação negativamente.
O que é conteúdo duplicado?
Conteúdo duplicado é todo o conteúdo que está disponível em vários locais dentro ou fora do seu site. Muitas vezes reside em uma URL diferente e às vezes até em um domínio diferente. Na maioria das vezes, acontece acidentalmente ou é o resultado de uma implementação técnica insatisfatória . Por exemplo, seu site pode estar disponível na versão www e não www ou HTTP e HTTPS – ou ambos ao mesmo tempo em um mesmo domínio, que horror! Ou talvez seu CMS usa parâmetros de URL dinâmicos excessivos que confundem os mecanismos de pesquisa. Até mesmo suas páginas AMP podem ser consideradas conteúdo duplicado se não forem linkadas corretamente.
A definição do Google de conteúdo duplicado é a seguinte:
“O conteúdo duplicado geralmente se refere a blocos substantivos de conteúdo dentro ou entre domínios que correspondem completamente a outro conteúdo ou são consideravelmente semelhantes. Na maioria das vezes, isso não é enganoso em sua origem. ”
Essa última parte é importante. Se você copiar conteúdo existente – o Google chama isso de conteúdo copiado – com a intenção de enganar o mecanismo de busca para obter uma classificação mais elevada, você estará em terreno perigoso.
O Google diz que esse tipo de intenção maliciosa pode desencadear uma ação:
“O conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado é enganar e manipular os resultados do mecanismo de pesquisa”
Conteúdo duplicado, conteúdo copiado e conteúdo superficial: qual é a diferença?
O assunto conteúdo duplicado confunde muita gente. Para o Google, ele tem uma origem principalmente técnica, mas também vai olhar para o conteúdo em si. “Tenho duas URLs para o mesmo artigo, qual devo escolher?” Embora a maioria das pessoas comuns provavelmente pensará em partes de conteúdo semelhante que aparecem em outro lugar em um site. “Usei este pedaço de texto em vários outros lugares, isso é ruim?” Tudo isso é conteúdo duplicado, mas para determinar as classificações, os mecanismos de pesquisa fazem uma distinção entre conteúdo duplicado, conteúdo copiado e conteúdo superficial.
Seu conteúdo duplicado pode ser classificado como conteúdo copiado se você usar um texto existente e reformulá-lo rapidamente para reutilizá-lo em seu site. Não importa se você girar um pouco ou inserir algumas palavras-chave, esse comportamento não é aceitável. Jogue em algumas páginas de conteúdo superficial – páginas que têm pouco ou nenhum conteúdo de qualidade – e você está em um território perigoso. A qualidade do site é um problema e essas táticas podem causar sérios danos ao seu site. Lembra do Panda?
Não bloqueie conteúdo duplicado em seu site
O Google é bastante apto para descobrir e lidar com conteúdo duplicado. O mecanismo de busca é inteligente o suficiente para descobrir o que fazer com a maior parte do conteúdo que encontra. Se encontrar várias versões de uma página, ele escolherá versão que achar melhor – na maioria dos casos, será o artigo / página original. O que ele precisa, porém, é acesso completo a essas URLs. Se você bloquear o Googlebot em seu robots.txt para rastrear essas URLs, ele não poderá descobrir essas coisas por si só e você correrá o risco de o Google tratar essas páginas como instâncias separadas. Aqui estão algumas coisas que você deve fazer:
- Permitir que os robôs rastreiem essas URLs;
- Marque o conteúdo como duplicado usando rel=canonical (leia mais sobre isso abaixo);
- Use redirecionamentos 301 para enviar usuários e rastreadores a URL canônica.
Use rel=canonical!
Uma das ferramentas essenciais em seu kit de ferramentas de combate a conteúdo duplicado é rel= ”canonical”. Você pode usar esse trecho de código para determinar qual é a URL original de um conteúdo, algo que chamamos de URL canônica.
Concentre-se em conteúdo original
Outra ferramenta em seu arsenal para combater conteúdo duplicado, copiado e não original são suas habilidades de escrita. O Google está focado na qualidade. Está sempre em busca do melhor conteúdo possível que se adapte melhor às intenções do usuário. Seu objetivo não deve ser ganhar dinheiro rápido, mas deixar uma impressão duradoura. Cuidado com o conteúdo superficial e certifique-se de torná-lo original e de alta qualidade.
O mesmo vale para conteúdo semelhante em seu site. Já falamos sobre canibalização de palavras-chave antes e esta é uma extensão disso. Mesclar várias postagens comparáveis em uma e você pode obter resultados muito melhores, tanto em termos de classificação quanto no combate a conteúdo duplicado.
Esta é a opinião do Google sobre conteúdo semelhante:
“Minimize o conteúdo semelhante: se você tiver muitas páginas semelhantes, considere expandir cada página ou consolidar as páginas em uma. Por exemplo, se você tem um site de viagens com páginas separadas para duas cidades, mas as mesmas informações em ambas as páginas, você pode mesclar as páginas em uma página sobre as duas cidades ou pode expandir cada página para conter um conteúdo exclusivo sobre cada cidade. ”
O conteúdo duplicado está em toda parte
O ex-googler Matt Cutts disse certa vez que 20% a 30% da web consiste em conteúdo duplicado. Embora eu não tenha certeza de que esses números ainda sejam precisos; o conteúdo duplicado continua aparecendo em todos os sites.