Como Trabalhar Conteúdo Duplicado em seu Site
Hoje vamos falar sobre gerenciamento de conteúdo duplicado dentro do seu próprio site. Este pode ser um desafio para quem possui websites com grande número de páginas internas, mais ainda se o site exige atualizações diárias, dando volume a quantidade de conteúdo, adicionando, alterando e excluindo recursos. Com o tempo os sites podem acumular páginas e duplicar o conteúdo de URLs que atendam ao mesmo conteúdo. Geralmente conteúdo duplicado em um site não é problemático, mas pode dificultar o rastreamento e a indexação destas páginas. Além disso, PageRank e outros dados semelhantes a linkagem interna do site podem se espalhar através das páginas que não são reconhecidas como duplicadas e isso pode fazer que seu site seja prejudicado no que se diz a posicionamento nos resultados de busca.
Dicas para lidar com conteúdo duplicado no seu site:
- Reconhecer o que é conteúdo duplicado:
- Determinar a URL preferida:
- Ser coerente dentro do seu próprio site:
- Use redirecionamento 301 permanente, sempre que necessário e possível:
- Aplicar o atributo rel = “canonical”:
- Use a ferramenta de manipulação de parâmetros no Google WebmasterTools:
- E sobre robots.txt?
Reconhecer o conteúdo duplicado no seu site é o mais importante. Uma maneira fácil de fazer isso é ter um trecho do texto de uma de suas páginas e realizar uma pesquisa, limitando os resultados para páginas dentro de seu próprio website usando o operador “site:”. Se você receber vários resultados para o mesmo conteúdo, você pode começar a analisar estas páginas.
Antes de resolver qualquer problema de conteúdo duplicado, você deve determinar a sua URL preferida e responder a pergunta: Qual URL você prefere usar para esse conteúdo?
Uma vez que você escolheu a sua URL preferida, certifique-se de usá-la em todos os lugares possíveis dentro do seu website (incluindo o Sitemap).
Redirecionar URLs duplicadas para a URL preferida usando um código de resposta 301 pode ajudar e muito os usuários e ferramentas de busca localizar a URL de escolha no caso de visitarem as URLs duplicadas. Se seu site tem vários domínios, faça a escolha de um e utilize o redirecionamento 301 nos outros, garantindo que os usuários são levados para a página desejada, não apenas para a página principal. Se você tem nomes de host com e sem “www”, escolha um e use a ferramenta do WebmasterTools para redirecionar corretamente.
Quando não é possível fazer um redirecionamento 301, o atributo rel = “canonical” pode ajudar as ferramentas de busca compreenderem melhor o seu site e suas URLs favoritas. Usando este elemento de ligação você padroniza as pesquisas em seu site para outros motores de busca além do Google, como o Ask.com, Yahoo! e Bing.
Se todo ou parte do conteúdo duplicado no seu site vem de parâmetros de consulta de URL, essa o Google WebmasterTools pode ajudar a avisar quais parâmetros são importantes e quais deles são irrelevantes para o sua URL. Digamos que você tenha um site de produtos de beleza e um dos itens principais seja um creme. A página do produto pode ser acessada por meio de diferentes URLs, especialmente se você usar IDs de sessão ou outros parâmetros:
example.com.br/produtos/mulheres/creme/morango.htm
example.com.br/produtos/mulheres/creme?cor=vermelha&cruel=não
example.com.br/loja/indice.php?product_id=32&highlight=morango+creme&cat_id=1&sessionid=123&affid=431
example.com.br/creme/coquetel?gclid=X20382
Se as ferramentas de busca souberem que essas páginas tem o mesmo conteúdo, podem indexar somente uma versão para os resultados de pesquisa. No entanto, com a ferramenta do Google estas podem ser ignoradas para reduzir o conteúdo duplicado e tornar o seu site mais rastreável.
Então, por exemplo se você especificar que o parâmetro sessionid deve ser ignorado, o Google considerará example.com.br/creme/morango.htm?sessionid=273749 como o mesmo que example.com.br/creme/morango.htm.
Não recomendamos bloquear o acesso a conteúdo duplicado no seu site com robots.txt ou com outros métodos. Ao bloquear os robôs ao invés de usar o atributo rel = “canonical”, ferramentas de manipulação de parâmetros ou redirecionamentos 301, os motores de buscas podem tratar essas URLs em separado, como páginas simples, e eles não vão saber que são URLs diferentes para o mesmo conteúdo. É melhor que sejam rastreadas, mas que sejam tratadas como duplicadas, utilizando um dos métodos recomendados aqui. Se você permitir que essas URLs sejam rastreadas, o robô vai aprender as regras para a identificação de conteúdo duplicado somente com olhar a URL e evitar novas varreduras desnecessárias.
Quando o conteúdo duplicado faz rastrear muito o seu site, você pode ajustar a taxa de rastreamento no Google Webmaster Tools com o objetivo de rastrear o maior número possível de páginas em seu site a cada visita, sem sobrecarregar a largura de banda do seu servidor.
Esperamos que estes métodos possam ajudá-los a gerenciar o conteúdo duplicado em seu site. Você pode encontrar mais informações sobre o conteúdo duplicado no nosso Site.
Até a Próxima!
Artigos Relacionados
- Rel Canonical: Uma Ajuda Contra Conteúdo Duplicado
- URLs Amigáveis: Ajudando Usuários e Mecanismos de Busca
- Google faz Crawler de Formulários
- Usar a Tag Rel=Canonical em Todas as Páginas?
- Barra do Digg e Conteúdo Duplicado


Sobre o Site:
Assine Nosso Feed
Categorias:
Posts Mais Recentes
Posts Mais Visitados
Meta

outubro 31st, 2009 as 1:41 pm
Otimo artigo Fabiola, muito obrigado! Não conhecia o operador “site:” e nunca teria imaginado que o robots.txt não trata as URLs duplicadas como duplicadas propiamente.
novembro 2nd, 2009 as 3:30 pm
Post e informações ótimos, Fabíola Faria!!!
dezembro 10th, 2009 as 9:23 pm
E ai pessoal
Quando comecei a trabalhar com SEO a dois anos, conteúdo duplicado era um fantasma que me perseguia constantemente, hoje, depois de muito estudo e uma ajuda aqui do Brasil SEO, já não tenho mais pesadelos com isso
Mas ainda tenho uma dúvida que me persegue. Vejam essas páginas:
http://assinebandalarga.uol.com.br/banda-larga-joinville-sc/
http://assinebandalarga.uol.com.br/banda-larga-londrina-pr/
Como elas podem não ser conteúdo duplicado, se a única diferença é o nome da cidade?
Abraços
dezembro 11th, 2009 as 12:02 am
Guto,
Vou pegar meio pesado com você. Da forma como está é conteúdo duplicado sim.
Qual é a diferença entre o serviço que é oferecido para Joinville e para Londrina?
Se não existe diferença não há necessidade de 2 páginas indexadas, agora se existe diferença, crie um conteúdo expondo essa diferença.
Espero ter ajudado
Abraços
Anderson Lopes
dezembro 11th, 2009 as 1:03 am
Valeu Anderson, entendi o que vc disse e concordo.
Mas o interessante é que essas páginas estão no ar a algum tempo, não têm nenhum conteúdo mostrando essa diferença e ambas estão muito bem rankeadas para as keywords ‘banda larga joinville’ e ‘banda larga londrina’. sendo 99% idênticas. É misterioso não é?!
E o pior, não são só essas duas, tem páginas idênticas para muitas outras cidades.
Eu já quebrei a cabeça e não consigo entender como podem não ser punidas como conteúdo duplicado.
Cabuloso :/
Abraços e valeu a atenção
dezembro 15th, 2009 as 12:18 am
Guto,
O que acontece é o seguinte, o conteúdo duplicado não pune, é apenas um filtro do google para não exibir “o mesmo conteudo” mais de uma vez.
Nesse caso que você passou, as duas páginas não são listadas ao mesmo tempo. Um exemplo de errro seria por exemplo se com “banda larga” estivesse aparecendo na primeira posicao a página de são paulo, na segunda a página do rio, etc.
Abs
Anderson Lopes
Equipe Brasil SEO
dezembro 24th, 2009 as 12:27 pm
Ainda não conhecia o site, li esse artigo e achei muito bem elaborado, vou me tornar um leitor frequente de hoje em diante,
um abraço.
fevereiro 1st, 2010 as 1:56 pm
Muito bom…
Pesquisei um texto e retornou 3 conteudos.
1 é a introdução do artigo na pagina inicial
2 é a introdução do artigo na pagina da categoria e
3 é o artigo em sí…
isto prejudica?
Grato.
fevereiro 5th, 2010 as 2:20 pm
Olá Renato,
Poderia explicar melhor, os 3 resultados pertencentes ao mesmo site?
Abraço
fevereiro 5th, 2010 as 2:28 pm
Oi,
Isso mesmo, no mesmo site.
Na verdade é o mesmo artigo, só que no google retorna estes 3 resultados. Isso seria conteudo duplicado?
Obrigado pela atenção
fevereiro 9th, 2010 as 1:09 pm
Renato,
É considerado conteúdo duplicado sim, pois os textos da introdução são iguais, porém em casos de conteúdo duplicado o que o google faz é escolher a versão que ele acredita ser a melhor e mostrar em primeiro.
Provavelmente essa consulta que você fez foi feita logo depois de o post ser indexado, como sua home e a página de categoria são mais “fortes” que o artigo que acabou de ser postado eles ficam na frente. Esse tipo de coisa acontece quando se usa agregadores de conteúdo também, logo que são indexados ele passam seu post.
Com o passar do tempo (uns 15 dias no máximo) o google deve perceber que a página daquele conteúdo é o artigo, visto que a home e a categoria “linkam” para ele e deve mudar o posicionamento.
Espero ter te ajudado
Abraço
Anderson Lopes
Equipe Brasil SEO
março 6th, 2010 as 8:33 am
Anderson,
Mas em relaçao a questao do Renato isso poderia prejudicar em virtude de ser duplicidade de conteudo para o google? Se sim com trabalhar essa questao pois em meu site tenho esse problema tenho varios post com partes das páginas principais
março 6th, 2010 as 12:54 pm
Mario,
O que acontece com blogs é o seguinte. Quando você posta um artigo novo, esse artigo fica exposto na homepage, na página de categoria e na página do próprio artigo, então temos o mesmo conteúdo em 3 páginas. Porém, na homepage e na categoria tem mais conteúdo do que a pagina do artigo o que tira um pouco a duplicidade.
Vc perguntou sobre prejudicar no google, conteúdo duplicado funciona assim: Se vc tem por exemplo 10 páginas com o mesmo texto que é relevante e deveria estar aparecendo p/ a palavra-chave “dsgfdsfds” o google irá escolher o melhor resultado dentre os 10 e mostrará somente ele, para ter conteúdo diferente aos usuários, ou seja, seu conteúdo sendo bom, vc não será prejudicado. Pode ser que o google mostre a página “errada” por um tempo, até que fique caracterizado qual é a página mais relevante sobre o assunto.
A recomendação do google no caso de blogs é que deixe ser indexado páginas de categoria, e que não tem problema o mesmo post aparecer em lugares diferentes. Respondi sua pergunta?
Abraços
Anderson Lopes
Equipe Brasil SEO
março 6th, 2010 as 2:43 pm
Na verdade foi perfeito pois acredito ter cometido um erro “fatal” publiquei artigos do meu site em vários sites de noticias exatamente igual e acabei sumindo do google por este motivo fiquei preocupado com o conteúdo duplicado dentro do site tb. Mas tenho outra questao, as pa’ginas dentro do meu site tem muitos links para downloads nada de linkfarm ou coisas assim apenas downloads isso pode ser um problema?
março 10th, 2010 as 2:25 am
Mario,
Vai depender muito dos sites linkados, se forem sites considerados ruins isso pode te prejudicar sim. O melhor nesses casos é usar o nofollow no link para não passar sinal de confiança no site.
Abraços
Anderson Lopes
Equipe Brasil SEO