Conteúdo Duplicado e Múltiplos Domínios
Leitores do Brasil SEO,
Hoje estamos trazendo um vídeo muito interessante sobre conteúdo duplicado e múltiplos domínios postado por Greg Grothaus , engenheiro de qualidade das buscas do Google. O vídeo tem duração de quase 15 minutos então dividimos o vídeo em duas partes, pois o youtube não aceitava videos com duração superior a 10 minutos. Recomendo que assistam pois tem muita informação interessante, incluindo o mito da penalidade por conteúdo duplicado.
Questões sobre conteúdo duplicado e Sites Múltiplos – Greg Grothaus – Engenheiro, Qualidade de Busca do Google – 12 de agosto de 2009 – SES (Search Engine Strategies) em San Jose.
Olá a todos.
Em 12 de agosto, eu dei uma palestra no SES (Search Engine Strategies) San Jose sobre questões de conteúdo duplicado e Sites Múltiplos. E para levar estas informações para o maior público possível, estamos repetindo parte dela no Canal do Webmaster do Google.
Então, primeiramente, meu nome é Greg Grothaus, eu sou um engenheiro de softawre que trabalha na Qualidade de Busca do Google. Eu estou aqui há 4 anos. E o que fazemos na Qualidade de Busca é achar a informação correta e posiciona-la corretamente. Eu sou um “Googler” (pessoa que trabalha ou faz uso do Google) aficionado.
E o que nós estamos fazendo aqui é fazendo meu emprego de falar sobre o Google Webmaster. Então podemos explicar melhor coisas de como a Qualidade de Busca do Google funciona. Então estaremos falando de Conteúdo duplicado hoje.
Primeiramente eu gostaria de esclarecer um mito que anda circulando sobre conteúdo duplicado chamado de penalidade sobre conteúdo duplicado. De forma geral, pessoas tem se preocupado em o Google ter uma penalidade para sites que possuem conteúdo duplicado. Pessoalmente, acho que a razão para isso é as pessoas verem esta mensagem quando fazem uma busca:
“Em ordem de mostrar os resultados mais relevantes, nós omitimos algumas respostas muito similares as 20 já mostradas. Se você preferir, você pode repetir a busca com os resultados omitidos.” E elas clicam no link de repetir a busca e veem: “Oh não, meu site foi omitido dos resultados de busca do Google.” E eu penso que as pessoas ficam preocupadas achando que o Google está aplicando uma penalidade em seus sites.
Mas o que está acontecendo é que nós observamos a busca que o usuário está fazendo e queremos retornar diversidade nos resultados que mostramos ao usuário. Então se alguém procura por “coelhos de pelúcia”, nós queremos mostrar, talvez, a página um do wikipedia sobre “coelhos de pelúcia” e não a página dois. A versão de impressão do mesmo artigo. Que é exatamente o mesmo texto. Então o que estamos fazendo para esta busca é omitir o artigo de impressão.
Não é uma penalidade. Na verdade, se você ajusta a busca para “coelhos de pelúcia versão de impressão”, você provavelmente terá o efeito contrário, onde a versão de impressão será mostrada ao invés do artigo inicial da wikipedia sobre coelhos de pelúcia. E então eu pensei que deveria lhes mostrar um pouco sobre informações em nossas diretrizes de conteúdo duplicado. Apenas alguns pedaços.
Você pode achar mais informação procurando no google por “Duplicate Content Guidelines”. Mas essencialmente o que dizemos é: “Nós reconhecemos que a maioria dos conteúdos duplicados não é de origem enganosa.” E então como resultado, nós não estamos tentando penalizá-lo, nós apenas estamos tentando mostrar nos resultados de busca exemplos de páginas que são distintas e possuem informação útil que é diferente dos resultados mostrados acima. E isto depende muito da busca.
Há algumas exceções a isto, que nos chamamos de “spam” na Qualidade de Busca. Essa exceção não é por conteúdo duplicado, mas uma penalidade por spam. Então, alguém que cria um site que é uma cópia exata dos artigos da wikipedia ou alguma outra fonte, sem nenhuma valor adicional, e prepara a página para direcionar o tráfego para e-commerce ou algo assim. Ele está atrapalhando o usuário e o Google.
Como resultado, nós gostamos de retirar este conteúdo ou reduzir seu posicionamento. Isso é o que nós chamamos de tentativa de manipular os posicionamentos e enganar nossos usuários. Assim como spammers usam a tag de negrito numa página, spammers podem usar conteúdo duplicado. Apenas porque as tags de negrito estão lá, não significa que iremos mover ou penalizar alguém pelo uso delas.
Da mesma maneira, nós não iremos penalizar alguém por usar conteúdo duplicado. Estaremos penalizando por spam, e conteúdo duplicado pode estar lá também. Você pode encontrar muito mais informação sobre isso em nossas diretrizes do Google para Webmasters.
Certo, então agora vou falar um pouco mais sobre o que é conteúdo duplicado. Agora que passamos a questão sobre este mito. Aqui eu mostro 8 exemplos de URL que são todas idênticas. As URLs são diferentes, mas o conteúdo é o mesmo. Isto realmente acontece? Sim. Aqui eu mostro 3 versões diferentes do site governamental britânico, a Monarquia Britânica.
Cada versão tem exatamente o mesmo conteúdo, mas URLs levemente diferentes. Então este é um site muito grande. Muitos sites tem este mesmo problema. Então por que isso é um problema, qual a questão aqui? Obviamente não existe uma penalidade relacionada aqui, nós não removeremos o site da monarquia real. O que está acontecendo aqui é que você pode ter alguns efeitos colaterais, porém mais de segunda ordem.
Um exemplo disso é: se você tem links para diferentes versões desta página, você não está acumulando todo esse “link juice” no mesmo lugar. Então vamos dizer que você tem duas páginas iguais em conteúdo mas URLs diferentes. Você tem 10 links para uma e 10 links para outra. Ao invés de ter 20 links para uma página e posiciona-la muito bem, ambos os sites possuem apenas 10 links e desaparecem nos posicionamentos, ou potencialmente dependendo da busca.
Então este é um problema, um segundo problema é que o Google automaticamente vai tentar descobrir que estas páginas são a mesma e irá junta-las nos resultados de busca e mostrar apenas uma URL. Quando fazemos isso, é como nós estarmos tentando pegar a melhor URL para o usuário, mas as vezes pegamos a errada. Você é a melhor pessoa para saber qual URL você gostaria que o usuário visse como um Webmaster.
Então se você nos ajudar a ter certeza que temos apenas um resultado você pode ter certeza que uma URL amigável está em nossos resultados de busca e usuários clicam nelas mais frequentemente. E por último, mas não menos importante. Se existem mais páginas no seu site que temos que capturar e são basicamente a mesma coisa, nós não chegaremos a fundo nas novas coisas que você gostaria que encontrássemos.
Então é sempre bom que o Google Crawler capture o máximo de conteúdo que ele puder, mas se capturamos a mesma coisa sempre, nós provavelmente não veremos tudo que podemos. Então, como você resolve problemas de conteúdo duplicado? A primeira coisa é entender o que nós chamos de “canonical”. E a canonical significa: a versão mais simples do conteúdo que você pode mostrar, sem perder a generalidade.
Então a canonical se refere à URL que você quer mostrar sobre aquele conteúdo. Então se você tem um conteúdo que aparece em duas URLs diferentes, escolha que você gosta. Está será a URL canonical. Agora que você escolheu a que você quer. Existem vários modos de você passar ao Google essa informação. A melhor maneira de se fazer isso, é estruturar seu site para todos os links irem para a versão canonical, então usuários geralmente irão chegar na versão canonical e quando eles linkarem para você eles linkarão para a versão canonical também.
Mas em adição a isso, você pode usar de outros truques chamados redirecionamento 301 ou, esta nova opção, que é nova desde o SES do ano passado, que é a rel=canonical. Nós falaremos disso em um segundo. Para redirecionamentos 301, estes são um cabeçalho http que são mandandos no arquivo ao usuário.
O que ele faz é dizer ao navegador e ao Google: “Esta não é a URL que você quer, a que você quer está em outro lugar.” E o que acontece com os usuários é que eles serão redirecionados para o lugar certo. E o Google irá trata-lo da mesma forma. Então se o usuário chegar ao seu site na URL errada, usar um 301 o levará para o lugar certo. E isto também funciona muito bem para o Google.
Um uso comum disso é mover um site, para um novo domínio, um novo servidor, ou se você quer mudar a estrutura das URLs no seu site. Nós temos muito mais informação sobre isso no Google Webmaster Help Center se você quiser mais informação além do que posso falar aqui esta noite. 301 são ótimos, e nós temos está opção faz muito tempo.
Mas existem ocasiões em que notamos que o 301 não se encaixa tão bem. Um bom exemplo disso é a página do wikipedia que tem algum conteúdo nela, e existe um link no lado esquerdo da página que é para a versão de impressão da mesma página. se você faz um 301 na versão de impressão de volta para o conteúdo original, não há como o usuário fazer uso dessa versão de impressão. Então, essencialmente isto é um sistema quebrado.
O que normalmente ouvimos é uma nova tag rel=canonical, vou explicar isso aqui em um segundo. Aqui temos outro exemplo que é essencialmente, vamos dizer, URLs como um meio de IU (interface de usuário). Vamos dizer que você visite o site “stuff.com” e quer comprar alguns sacos de dormir vermelhos. Você clica em barracas, saco e você compra sacos de dormir vermelhos. Outra pessoa vem e clica em sacos, barracas e compra sacos de dormir vermelhos.
Você está mostrando na URL o “breadcrumbs” (migalhas de pão) que é o caminho do usuário. Dando ao usuário a sensação de onde eles estavam e para onde estão indo e ainda os ajuda a estruturarem na mente como seu site funciona. Então o mesmo conteúdo pode ser encontrado por caminhos diferentes. Está tudo bem. Mas o problema é q se você usar 301 para arrumar isso você perde o valor da URL ser uma IU. Este é um dos maiores problemas que a URL canonical vem solucionar. Então a URL canonical é apenas uma tag html.
Você coloca ela na sua página e diz: “Esta página aqui, eu quero mandar esta canonical para esta outra página aqui.” Então vamos dizer que o usuário ou o Googlebot chega em “vermelho – barracas – sacos”, E você quer que “vermelho – sacos – barracas” seja a canonical. Então você diz ao google sobre essas tags, e coloca a tag na primeira pagina para outra página, e o googlebot irá tratar isso como um redirecionamento 301, enquanto os usuários não perceberão nada.
Isto funciona muito bem para os casos que eu já vi, mas também funciona muito bem se você não tem controle ou talvez a resposta do seu servidor ADP esteja mandando de volta usuários, ou qualquer outro motivo pelo qual você não queira usar 301. Então vamos passar por algumas perguntas e respostas sobre isso.
Como rel=canonical funciona? E quais são as regras para usa-la? A regra é que você pode passar de uma URL para outra URL desde que estejam no mesmo domínio.
Ela funciona através de hosts? hosts diferentes? Então por exemplo, zeta.zappos.com poderia passar para www . zeta. com. Mas não funciona através de domínios. Então zeta.com não poderia passar para google.com por exemplo, com canonical. Você pode usar para protocolos como http vs. https e você pode usar para portas também.
Devo usar 301 ou devo usar rel=canonical? Isto depende totalmente de você, é apenas mais uma ferramenta no seu arsenal, outra opção pra você. E a última pergunta que temos é:
As páginas precisam ser idênticas? O problema é quando chegamos a mesma página duas vezes, nós devemos olhar a data da página, o último update de um blog, ou qualquer outra coisa. Nós devemos notar que elas são um pouco diferente. Nós podemos esperar que elas sejam completamente idênticas. Mas nós esperamos que elas sejam bem semelhantes. Então pequenas diferenças estão OK.
Então vou falar um pouco sobre multíplos domínios rapidamente. É um problema muito comum para webmasters tentar imaginar o que eles querem fazer com multiplos dominios. Isso é muito comum no caso de vários domínios para diferentes países, como a versão em alemão de um site, a versão em francês. Então eu devo ter o .de e o .fr. O Google acha isso ótimo. Nós pensamos que domínios multiplos é totalmente normal. Mas há algumas coisas para se manter em mente.
Eu já vi essa preocupação antes, como o conteúdo dividido entre várias URLs se aplica aqui. Então por exemplo, se você tem uma versão francesa e uma alemã do seu site, os links para estes não se acumulam, eles se aplicam individualmente para cada site. Então você está fazendo uma troca aqui, talvez você queira a reputação acumulada por idioma ou toda em um site pelos países.
E também, o google tende a pegar apenas um dos domínios para uma busca. Pegamos o que achamos melhor. Então se você tem conteúdo em diferentes domínios, do mesmo idioma, digamos a versão australiana vs. a versão inglesa da mesma página, ambas são em inglês e em diferentes domínios. Nós devemos notar isso, e o conteúdo é basicamente o mesmo para a mesma busca, então escolheremos um.
Na maioria das vezes vamos devolver exatamente que você esperava, o “uk” para Inglaterra e o “au” para a Austrália. Mas em alguns casos vamos nos enganar. E há muito que você pode fazer para nos ajudar. Com o Console para Webmaters você pode logar e setar cada dominío para um local específico. Fazendo isso você faz com que não nos enganemos.
Isto provavelmente não é importante, mas eu gosto. Você perde a vantagem IU de abas. Então se você faz uma busca no google que irá lhe devolver o seu site, e existem duas páginas neste site que correspondem a esta busca. Nós iremos mostrar o site primeiro e o segundo resultado logo abaixo com tabulação.
E também mostramos um link “Mostre mais resultados meusite.com”. E tudo isso chama a atenção do usuário para este bloco de informação na página de resultados de busca do Google. Isto lhe trará mais visibilidade e possivelmente lhe trará mais cliques. Então é algo bem útil. Mas se você tem este conteúdo dividido entre vários domínios, você não terá essa vantagem.
Está é outra troca que você deve considerar quando optar por múltiplos domínios. Mas existem muitos casos onde múltiplos domínios são muito úteis, especialmente quando falamos de diferentes idiomas, porque usuários realmente querem ver as coisas em seu próprio local, e você deseja criar essa experiência por país e trabalhar com isso.
Então isto é basicamente tudo o que temos aqui sobre conteúdo duplicado. Uma pequena sessão do SES. E muito obrigado.
Artigos Relacionados
- Como Trabalhar Conteúdo Duplicado em seu Site
- Rel Canonical: Uma Ajuda Contra Conteúdo Duplicado
- Começando em SEO? 10 Erros que Não se Deve Cometer
- Barra do Digg e Conteúdo Duplicado
- Redirecionar um Grande Número de Domínios é Suspeito?


Sobre o Site:
Assine Nosso Feed
Categorias:
Posts Mais Recentes
Posts Mais Visitados
Meta

setembro 17th, 2009 as 11:21 pm
O vídeo realmente é bom e claro. Não estava difícil de entender, mas a tradução é uma “mão na roda”. Tks!
maio 7th, 2010 as 4:49 pm
Caros quanto a multiplos dominios gostaria de saber se o Google permite que um site que ja esteja em primeiro lugar, acaba usando outros dominios para conseguir mais posição na primeira pagina, sendo que ao clicar acaba sendo redirecionado para o mesmo site principal. Um exemplo que vi é a pesquisa para a palavra “curitiba imóveis” neste caso aparece http://www.imoveiscuritiba.com.br em 1 e 2 lugar e imoveisdaqui.com em 3 lugar e imoveisdaqui.net em 4 lugar, ao clicar nos dominios que esta em 3 e 4 lugar você é redirecionado para o primeiro site http://www.imoveiscuritiba.com.br, acho isso uma grande sacanagem e o Google pelo visto permite.
maio 30th, 2010 as 12:58 am
Ronaldo,
Essa técnica usada por esse site é considerada black hat. A única coisa positiva neles é que os imóveis anunciados são diferentes, e por isso, não foram punidos.
Porém quando consultei o imoveisdaqui.com já não aparecia mais, o que indica que o google está de olho.
Casos como esse infelizmente ainda acontecem, mas o google tenta minimizar. O que você pode fazer é denunciar o site como spam e explicar o problema em https://www.google.com/webmasters/tools/spamreport?hl=pt-BR&pli=1
Espero que o problema seja resolvido.
Abraços
Anderson
Equipe Brasil SEO