Brasil SEO - Otimização de Sites (SEO) | Marketing de Busca (SEM)
Buscar no Brasil SEO:
spacer Brasil SEO » URL spacer
Categoria:

URL

Neste post vamos falar sobre os códigos de status HTTP (HTTP Status Code). Mas o que vem a ser isto? São códigos retornados pelos servidores como o status das respostas uma requisições feitas a eles por protocolo HTTP (como por exemplo via browser). Esses códigos são enviados juntamente a cabeçalho da resposta.

Você, webmaster ou webdeveloper, deve saber sobre essas respostas, especialmente para SEO. Pois são através desses códigos, que os motores de busca irão indexar suas páginas ou não.

No site na W3C você poderá ver com mais detalhes, mas tentarei listar aqui os principais códigos de resposta HTTP.

Códigos 1XX (100 e 101) são respostas provisórias, informa ao cliente que este pode continuar a fazer requisições.

Código 2XX indicam que o servidor processou a requisição com sucesso. Dentre elas temos as respostas com código 200 (sucesso), 201 (novo recurso criado), 202 (requisição aceita, mas não processada ainda) dentre outras.

Código 3XX significa que são necessárias novas ações para completar a ação. Diversas dessas vezes é que os recursos, ou as paginas, foram movidas de lugar.

Dentre esses códigos, temos:

  • 301 – A pagina foi movida PERMANENTEMENTE para um novo local. O mecanismo de busca irá indexar a nova página para que está URL foi redirecionada e, assim os motores de busca irão, a partir de agora, sempre buscar por esse novo endereço.
  • 302 – A pagina foi movida TEMPORIARIAMENTE para um novo local. Significa que a página é exibida em um lugar diferente, ou seja, o usuário será redirecionado para um novo local, porém, os buscadores continuarão rastreando o endereço original. Os mecanismos de busca tratam diferentemente entre si nesse caso. No caso do Google, ele não irá indexar a nova pagina, nem passar relevância para a nova página, a menos que a nova url seja mais curta que a antiga. Essa é a principal diferença entre 302 e 301
  • 304 – Conteúdo não modificado. O conteúdo não é exibido, mas significa que o conteúdo da página é o mesmo da última requisição.

Códigos 4XX significam que houve erro no processamento da requisição que não foi possível responder. Dentre esses erros, são os de código:

  • 401 – Não autorizado. Indica que o usuário necessita autenticar-se primeiro.
  • 403 – Negado. Servidor recusou a solicitação.
  • 404 – Não encontrado. Este erro é retornado quando solicitada uma página que não se encontra no servidor. Os motores de busca acabam encontrando erros 404 quando existem links quebrados em páginas que ele está visitando ou mesmo no sitemap.xml.

É possível detectar alguns desses erros no Google Web Master Tools, na seção Diagnósticos.

Códigos 5XX significam que houve erro interno no servidor, nada com a requisição. Deste são:

  • 501 – Não implementado. Isso quando o servidor não apresenta recursos para processar a requisição, como por exemplo método da requisição.
  • 503 – Serviço indisponível. Normalmente, é algo temporário, quando o servidor tem muitas requisições a processar, e acaba se sobrecarregando. Nos casos de manutenção do servidor ou página recomenda-se o retorno do código 503, para que os motores de busca não indexem mal suas páginas. Quando retornado 503, os motores de buscam voltam outra hora não alterando seu conteúdo em cache.

Devemos estar atentos a esses códigos, por isso sugiro um estudo mais aprofundados e, também, uma checagem de quais códigos o seu servidor está retornando em suas páginas.

Toneladas de perguntas do Reino Unido. J. da Inglaterra pergunta:Tirar extensão de arquivos das URLs (site.com/pasta/pagina.html versus site.com/pasta/pagina) tem benefício visível nas SERPs?

Eu realmente não acho que faça e pessoalmente eu não faria isso. Pessoas gostam de saber que eles estão clicando numa página html. Se você tem um diretório, lógico, tenha o diretório. Mas, pessoalmente se você não tem .html ou seu serviço web não está configurado direito, nós faremos suposições sobre se é um pdf ou .exe ou um cfm, sabe, todos os diferentes tipos que tentaremos supor, que tipo de conteúdo pode ser.

Então se possível, eu ficaria com o padrão, alguma coisa htm ou html, usuários entendem isso, não ficam confusos, não ficam preocupados em clicar num resultado.

Então, sabe, não faz diferença no posicionamento, mas acho que “comportalmente”, não fazer algo difícil que as pessoas travem nele ou se preocupem. Eu provavelmente ficaria com a extensão ter o .html ou algo assim.

Você pode encontrar mais informações sobre o uso de URLs amigáveis em nosso site.

Até a próxima!

Ae pessoal da BrasilSEO, mais uma novidade lançada pelo maiores players do mercado de buscas agora para
ajudar webmasters no combate ao conteúdo duplicado.

Os 3 maiores motores de busca da web (Google, Yahoo e MSN Live Search) uniram-se para criação de um formato que permita ao webmaster especificar publicamente qual a versão preferencial de uma URL. Dessa maneira websites que possuem uma grande quantidade de múltiplas URL´s com conteúdos idênticos ou similares serão melhor controlados. Será possivel dizer ao motor de busca qual é a URL preferêncial (ou canônica) dentre esse conjunto de múltiplas URL´s, garantindo a relevância para o conteúdo apresentado além de controlar qual a melhor URL a ser mostrada nos resultados de busca.

Googlebot Encontrando o Conteúdo Relevante com a Ajuda do Rel Canonical

Vamos utilizar como exemplo o site de vendas de Swidish Fish ( doce de goma colorido em forma de peixe ) sugerido no blog oficial do Google Webmasters Central.

Por exemplo, vamos imaginar que a versão preferencial de uma URL desse site fosse essa aqui:

[http://www.example.com/product.php?item=swedish-fish]

Mas tanto os usuários do site quanto o Googlebot pudessem acessar esse conteúdo de diversas outras URL´s. Mesmo que o conteúdo principal dessas URL´s seja o mesmo que aquele apresentado na URL preferencial, estas páginas podem apresentar uma pequena variação deste conteúdo simplesmente pelo fato de serem paginas parametrizadas que referenciam uma determinada categoria ou um parâmetro de ordenação:

[http://www.example.com/product.php?item=swedish-fish&category=gummy-candy]

ou até mesmo apresentarem conteúdos “idênticos” mas para URL´s diferenciadas por section ID´s ou parâmetros de rastreamento (tracking parameters):

[http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678]

Para evitar toda essa confusão agora é possivel utilizar a tag com o atributo rel=”canonical” referenciando a URL preferencial dentre esse conjunto de múltiplas URL´s em seu site quando houver. No nosso exemplo ficaria assim:

[<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" >]

A URL acima referencia a versão preferencial do nosso exemplo e deve ser adicionada no cabeçalho de todas outras múltiplas URL´s com conteúdo duplicado e derivadas da versão canonica.

Dessa maneira o Google entenderá que todas essas duplicatas referem-se a URL preferêncial:

[http://www.example.com/product.php?item=swedish-fish]

O mais interessante é q todas os outros atributos relacionados as essas URLs como PageRank também serão transferidos. Outro ponto importantíssimo é que essa tag agiria de forma similiar a um redirecionamento 301 pelos seguintes motivos:

  • Os links que seguem para as páginas desse conjunto de múltiplas URL´s seriam consolidados apenas para a URL especificada como canônica.
  • Além disso os motores de busca considerarão essa URL como sendo uma dica forte sobre a melhor URL a ser indexada. O termo “dica forte” foi utilizado pelo próprio engenheiro da equipe de indexação do Google.

Bom fica ai uma dica importante para webmasters que controlam sites com problema de conteúdo duplicado gerado por páginas parametrizadas. Mais uma grande ajuda oferecida pelo Google.

O post original foi apresentado no Blog Oficial do Google Webmaster, recomendo sua leitura na íntrega.

Erro 404 – A Página Não Foi Encontrada

Autor Postado por Cassiano Travareli na categoria Geral , URL
Comentários [18] Comentarios

Olá leitores do Brasil SEO, hoje quero mostrar como utlizar o Google Webmaster Tools para encontrar Erros 404 dentro de seu website. Mas antes vamos entender o que é o Erro 404.

Erro 404

O que é o Erro 404?

Erro 404 (404 Error), é a resposta de uma requisição ao servidor dizendo que a página em questão não foi encontrada (File Not found).

O Que Significam os Números 404?

  • O primeiro número quatro indica duas coisas: ou o endereço do site não existe mais ou ele está truncado.
  • O zero indica um erro de ortografia.
  • o último quatro indica acesso não autorizado.

Sempre que aparece um Erro 404 o endereço do site está errado ou ele não existe mais?

Algumas vezes, o Erro 404 (404 Error) não passa de um alarme falso. Tente atualizar a página novamente. Ás vezes o link no qual está tentando acessar esteja com a extensão errada também.

Vamos ao que interessa…

Qual a melhor maneira de se encontrar links quebrados em meu site?

Bom, na minha opinião, o melhor software para esse tipo de problema é o Xenu’s Link Sleuth. Ele verifica scripts, imagens, frames, mapas, css, etc. Realmente muito bom.

Como uso o Google Webmaster Tools para encontrar links quebrados?

Acesse o Google Webmaster Tools, entre na aba Diagnostics e depois em Web Crawl. Você terá acesso a uma lista de problemas que podem ser encontrados no seu site como:

  • Errors for URLs in Sitemaps -> URLs com problemas dentro de seu arquivo de sitemap
  • HTTP errors -> erros de HTTP
  • Not found -> Páginas não encontradas, ou seja, aqui é o report dos erros 404 encontrados em seu site
  • URLs not followed -> URLS que não são seguidas pelo Crawler
  • URLs restricted by robots.txt -> URLs que foram bloqueadas pelo robots.txt
  • URLs timed out -> URLs que excederam o tempo limite para renderização
  • Unreachable URLs -> URLs que não estão sendo alcançadas pelo Crawler

Clicando em Não Encontrado (Not Found), você terá acesso a:

  • lista de Urls que não foram encontradas
  • de quais páginas vieram esses links
  • a data em que o problema foi detectado

É muito importante estar sempre entrando no google webmaster tools e checando as informações sobre os Erros 404. Esses erros podem acontecer com maior frequencia em websites dinâmicos, com grande quantidade de urls, onde as vezes uma mudança no padrão do parâmetro da URL pode acarretar esse tipo de problema.

Como Posso Arrumar Isso?

Se os links com problemas vêm de algum site externo que talvez você tenha acesso como lugar de publicação de artigos, bookmarkings, etc. você pode entrar lá e alterar o link. Agora se você não tem acesso ao outro site, utilize redirecionamento 301, caso esse link tenha alguma relevância para você.

Escrevi esse artigo pois tenho encontrado bastante sites com esses problemas de Erro 404. Espero ter ajudado, e quando eu entrar em seu website espero não encontrar esse tipo de erro. Até mais!

Olá amigos leitores do Brasil SEO, no artigo de hoje iremos falar sobre o uso de URLs amigáveis, tanto para os leitores como também para os mecanismos de busca.

Primeiramente vamos esclarecer algumas coisas, existem dois tipos de URLs, as estáticas e as dinâmicas, abaixo exemplos:

  • URLs estáticas: http://www.meusite.com.br/arquivo.html
  • URLs dinâmicas: http://www.meusite.com.br/arquivo.php?nome=carlos&codigo=1&valor=10

Conforme podemos observar acima os dois tipos de URLs são de difícil memorização para que possamos guardá-las, por isso seria melhor termos URLs destas forma:

http://www.meusite.com.br/artigo/nome-do-artigo
ou

http://www.meusite.com.br/artigo/dia/mes/ano

Além disso, essas URLs geram outros problemas:

  • Você pode estar expondo uma tecnologia utilizada (php, asp, jsp)
  • Se você mudar de tecnologia todas estas URLs deverão ser alteradas

Bom para auxiliar nestes possíveis problemas, podemos usar de um recurso que o próprio servidor web APACHE nos disponibiliza, que seria o módulo mod_rewrite usando o arquivo .htaccess dentro de seu site.

  1. O que é o servidor web Apache?
    Servidor de páginas para web gratuito, ou seja, nele é onde ficam os arquivos do seu site.
  2. O que é este modo rewrite?
    Ele nada mais é que um módulo do servidor web que realiza a reescrita de forma transparente das URLs usando de Expressões regulares.
  3. O que é o arquivo .htaccess?
    É um arquivo de configuração usado pelo servidor web Apache, onde dentro dele você pode determinar como o seu servidor web irá trabalhar.
  4. Como funciona?
    Bom o primeiro passo e você ter em seu DocummentRoot (Local raiz para as páginas web dentro de um servidor) o arquivo .htaccess
    Este arquivo existindo teremos que observar se existe a seguinte linha:

    RewriteEngine On

    Estando presente esta linha acima, iremos agora tornar uma URL dinâmica em uma url amigável.
    Abaixo temos uma linha onde ela realiza a reescrita:

    RewriteRule ^([^\/]+)\/([0-9]+)\/([0-9]+)\/$ /arquivo.php?nome=$1&codigo=$2&valor=$3

    Com a linha acima teremos o seguinte:

    URL Amigável – URL de fácil memorização

    http://www.meusite.com.br/nome/codigo/valor/

    URL Real – que será executada no servidor com os parâmetros e variáveis

    http://www.meusite.com.br/arquivo.php?nome=carlos&codigo=1&valor=10

    Agora algumas explicações para um melhor entendimento da expressão regular apresenta acima

    ^ -> início da expressão regular
    ([^\/]+) -> (quando temos o acento circunflexo dentro de parenteses ele significa negação) negar qualquer coisa diferente de /
    \/ -> a contra-barra serve para escapar a barra
    ([0-9]+) -> parenteses para guardar a variável, colchetes significa um intervalo (0-9 = numeral, a-z = letras), + repetição 1 ou + vezes
    $ -> fim

Bom com isto terminamos nosso artigo, espero ter ajudado aos nossos leitores a tornarem suas URLs mais amigáveis.


Dúvidas de SEO
Siga o Brasil SEO no Twitter!