Canonização de URLs
Posted by Dirceu | Filed under idna, punnycode, canonizacao-de-urls, uncategorized
Canonizar URLs possui dois significados, pode se tratar de não permitir URLs diferentes com o mesmo conteúdo no seu site para evitar punição por parte dos indexadores e pode tratar também da aplicação de técnicas por parte dos indexadores para "normalizar" ou "padronizar" URLs que apontam para o mesmo "documento".
O primeiro link desse texto leva para uma explicação mais detalhada sobre a parte de SEO, os métodos que citarei nesse artigo são relacionados a como normalizar URLs em uma aplicação (crawler, agregador, ...):
Punnycode
"Punycode" faz parte do protocolo para Internacionalização de nomes de domínio em aplicações. Sua utilização evita problemas de segurança como a utilização de caracteres de outras línguas para enganar a aplicação (por exemplo γahoo.com - gama do alfabeto grego). Existem implementações da IDNA para várias linguagens de programação...
rel="canonical"
Essa meta tag facilita para os indexadores a identificação de qual é o conteúdo original.
Um exemplo de uso é o do YouTube, onde mesmo se a URL do vídeo for algo como:
"http://www.youtube.com/watch?v=5rNws2Gb7u8&playnext_from=TL&videos=XGffngBzWp4 ...