Índice:
Definição - O que significa Canonicalização?
A canonização é o processo de conversão de dados que envolve mais de uma representação em um formato padrão aprovado. Essa conversão garante que os dados estejam em conformidade com as regras canônicas. Isso compara diferentes representações para garantir equivalência, contar números de estruturas de dados distintas, impor uma ordem de classificação significativa e melhorar a eficiência do algoritmo, eliminando assim cálculos repetidos.
A canonização é usada em várias aplicações da Internet e de computador para gerar dados canônicos a partir de informações não-canônicas. A representação canônica de dados é amplamente utilizada em
otimização de mecanismo de busca (SEO), servidores Web, Unicode e XML.
Este termo também é conhecido como C14N, padronização ou normalização.
Techopedia explica Canonicalização
Em SEO, a canonização de URL trata do conteúdo da Web com mais de um URL possível. Isso pode criar discrepâncias nas pesquisas porque o mecanismo de pesquisa pode não estar ciente de qual URL deve ser exibido. A canonização seleciona o melhor URL entre várias opções, geralmente referindo-se a páginas iniciais. Embora certos URLs pareçam iguais, os servidores da Web retornam resultados diferentes para os URLs. Os mecanismos de pesquisa consideram apenas um URL em formato canônico.
A segurança do computador é baseada na canonização do nome do arquivo. Alguns servidores da Web podem ter uma regra de segurança para executar arquivos somente em um diretório específico. O arquivo será executado apenas se o caminho tiver o diretório especificado em seu nome. Cuidados especiais devem ser tomados para verificar se o nome do arquivo é uma representação exclusiva. Essa vulnerabilidade é chamada de travessia de diretório.
A maioria dos caracteres no padrão Unicode possui codificações de comprimento variável. Isso requer uma consideração de cada caractere de sequência e torna a validação de sequência mais complexa. Se todas as codificações de caracteres não forem consideradas na implementação do software, existe a possibilidade de erros. Esse problema pode ser eliminado usando a codificação única para cada caractere. A melhor alternativa, que qualquer software pode usar, é verificar se a string é canônica. Strings que não são canonizadas podem ser rejeitadas.
Um documento XML canônico é um documento XML no formato canônico XML. É definido pela especificação XML canônica. A canonização em XML elimina o espaço em branco nas tags, classifica as referências de namespace e elimina as redundantes e usa codificações de caracteres específicas. Ele também remove as declarações XML e DOCTYPE, além de transformar URLs relativas em URLs absolutas.
