O que é decodificação de URL e codificação de URL?

Publicados: 2022-07-21

Quando você administra um site, é provável que em algum momento você encontre a decodificação de URL e a codificação de URL. Se você ainda não se deparou com eles, ou acabou de se deparar com eles pela primeira vez e quer mais informações, vamos explicar sobre eles aqui.

O que é um URL?

Uma URL (Uniform Resource Locator) é um endereço usado pelos navegadores para encontrar um recurso na internet. Normalmente, a URL levará a uma página da Web, como a que você está lendo. No entanto, às vezes, pode levar a um documento (como um documento pdf).

Todos os URLs têm uma estrutura que foi formulada pelo inventor da world wide web, Tim Berners-Lee. Eles também estão em conformidade com uma sintaxe genérica que se parece com:

scheme:{//{user:password@}host{:port}}path{?query}{#fragment}

Certos aspectos da sintaxe de URL estão obsoletos e não são usados ​​com frequência porque haveria problemas de segurança. Um bom exemplo disso seria o aspecto {user:password} . Enviar isso sem qualquer forma de proteção significaria que os hackers poderiam obter acesso a sistemas que não deveriam.

Um URL comum que você pode ver inclui:

https://example.com/page-1

Para esta URL, o esquema é o https. O host é o example.com e o caminho é o elemento page-1.

Caracteres de URL permitidos

Os URLs podem ter apenas alguns caracteres dentro deles. Todos os caracteres pertencem ao conjunto de caracteres US-ASCII que inclui números (0-9), letras (az) e alguns caracteres especiais. Se houver caracteres inseridos na URL por um proprietário de site que não estejam incluídos na codificação US-ASCII ou tenham sido reservados para um significado especial (incluindo ?, /, #, :), a URL precisará ser alterada .

É aqui que a codificação entra em ação, pois nenhuma parte da URL deve conter esses caracteres 'reservados', a menos que sejam pelo motivo específico pelo qual devem ser usados. Por exemplo, o caractere / é usado para indicar um caminho na URL.

Portanto, quando um desses caracteres é usado, os dados incluídos na URL precisam ser codificados. É quando o processo de codificação de URL converte os caracteres reservados, quaisquer caracteres não seguros e caracteres não ASCII em um formato que seja mais universalmente aceito e compreendido pelos navegadores e servidores da web.

O caractere é alterado durante o processo de codificação em algo que é um ou mais bytes representados por dois dígitos hexadecimais que são precedidos pelo sinal de porcentagem (%). É por isso que a codificação de URL às vezes é chamada de codificação de porcentagem.

Um exemplo disso é se você enviar o URL

https://example.com/hello world

Observe a lacuna entre olá e mundo. Isso não é permitido no formato de URL padrão e, portanto, precisa ser alterado. O padrão para isso seria %20, onde 20 é a representação padrão para um espaço. Portanto, o URL transmitido após a codificação de URL teria a seguinte aparência:

https://example.com/hello%20world

Por que a codificação de URL é importante?

A codificação de URL é uma parte importante para saber quando há erros em seus URLs. Se você puder reconhecer quando a codificação ocorreu, você pode entrar e examinar sua estrutura e encontrar maneiras de corrigir o problema, criando uma nova URL.

Ou você pode descobrir que tem caracteres não padronizados que precisa ter dentro da estrutura do URL e precisa descobrir como codificá-los para serem aceitos. Este pode ser o caso quando você tem uma pergunta em uma página e deseja vincular a essa seção da página. Você não pode ter o '?' na estrutura do URL, pois é um caractere reservado, portanto, você precisará codificá-lo.

A URL original que você pode querer seria:

https://example.com/questions#what-is-the-question? Mas na codificação seria alterado para:

https://example.com/questions#what-is-the-question%3F Isso levará o visitante às perguntas da página, no domínio example.com e à seção da página 'Qual é a pergunta?'

Como codificar corretamente um URL

Há um problema que quando você precisa codificar uma URL, erros podem ser cometidos no aspecto de codificação. Por exemplo, digamos que o URL example.com/a+b/c precisava ser codificado. O / entre o b e c pode ser um símbolo para o caminho e, portanto, um caractere permitido na URL ou pode ser o símbolo de divisão.

Portanto, codificar o URL exemplo.coma+b/c pode resultar em

example.com/a%2Bb/c or example.com/a%2Bb%2Fc.

Portanto, para codificar corretamente o domínio, você precisa saber o que o / entre o b e o c representa. Refere-se a uma divisão ou a um caminho no endereço?

Então, para codificar a URL corretamente, você precisa codificar diferentes seções. Isso inclui o host (por exemplo, example.com) e cada caminho individual.

Então, se fosse um caminho diferente, você precisaria codificar três partes: example.com, a+b e c.

Se, no entanto, foi feito para representar a divisão, então você deve codificar duas partes example.com e a+b/c.

Para ajudar na codificação de qualquer um dos seus URLs, você pode usar esta ferramenta on-line gratuita de decodificação de URL e codificação de URL da Gochyu. Você precisará inserir todos os diferentes caminhos do URL separadamente, mas ele fornecerá o código correto necessário para o sucesso.

Você pode até separar cada parte do URL em uma nova linha para obter um URL completo de uma só vez.

Assim, o URL

example.com/questions/what-is-the-question?#Answer#1

deve sair como:

example.com/questions/what-is-the-question%3F/#Answer%231

O que é decodificação de URL?

A decodificação de URL é o processo de codificação de URL ao contrário. É quando o URL foi codificado porque continha caracteres que não são aceitáveis. Agora você pode decodificar esse URL para que fique em um formato mais legível.

Isso pode ser importante para encontrar erros em um URL. Por exemplo, você pode ter colocado acidentalmente um # em uma URL. Ao decodificar, você pode removê-los e tornar os URLs mais legíveis para mecanismos de pesquisa e humanos. Uma vez removido, você poderá ver uma melhoria na classificação do seu site nos mecanismos de pesquisa ou obter mais tráfego direto, pois as pessoas agora podem usar um URL padronizado.

Se você precisar decodificar um URL, poderá usar nossa ferramenta on-line gratuita de decodificação de URL e codificação de URL. Tudo o que você precisa fazer é inserir o URL codificado na caixa e pressionar o botão de decodificação.

Palavra final: O que é decodificação de URL e codificação de URL?

Codificação é a simples mudança de caracteres dentro de uma URL, que não pode ser usada por vários motivos, em um código padronizado. Isso é para evitar erros ao recuperar os recursos de um servidor e permitir que os sites sejam renderizados corretamente em um navegador da Web. A decodificação é o oposto.

É muito importante reconhecer quando um URL foi codificado e garantir que você possa usar a codificação de URL e a decodificação de URL para corrigir erros em seu site.