Che cos'è la decodifica e la codifica degli URL?

Pubblicato: 2022-07-21

Quando gestisci un sito Web, è probabile che a un certo punto ti imbatti nella decodifica e nella codifica degli URL. Se non li hai ancora incontrati, o li hai appena incontrati per la prima volta e desideri maggiori informazioni, te li spiegheremo qui.

Che cos'è un URL?

Un URL (Uniform Resource Locator) è un indirizzo utilizzato dai browser per trovare una risorsa su Internet. Normalmente, l'URL condurrà a una pagina web, come quella che stai leggendo. Tuttavia, a volte, potrebbe portare a un documento (come un documento pdf).

Tutti gli URL hanno una struttura che è stata formulata dall'inventore del world wide web, Tim Berners-Lee. Sono inoltre conformi a una sintassi generica che assomiglia a:

scheme:{//{user:password@}host{:port}}path{?query}{#fragment}

Alcuni aspetti della sintassi dell'URL sono deprecati e non vengono utilizzati spesso perché ci sarebbero problemi di sicurezza. Un buon esempio di questo sarebbe l'aspetto {user:password} . Inviare questo senza alcuna forma di protezione significherebbe che gli hacker potrebbero accedere a sistemi che non dovrebbero.

Un URL comune che potresti vedere include:

https://example.com/page-1

Per questo URL, lo schema è https. L'host è example.com e il percorso è l'elemento page-1.

Caratteri URL consentiti

Gli URL possono contenere solo determinati caratteri. I caratteri appartengono tutti al set di caratteri US-ASCII che include numeri (0-9), lettere (az) e alcuni caratteri speciali. Se ci sono caratteri inseriti nell'URL dal proprietario di un sito web che non sono inclusi nella codifica US-ASCII o sono stati riservati per un significato speciale (inclusi ?, /, #, :) allora l'URL deve essere modificato .

È qui che entra in gioco la codifica poiché nessuna parte dell'URL dovrebbe contenere questi caratteri "riservati" a meno che non siano per il motivo specifico per cui dovrebbero essere utilizzati. Ad esempio, il carattere / viene utilizzato per denotare un percorso nell'URL.

Pertanto, quando viene utilizzato uno di questi caratteri, i dati inclusi nell'URL devono essere codificati. Questo è quando il processo di codifica dell'URL converte i caratteri riservati, tutti i caratteri non sicuri e i caratteri non ASCII in un formato che è più universalmente accettato e compreso dai browser Web e dai server.

Il carattere viene modificato durante il processo di codifica in qualcosa che è uno o più byte rappresentati da due cifre esadecimali precedute dal segno di percentuale (%). Questo è il motivo per cui la codifica degli URL è talvolta chiamata codifica percentuale.

Un esempio è se dovessi inviare l'URL

https://example.com/hello world

Nota il divario tra ciao e mondo. Questo non è consentito nel formato URL standard e pertanto deve essere modificato. Lo standard per questo sarebbe %20 dove 20 è la rappresentazione standard per uno spazio. Pertanto, l'URL trasmesso dopo la codifica dell'URL sarebbe simile a:

https://example.com/hello%20world

Perché la codifica degli URL è importante?

La codifica degli URL è una parte importante per sapere quando ci sono errori all'interno dei tuoi URL. Se riesci a riconoscere quando si è verificata la codifica, puoi entrare e guardare la tua struttura e trovare modi per risolvere il problema, creando un nuovo URL.

Oppure potresti scoprire di avere caratteri non standardizzati che devi avere all'interno della struttura dell'URL e devi scoprire come codificarli per essere accettati. Questo potrebbe essere il caso quando hai una domanda in fondo a una pagina e desideri collegarti a quella sezione della pagina. Non puoi avere il '?' nella struttura dell'URL poiché si tratta di un carattere riservato, quindi dovrai codificarlo.

L'URL originale che potresti desiderare sarebbe:

https://example.com/questions#what-is-the-question? Ma nella codifica verrebbe cambiato in:

https://example.com/questions#what-is-the-question%3F Questo porterà quindi il visitatore alla pagina delle domande, sul dominio example.com e alla sezione della pagina "Qual è la domanda?"

Come codificare correttamente un URL

C'è un problema che quando è necessario codificare un URL, possono essere commessi errori nell'aspetto della codifica. Ad esempio, supponiamo che l'URL example.com/a+b/c debba essere codificato. La / tra b e c potrebbe essere un simbolo per il percorso e quindi un carattere consentito all'interno dell'URL oppure potrebbe essere il simbolo per dividere.

Pertanto, la codifica dell'URL example.coma+b/c potrebbe risultare in entrambi

example.com/a%2Bb/c or example.com/a%2Bb%2Fc.

Quindi, per codificare correttamente il dominio è necessario sapere cosa rappresenta la / tra b e c. Si riferisce a una divisione oa un percorso nell'indirizzo?

Quindi, per codificare correttamente l'URL, devi codificare diverse sezioni. Ciò include l'host (ad esempio example.com) e ogni singolo percorso.

Quindi, se fosse un percorso diverso, dovresti codificare tre parti: esempio.com, a+be c.

Se, tuttavia, doveva rappresentare lo spartiacque, allora dovresti codificare due parti example.com e a+b/c.

Per aiutarti con la codifica di qualsiasi tuo URL, puoi utilizzare questo strumento online gratuito di decodifica URL e codifica URL di Gochyu. Dovrai inserire tutti i diversi percorsi dell'URL separatamente, ma ti fornirà il codice corretto necessario per il successo.

Puoi anche separare ogni parte dell'URL su una nuova riga per ottenere un URL completo in una volta sola.

Quindi, l'URL

example.com/questions/what-is-the-question?#Answer#1

dovrebbe risultare:

example.com/questions/what-is-the-question%3F/#Answer%231

Che cos'è la decodifica degli URL?

La decodifica dell'URL è il processo di codifica dell'URL al contrario. È quando l'URL è stato codificato perché conteneva caratteri non accettabili. Ora puoi decodificare quell'URL in modo che sia in una forma più leggibile.

Questo può essere importante per trovare errori all'interno di un URL. Ad esempio, potresti aver inserito accidentalmente un # all'interno di un URL. Mediante la decodifica, puoi rimuoverli e rendere gli URL più leggibili sia dai motori di ricerca che dagli esseri umani. Una volta rimosso, potresti vedere un miglioramento del posizionamento del tuo sito sui motori di ricerca o ottenere più traffico diretto poiché le persone ora possono utilizzare un URL standardizzato.

Se devi decodificare un URL, puoi utilizzare il nostro strumento online gratuito di decodifica URL e codifica URL. Tutto quello che devi fare è inserire l'URL codificato nella casella e premere il pulsante di decodifica.

Parola finale: cos'è la decodifica e la codifica degli URL?

La codifica è il semplice cambio di caratteri all'interno di un URL, che non può essere utilizzato per vari motivi, in un codice standardizzato. Questo per evitare che vengano commessi errori nel recupero delle risorse da un server e per consentire ai siti di eseguire correttamente il rendering su un browser web. La decodifica è l'opposto.

È molto importante riconoscere quando un URL è stato codificato e assicurarsi di poter utilizzare la codifica e la decodifica URL per correggere gli errori sul tuo sito web.