¿Qué es la decodificación de URL y la codificación de URL?

Publicado: 2022-07-21

Cuando ejecuta un sitio web, es probable que en algún momento se encuentre con la decodificación y codificación de URL. Si aún no te has encontrado con estos, o acabas de encontrarlos por primera vez y quieres más información, aquí te los explicamos.

¿Qué es una URL?

Una URL (Localizador Uniforme de Recursos) es una dirección utilizada por los navegadores para encontrar un recurso en Internet. Normalmente, la URL llevará a una página web, como la que estás leyendo. Sin embargo, a veces, puede conducir a un documento (como un documento pdf).

Todas las URL tienen una estructura que fue formulada por el inventor de la red mundial, Tim Berners-Lee. También se ajustan a una sintaxis genérica que se ve así:

scheme:{//{user:password@}host{:port}}path{?query}{#fragment}

Ciertos aspectos de la sintaxis de URL están en desuso y no se usan con frecuencia porque habría problemas de seguridad. Un buen ejemplo de esto sería el aspecto {user:password} . Enviar esto sin ningún tipo de protección significaría que los piratas informáticos podrían obtener acceso a los sistemas que se supone que no deben.

Una URL común que puede ver incluye:

https://example.com/page-1

Para esta URL, el esquema es el https. El anfitrión es el ejemplo.com y la ruta es el elemento página-1.

Caracteres de URL permitidos

Las URL solo pueden tener ciertos caracteres dentro de ellas. Todos los caracteres pertenecen al juego de caracteres US-ASCII que incluye números (0-9), letras (az) y algunos caracteres especiales. Si hay caracteres colocados en la URL por el propietario de un sitio web que no están incluidos en la codificación US-ASCII o que se han reservado para un significado especial (incluidos ?, /, #, :), entonces la URL debe modificarse .

Aquí es donde entra en juego la codificación, ya que ninguna parte de la URL debe contener estos caracteres 'reservados' a menos que sean por la razón específica por la que se supone que deben usarse. Por ejemplo, el carácter / se usa para indicar una ruta en la URL.

Entonces, cuando se usa uno de estos caracteres, los datos que se incluyen en la URL deben codificarse. Aquí es cuando el proceso de codificación de URL convierte los caracteres reservados, cualquier carácter inseguro y caracteres que no sean ASCII a un formato que es más universalmente aceptado y entendido por los servidores y navegadores web.

El carácter se cambia durante el proceso de codificación en algo que es uno o más bytes representados por dos dígitos hexadecimales que están precedidos por el signo de porcentaje (%). Esta es la razón por la que la codificación de URL a veces se denomina codificación porcentual.

Un ejemplo de esto es si enviara la URL

https://example.com/hello world

Observe la brecha entre hola y mundo. Esto no está permitido en el formato de URL estándar y, por lo tanto, debe cambiarse. El estándar para esto sería %20 donde 20 es la representación estándar de un espacio. Por lo tanto, la URL transmitida después de la codificación de la URL se vería así:

https://example.com/hello%20world

¿Por qué es importante la codificación de URL?

La codificación de URL es una parte importante para saber cuándo hay errores en sus URL. Si puede reconocer cuándo se ha producido la codificación, puede entrar y observar su estructura y encontrar formas de solucionar el problema creando una nueva URL.

O puede encontrar que tiene caracteres no estandarizados que necesita tener dentro de la estructura de la URL y necesita saber cómo codificarlos para que sean aceptados. Este podría ser el caso cuando tiene una pregunta en una página y desea vincular a esa sección de la página. No puedes tener el '?' en la estructura de la URL, ya que es un carácter reservado, por lo que deberá codificarlo.

La URL original que podrías querer sería:

https://example.com/questions#what-is-the-question? Pero en la codificación se cambiaría a:

https://example.com/questions#what-is-the-question%3F Esto llevará al visitante a la página de preguntas, en el dominio ejemplo.com ya la sección de la página '¿Cuál es la pregunta?'

Cómo codificar correctamente una URL

Existe el problema de que cuando necesita codificar una URL, se pueden cometer errores en el aspecto de la codificación. Por ejemplo, digamos que la URL ejemplo.com/a+b/c debe codificarse. El / entre la b y la c podría ser un símbolo de la ruta y, por lo tanto, un carácter permitido dentro de la URL, o podría ser el símbolo de división.

Por lo tanto, codificar la URL ejemplo.coma+b/c podría resultar en

example.com/a%2Bb/c or example.com/a%2Bb%2Fc.

Entonces, para codificar correctamente el dominio, necesita saber qué representa el / entre la b y la c. ¿Se refiere a una división oa un camino en la dirección?

Luego, para codificar la URL correctamente, debe codificar diferentes secciones. Esto incluye el host (por ejemplo, example.com) y cada ruta individual.

Entonces, si fuera una ruta diferente, entonces necesitarías codificar tres partes: ejemplo.com, a+b y c.

Sin embargo, si estaba destinado a representar la división, entonces debe codificar dos partes ejemplo.com y a+b/c.

Para ayudar con la codificación de cualquiera de sus URL, puede usar esta herramienta en línea gratuita de decodificación y codificación de URL de Gochyu. Deberá ingresar todas las diferentes rutas de la URL por separado, pero le proporcionará el código correcto que necesita para tener éxito.

Incluso puede separar cada parte de la URL en una nueva línea para obtener una URL completa de una sola vez.

Entonces, la URL

example.com/questions/what-is-the-question?#Answer#1

debe salir como:

example.com/questions/what-is-the-question%3F/#Answer%231

¿Qué es la decodificación de URL?

La decodificación de URL es el proceso de codificación de URL a la inversa. Es cuando la URL ha sido codificada porque contenía caracteres que no son aceptables. Ahora puede decodificar esa URL para que esté en una forma más legible.

Esto puede ser importante para encontrar errores dentro de una URL. Por ejemplo, es posible que haya colocado accidentalmente un # dentro de una URL. Al decodificar, puede eliminarlos y hacer que las URL sean más legibles tanto para los motores de búsqueda como para los humanos. Una vez eliminado, podría ver una mejora en la clasificación de su sitio en los motores de búsqueda u obtener más tráfico directo ya que las personas ahora pueden usar una URL estandarizada.

Si necesita descodificar una URL, puede utilizar nuestra herramienta gratuita en línea de decodificación y codificación de URL. Todo lo que necesita hacer es ingresar la URL codificada en el cuadro y presionar el botón de decodificación.

Palabra final: ¿Qué es la decodificación de URL y la codificación de URL?

La codificación es el simple cambio de caracteres dentro de una URL, que no se puede usar por varias razones, en un código estandarizado. Esto es para evitar que se cometan errores al recuperar los recursos de un servidor y permitir que los sitios se representen correctamente en un navegador web. La decodificación es lo contrario.

Es muy importante reconocer cuándo se ha codificado una URL y asegurarse de que puede usar la codificación y decodificación de URL para corregir errores en su sitio web.