Что такое декодирование URL-адресов и кодирование URL-адресов?
Опубликовано: 2022-07-21Когда вы запускаете веб-сайт, вы, вероятно, в какой-то момент столкнетесь с декодированием URL-адресов и кодированием URL-адресов. Если вы еще не сталкивались с ними или столкнулись с ними впервые и хотите получить больше информации, мы расскажем о них здесь.
Что такое URL?
URL-адрес (унифицированный указатель ресурса) — это адрес, используемый браузерами для поиска ресурса в Интернете. Обычно URL-адрес ведет на веб-страницу, подобную той, которую вы читаете. Однако иногда это может привести к документу (например, документу в формате pdf).
Все URL-адреса имеют структуру, сформулированную изобретателем всемирной паутины Тимом Бернерсом-Ли. Они также соответствуют общему синтаксису, который выглядит так:
scheme:{//{user:password@}host{:port}}path{?query}{#fragment}
Некоторые аспекты синтаксиса URL-адресов устарели и используются редко из-за проблем с безопасностью. Хорошим примером этого может служить аспект {user:password}
. Отправка этого без какой-либо защиты будет означать, что хакеры могут получить доступ к системам, которые им не положены.
Общий URL-адрес, который вы можете увидеть, включает:
https://example.com/page-1
Для этого URL используется схема https. Хост — это example.com, а путь — это элемент page-1.
Допустимые символы URL
URL-адреса могут содержать только определенные символы. Все символы принадлежат к набору символов US-ASCII, который включает цифры (0-9), буквы (az) и несколько специальных символов. Если есть символы, размещенные в URL-адресе владельцем веб-сайта, которые не включены в кодировку US-ASCII или зарезервированы для специального значения (включая ?, /, #, :), то URL-адрес необходимо изменить. .
Здесь кодировка вступает в игру, так как никакая часть URL-адреса не должна содержать эти «зарезервированные» символы, если они не предназначены для конкретной причины, по которой они должны использоваться. Например, символ / используется для обозначения пути в URL-адресе.
Таким образом, когда используется один из этих символов, данные, включенные в URL-адрес, должны быть закодированы. Это когда процесс кодирования URL-адреса преобразует зарезервированные символы, любые небезопасные символы и символы, отличные от ASCII, в формат, который более универсально принимается и понимается веб-браузерами и серверами.
Символ изменяется в процессе кодирования на нечто, состоящее из одного или нескольких байтов, представленных двумя шестнадцатеричными цифрами, которым предшествует знак процента (%). Вот почему кодирование URL иногда называют процентным кодированием.
Например, если вы должны были отправить URL
https://example.com/hello world
Обратите внимание на разрыв между приветствием и миром. Это не разрешено в стандартном формате URL и поэтому должно быть изменено. Стандарт для этого будет %20, где 20 является стандартным представлением пробела. Следовательно, URL-адрес, передаваемый после кодирования URL-адреса, будет выглядеть так:
https://example.com/hello%20world
Почему кодирование URL важно?
Кодирование URL-адресов является важной частью определения ошибок в ваших URL-адресах. Если вы можете распознать, когда произошло кодирование, вы можете зайти и посмотреть на свою структуру и найти способы исправить проблему, создав новый URL-адрес.
Или вы можете обнаружить, что у вас есть нестандартные символы, которые вам нужны в структуре URL-адреса, и вам нужно выяснить, как их кодировать, чтобы они были приняты. Это может быть тот случай, когда у вас есть вопрос на странице и вы хотите сделать ссылку на этот раздел страницы. У вас не может быть '?' в структуре URL, так как это зарезервированный символ, поэтому вам нужно будет его закодировать.

Исходный URL-адрес, который вам может понадобиться:
https://example.com/questions#what-is-the-question?
Но в кодировке это будет изменено на:
https://example.com/questions#what-is-the-question%3F
Затем посетитель перейдет на страницу вопросов, в домене example.com и в раздел страницы «Какой вопрос?»
Как правильно закодировать URL
Существует проблема, заключающаяся в том, что при кодировании URL-адреса могут быть допущены ошибки в аспекте кодирования. Например, скажем, URL-адрес example.com/a+b/c должен быть закодирован. / между b и c может быть либо символом пути и, следовательно, разрешенным символом в URL-адресе, либо символом разделения.
Таким образом, кодирование URL-адреса example.coma+b/c может привести либо к
example.com/a%2Bb/c or example.com/a%2Bb%2Fc.
Итак, чтобы правильно закодировать домен, вам нужно знать, что представляет / между b и c. Относится ли это к разделению или пути в адресе?
Затем, чтобы правильно закодировать URL-адрес, вам необходимо закодировать разные разделы. Это включает хост (например, example.com) и каждый отдельный путь.
Итак, если бы это был другой путь, вам нужно было бы закодировать три части: example.com, a+b и c.
Если, однако, это должно было представлять разделение, то вы должны кодировать две части: example.com и a+b/c.
Чтобы помочь с кодированием любого из ваших URL-адресов, вы можете использовать этот бесплатный онлайн-инструмент декодирования и кодирования URL-адресов от Gochyu. Вам нужно будет ввести все различные пути URL-адреса по отдельности, но он предоставит вам правильный код, необходимый для успеха.
Вы даже можете разделить каждую часть URL-адреса на новую строку, чтобы получить полный URL-адрес за один раз.
Итак, URL-адрес
example.com/questions/what-is-the-question?#Answer#1
должно выйти как:
example.com/questions/what-is-the-question%3F/#Answer%231
Что такое декодирование URL?
Декодирование URL-адресов — это процесс кодирования URL-адресов в обратном порядке. Это когда URL-адрес был закодирован, потому что он содержал недопустимые символы. Теперь вы можете расшифровать этот URL-адрес, чтобы он был в более удобочитаемой форме.
Это может быть важно для поиска ошибок в URL-адресе. Например, вы могли случайно поставить # внутри URL. Путем декодирования вы можете удалить их и сделать URL-адреса более читаемыми как для поисковых систем, так и для людей. После удаления вы можете увидеть улучшение рейтинга вашего сайта в поисковых системах или получить больше прямого трафика, поскольку теперь люди могут использовать стандартизированный URL-адрес.
Если вам нужно декодировать URL-адрес, вы можете использовать наш бесплатный онлайн-инструмент декодирования и кодирования URL-адресов. Все, что вам нужно сделать, это ввести закодированный URL-адрес в поле и нажать кнопку декодирования.
Заключительное слово: что такое декодирование URL-адресов и кодирование URL-адресов?
Кодирование — это простое изменение символов в URL-адресе, которые нельзя использовать по разным причинам, в стандартизированный код. Это сделано для предотвращения ошибок при получении ресурсов с сервера и обеспечения правильного отображения сайтов в веб-браузере. Расшифровка наоборот.
Очень важно распознавать, когда URL-адрес был закодирован, и убедиться, что вы можете использовать кодирование и декодирование URL-адресов для исправления ошибок на своем веб-сайте.