Co to jest dekodowanie i kodowanie adresów URL?

Opublikowany: 2022-07-21

Kiedy prowadzisz stronę internetową, prawdopodobnie w pewnym momencie natkniesz się na dekodowanie adresów URL i kodowanie adresów URL. Jeśli jeszcze się z nimi nie spotkałeś lub po prostu natknąłeś się na nie po raz pierwszy i chcesz uzyskać więcej informacji, wyjaśnimy je tutaj.

Co to jest adres URL?

URL (Uniform Resource Locator) to adres używany przez przeglądarki do wyszukiwania zasobu w Internecie. Zwykle adres URL prowadzi do strony internetowej, takiej jak ta, którą czytasz. Czasami jednak może to prowadzić do dokumentu (takiego jak dokument pdf).

Wszystkie adresy URL mają strukturę opracowaną przez wynalazcę sieci WWW, Tima Bernersa-Lee. Są również zgodne z ogólną składnią, która wygląda następująco:

scheme:{//{user:password@}host{:port}}path{?query}{#fragment}

Niektóre aspekty składni adresu URL są przestarzałe i nie są często używane ze względu na obawy związane z bezpieczeństwem. Dobrym przykładem może być aspekt {user:password} . Wysłanie tego bez jakiejkolwiek formy ochrony oznaczałoby, że hakerzy mogliby uzyskać dostęp do systemów, których nie powinni.

Typowy adres URL, który możesz zobaczyć, obejmuje:

https://example.com/page-1

Dla tego adresu URL schematem jest https. Host to example.com, a ścieżka to element page-1.

Dopuszczalne znaki URL

Adresy URL mogą zawierać tylko określone znaki. Wszystkie znaki należą do zestawu znaków US-ASCII, który zawiera cyfry (0-9), litery (az) i kilka znaków specjalnych. Jeśli istnieją znaki umieszczone w adresie URL przez właściciela witryny, które nie są objęte kodowaniem US-ASCII lub zostały zarezerwowane dla specjalnego znaczenia (w tym ?, /, #, :), należy zmienić adres URL .

W tym miejscu pojawia się kodowanie, ponieważ żadna część adresu URL nie powinna zawierać tych „zarezerwowanych” znaków, chyba że są one z konkretnego powodu, z którego mają być używane. Na przykład znak / służy do oznaczenia ścieżki w adresie URL.

Tak więc, gdy używany jest jeden z tych znaków, dane zawarte w adresie URL muszą być zakodowane. Dzieje się tak, gdy proces kodowania adresów URL przekształca zastrzeżone znaki, wszelkie niebezpieczne znaki i znaki spoza zestawu ASCII na format, który jest bardziej powszechnie akceptowany i rozumiany przez przeglądarki internetowe i serwery.

Znak jest zmieniany podczas procesu kodowania na jeden lub więcej bajtów reprezentowanych przez dwie cyfry szesnastkowe poprzedzone znakiem procentu (%). Dlatego kodowanie adresów URL jest czasami nazywane kodowaniem procentowym.

Przykładem tego jest wysłanie adresu URL

https://example.com/hello world

Zwróć uwagę na przepaść między hello a world. Nie jest to dozwolone w standardowym formacie adresu URL i dlatego należy je zmienić. Standardem byłoby %20, gdzie 20 to standardowa reprezentacja przestrzeni. Dlatego adres URL przesyłany po zakodowaniu adresu URL będzie wyglądał następująco:

https://example.com/hello%20world

Dlaczego kodowanie adresów URL jest ważne?

Kodowanie adresów URL jest ważną częścią wiedzy o błędach w adresach URL. Jeśli potrafisz rozpoznać, kiedy nastąpiło kodowanie, możesz wejść i spojrzeć na swoją strukturę i znaleźć sposoby rozwiązania problemu, tworząc nowy adres URL.

Lub może się okazać, że masz niestandardowe znaki, które musisz mieć w strukturze adresu URL i musisz dowiedzieć się, jak je zakodować, aby zostały zaakceptowane. Może się tak zdarzyć, gdy masz pytanie na stronie i chcesz utworzyć link do tej sekcji strony. Nie możesz mieć znaku „?” w strukturze adresu URL, ponieważ jest to znak zastrzeżony, więc będziesz musiał go zakodować.

Oryginalny adres URL, który możesz chcieć, to:

https://example.com/questions#what-is-the-question? Ale w kodowaniu zmieniłoby się to na:

https://example.com/questions#what-is-the-question%3F Spowoduje to przejście użytkownika do pytań na stronie, w domenie example.com i do sekcji strony „Jakie jest pytanie?”

Jak prawidłowo zakodować adres URL

Istnieje problem polegający na tym, że gdy trzeba zakodować adres URL, można popełnić błędy w aspekcie kodowania. Załóżmy na przykład, że adres URL example.com/a+b/c musiał zostać zakodowany. Znak / między b i c może być albo symbolem ścieżki, a zatem dozwolonym znakiem w adresie URL, albo może być symbolem dzielenia.

Dlatego zakodowanie adresu URL example.coma+b/c może skutkować:

example.com/a%2Bb/c or example.com/a%2Bb%2Fc.

Tak więc, aby poprawnie zakodować domenę, musisz wiedzieć, co reprezentuje / między b i c. Czy odnosi się do podziału lub ścieżki w adresie?

Następnie, aby poprawnie zakodować adres URL, musisz zakodować różne sekcje. Obejmuje to hosta (np. example.com) i każdą indywidualną ścieżkę.

Jeśli więc była to inna ścieżka, musiałbyś zakodować trzy części: example.com, a+b i c.

Jeśli jednak miało to reprezentować podział, należy zakodować dwie części example.com i a+b/c.

Aby pomóc w kodowaniu dowolnych adresów URL, możesz użyć tego bezpłatnego narzędzia internetowego do dekodowania i kodowania adresów URL firmy Gochyu. Będziesz musiał wprowadzić wszystkie różne ścieżki adresu URL osobno, ale zapewni ci to poprawny kod, którego potrzebujesz, aby odnieść sukces.

Możesz nawet oddzielić każdą część adresu URL w nowej linii, aby uzyskać pełny adres URL za jednym razem.

Tak więc adres URL

example.com/questions/what-is-the-question?#Answer#1

powinien wychodzić jako:

example.com/questions/what-is-the-question%3F/#Answer%231

Co to jest dekodowanie adresów URL?

Dekodowanie adresu URL to proces odwrotnego kodowania adresu URL. Dzieje się tak, gdy adres URL został zakodowany, ponieważ zawierał niedozwolone znaki. Teraz możesz zdekodować ten adres URL, aby był bardziej czytelny.

Może to być ważne przy znajdowaniu błędów w adresie URL. Na przykład mogłeś przypadkowo umieścić # w adresie URL. Dekodując, możesz je usunąć i sprawić, że adresy URL będą bardziej czytelne zarówno dla wyszukiwarek, jak i dla ludzi. Po usunięciu możesz zauważyć poprawę pozycji swojej witryny w wyszukiwarkach lub uzyskać większy ruch bezpośredni, ponieważ użytkownicy mogą teraz korzystać ze znormalizowanego adresu URL.

Jeśli potrzebujesz zdekodować adres URL, możesz skorzystać z naszego bezpłatnego narzędzia internetowego do dekodowania adresów URL i kodowania adresów URL. Wszystko, co musisz zrobić, to wpisać zakodowany adres URL w polu i nacisnąć przycisk dekodowania.

Ostatnie słowo: co to jest dekodowanie i kodowanie adresów URL?

Kodowanie to prosta zamiana znaków w adresie URL, które z różnych powodów nie mogą być użyte, na znormalizowany kod. Ma to na celu zapobieganie błędom w pobieraniu zasobów z serwera i umożliwianiu prawidłowego renderowania witryn w przeglądarce internetowej. Dekodowanie jest odwrotne.

Bardzo ważne jest, aby rozpoznać, kiedy adres URL został zakodowany i upewnić się, że możesz użyć kodowania i dekodowania adresu URL, aby naprawić błędy w swojej witrynie.