Co to jest URL (Uniform Resource Locator)?
Kiedy wpisujesz adres w swojej przeglądarce, wiele rzeczy dzieje się za kulisami. Większość zależy od różnych części wpisanego adresu URL. Przyjrzyjmy się bliżej.
Adres URL może składać się z wielu różnych części. Jest nazwa hosta, która odwzorowuje adres IP konkretnego zasobu w Internecie i mnóstwo dodatkowych informacji, które mówią przeglądarce i serwerowi, jak sobie z tym radzić. Możesz myśleć o adresie IP jako o numerze telefonu. Nazwa hosta jest jak imię i nazwisko osoby, której numer telefonu chcesz wyszukać. Standard nazwany Systemem Nazw Domen (DNS) działa w tle jak książka telefoniczna, tłumacząc bardziej przyjazne dla człowieka nazwy hostów na adresy IP używane przez sieci do kierowania ruchu.
Mając to na uwadze, spójrzmy na strukturę adresu URL i dowiedz się, jak działa, aby dotrzeć do miejsca, do którego chcesz się udać.
Jak strukturę adresu URL
Struktura adresu URL została po raz pierwszy zdefiniowana przez Sir Tim Berners-Lee - faceta, który stworzył sieć i pierwszą przeglądarkę internetową - w 1994 roku. Adresy URL zasadniczo łączą ideę nazw domen z ideą użycia ścieżki pliku do identyfikacji konkretnego struktura folderów i plików. Jest więc podobny do używania ścieżki C: \ Documents \ Personal \ myfile.txt w Windows, ale z dodatkowymi dodatkami na początku, aby pomóc znaleźć właściwy serwer w Internecie, gdzie istnieje ta ścieżka i protokół używany do uzyskania dostępu do Informacja.
Adres URL składa się z kilku różnych części. Weźmy na przykład podstawowy adres URL podobny do pokazanego na poniższym obrazku.
Ten prosty adres URL dzieli się na dwa główne komponenty: schemat i uprawnienie.
Schemat
Wiele osób uważa adres URL za zwykły adres internetowy, ale nie jest to takie proste. Adres internetowy to adres URL, ale wszystkie adresy URL nie są adresami internetowymi. Inne usługi, do których można uzyskać dostęp za pośrednictwem Internetu - na przykład FTP - lub nawet lokalnie jak MAILTO - to także adresy URL. Część schematu adresu URL (te litery, po których następuje dwukropek) oznaczają protokół, z którym aplikacja (taka jak przeglądarka internetowa) i serwer powinny się komunikować.
Adresy internetowe są najpopularniejszym adresem URL, ale są też inne. Możesz więc zobaczyć programy takie jak:
- HyperText Transfer Protocol (HTTP): jest to podstawowy protokół sieci i określa, jakie działania powinny podjąć serwery i przeglądarki internetowe w odpowiedzi na określone polecenia.
- HTTP Secure (HTTPS): Jest to forma HTTP, która działa na bezpiecznej, zaszyfrowanej warstwie w celu bezpieczniejszego transportu informacji.
- Protokół FTP (File Transfer Protocol): Ten protokół jest często używany do przesyłania plików przez Internet.
W nowoczesnych przeglądarkach schemat nie jest technicznie wymagany jako część adresu URL. Jeśli wejdziesz na stronę internetową "www.howtogeek.com", twoja przeglądarka automatycznie określi właściwy protokół do użycia. Jednak niektóre inne aplikacje (i protokoły) wymagają użycia schematu.
Autorytet
Część autoryzacji adresu URL (poprzedzona dwoma ukośnikami) jest podzielona na kilka części. Zacznijmy od bardzo prostego adresu URL - rodzaju, który przeniesie Cię do strony głównej witryny.
W tym prostym przykładzie cała część "www.example.com" jest nazywana nazwą hosta i jest tłumaczona na adres IP. Możesz również wpisać adres IP na pasku adresu przeglądarki zamiast nazwy hosta, jeśli ją znasz.
Ale podczas analizowania nazwy hosta pomaga ją odczytać wstecz, aby zrozumieć, co się dzieje, więc oto te komponenty:
- Domena najwyższego poziomu: W tym przykładzie "com" jest domeną najwyższego poziomu. Są to najwyższy poziom w hierarchii DNS (Domain Name System) używany do tłumaczenia adresów IP na proste adresy językowe, które są łatwiejsze do zapamiętania przez ludzi. Te domeny najwyższego poziomu są tworzone i zarządzane przez Internet Corporation dla przydzielonych nazw i numerów (ICANN). Trzy najpopularniejsze domeny najwyższego poziomu to .com, .net i .gov. Większość krajów ma również własną dwuliterową domenę najwyższego poziomu, więc zobaczysz domeny takie jak .us (Stany Zjednoczone), .uk (Wielka Brytania), .ca (Kanada) i wiele innych. Istnieje również kilka dodatkowych domen najwyższego poziomu (takich jak .museum), które są sponsorowane i zarządzane przez prywatne organizacje. Oprócz nich istnieją również niektóre ogólne domeny najwyższego poziomu (takie jak .club, .life i .news).
- Subdomena: Ponieważ DNS jest systemem hierarchicznym, zarówno części "www", jak i "przykład" naszego przykładowego adresu URL są uważane za poddomen. Część "www" jest subdomeną domeny najwyższego poziomu "com", a część "www" jest subdomeną domeny "przykładowej". Dlatego często widzisz firmę o zarejestrowanej nazwie, np. "Google.com" podzielonej na oddzielne poddomeny, takie jak "www.google.com", "news.google.com", "mail.google.com" i wkrótce.
Jest to najbardziej podstawowy przykład sekcji uprawnień adresu URL, ale rzeczy mogą być bardziej skomplikowane. Istnieją dwa inne komponenty, które sekcja uprawnień może zawierać:
- Informacje o użytkowniku: Sekcja uprawnień może również zawierać nazwę użytkownika i hasło do strony, do której wchodzisz. W dzisiejszych URL-ach często nie widać tej struktury, ale może się zdarzyć. Jeśli jest obecny, część informacji o użytkowniku pojawia się przed nazwą hosta, a po nim następuje znak @. Możesz więc zobaczyć coś takiego jak "//username:[email protected]", jeśli zawiera informacje o użytkowniku.
- Numer portu: Urządzenia sieciowe wykorzystują adresy IP, aby uzyskać informacje na odpowiednim komputerze w sieci. Gdy nadejdzie ten ruch, numer portu informuje komputer o aplikacji, dla której przeznaczony jest ten ruch. Numer portu to kolejny element, którego często nie widać podczas przeglądania sieci, ale możesz go zobaczyć w aplikacjach sieciowych (takich jak gry), które wymagają wprowadzenia adresu URL. Jeśli adres URL zawiera numer portu, przychodzi po nazwie hosta i jest poprzedzany dwukropkiem. Wyglądałoby to mniej więcej tak: "//www.example.com:8080."
To część schematu i autorytetu adresu URL, ale jak można się domyślić po przejrzeniu wielu adresów URL podczas przeglądania sieci, mogą zawierać jeszcze więcej rzeczy.
Ścieżki, zapytania i fragmenty
Istnieją trzy dodatkowe części adresu URL, które możesz zobaczyć po części autorytetu: ścieżki, zapytania i fragmenty. Oto jak działają te.
Ścieżka
Sekcja uprawnień adresu URL pobiera twoją przeglądarkę (lub inną aplikację) na właściwy serwer w sieci. Ścieżka, która następuje - która działa tak jak ścieżka w systemie Windows, macOS lub Linux - przenosi cię do odpowiedniego folderu lub pliku na tym serwerze. Ścieżka jest poprzedzona ukośnikiem, a między każdym katalogiem i podkatalogiem znajduje się ukośnik, na przykład:
www.example.com/folder/subfolder/filename.html
Ostatni fragment to nazwa pliku otwieranego po wejściu na stronę. Chociaż możesz nie widzieć go na pasku adresu, nie oznacza to, że go nie ma. Niektóre języki używane do tworzenia stron internetowych ukrywają nazwę pliku i rozszerzenie, które przeglądasz. Dzięki temu adres URL jest łatwiejszy do zapamiętywania i pisania oraz zapewnia bardziej przejrzysty wygląd.
Pytanie
Część zapytania adresu URL służy do identyfikacji rzeczy, które nie są częścią ścisłej struktury ścieżki. Najczęściej są one używane podczas wyszukiwania lub gdy strona dostarcza dane za pośrednictwem formularza. Część zapytania jest poprzedzona znakiem zapytania i pojawia się po ścieżce (lub po nazwie hosta, jeśli ścieżka nie jest dołączona).
Jako przykład, weź ten adres URL prezentowany podczas wyszukiwania w Amazon słów kluczowych "Wi-Fi Extender":
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Formularz wyszukiwania przekazał informacje do wyszukiwarki Amazon. Po znaku zapytania możesz zobaczyć dwie części zapytania: adres URL wyszukiwania (część "url = search-alias% 3Daps & field") i słowa kluczowe, które wpisaliśmy (to słowa kluczowe = wi-fi + przedłużenie "część").
Jest to dość prosty przykład, a często będziesz widzieć adresy URL z dodatkowymi (i bardziej skomplikowanymi) zmiennymi. Na przykład tutaj jest adres URL, gdy wyszukiwaliśmy Google dla słowa kluczowego "howtogeek":
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome... 69i57j69i60l4j0.1839j1j4 & sourceid = chrome & ie = UTF-8
Jak widać, są tam różne informacje. W tym przypadku możesz zobaczyć, że istnieją dodatkowe informacje wskazujące język wyszukiwania, używaną przeglądarkę (Chrome), a nawet numer wersji przeglądarki.
Fragment
Ostateczny komponent adresu URL, który możesz zobaczyć, nazywa się fragmentem. Fragment jest poprzedzony znakiem krzyżyka (#) i służy do wskazania określonej lokalizacji na stronie internetowej. Podczas kodowania strony internetowej projektanci mogą tworzyć kotwice dla określonego tekstu, takiego jak nagłówki. Kiedy właściwy fragment zostanie użyty na końcu adresu URL, przeglądarka załaduje stronę, a następnie przeskoczy do tej kotwicy. Kotwice i adresy URL z fragmentami są często używane do tworzenia tabel treści na stronach internetowych w celu ułatwienia nawigacji.
Oto przykład. Strona Wikipedii o renesansie jest dość długim dokumentem i jest podzielona na około 11 sekcji, z których każda ma wiele podsekcji. Ale każdy nagłówek na stronie zawiera kotwicę, a spis treści na górze artykułu zawiera łącza, które pozwalają przejść do różnych sekcji. Te linki działają poprzez dołączanie fragmentów.
Możesz także użyć tych fragmentów bezpośrednio na pasku adresu lub jako linki do udostępniania. Załóżmy na przykład, że chcesz pokazać komuś sekcję strony, która obejmuje Rosję. Możesz po prostu wysłać im ten link:
https://en.wikipedia.org/wiki/Renaissance#Russia
Ta część "#Russia" na końcu adresu URL przesyła je bezpośrednio do tej sekcji po załadowaniu strony.
Tak więc masz go - więcej niż prawdopodobnie chciałbyś wiedzieć o tym, jak działają adresy URL.
Image Credit: Pawel Horazy / Shutterstock