Sprawdzone metody tworzenia struktury adresów URL dla wyszukiwarki Google

Aby wyszukiwarka Google mogła skutecznie indeksować Twoją witrynę, stosuj strukturę adresów URL, która jest możliwa do zindeksowania i spełnia te wymagania. Jeśli Twoje adresy URL nie spełniają tych kryteriów, wyszukiwarka Google prawdopodobnie będzie indeksować Twoją witrynę nieefektywnie (np. z bardzo wysokimi współczynnikami indeksowania) lub w ogóle nie będzie tego robić.

Wymagania dotyczące indeksowalnej struktury adresów URL

Przestrzegaj IETF STD 66

Wyszukiwarka Google obsługuje adresy URL zdefiniowane w normie IETF STD 66. Znaki określone przez standard jako zarezerwowane muszą być zakodowane za pomocą procentów.

Nie używaj fragmentów adresów URL do zmiany treści

Nie używaj fragmentów do zmiany zawartości strony, ponieważ wyszukiwarka Google w zasadzie nie obsługuje fragmentów adresów URL. Oto przykład fragmentu adresu URL:

https://example.com/#/potatoes

Jeśli do zmiany treści używasz JavaScriptu, użyj interfejsu History API.

Używaj wspólnego kodowania w przypadku parametrów adresu URL

Podczas określania parametrów adresu URL używaj następującego powszechnego kodowania: znaku równości (=) do oddzielania par klucz-wartość i znaku ampersand (&) do dodawania kolejnych parametrów. Aby podać kilka wartości dla tego samego klucza w ramach pary klucz-wartość, możesz użyć dowolnego znaku, który nie koliduje z IETF STD 66, np. przecinka (,).

Zalecane Niezalecane
Używanie znaku równości (=) do oddzielania par klucz-wartość i znaku ampersand (&) do dodawania kolejnych parametrów:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Używanie dwukropka (:) do oddzielania par klucz-wartość i nawiasów ([ ]) do dodawania kolejnych parametrów:
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
Używanie przecinka (,), aby podać kilka wartości dla tego samego klucza, znaku równości (=), aby rozdzielić pary klucz-wartość, oraz ampersanda (&) aby dodać kolejne parametry:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
Używanie pojedynczego przecinka (,) do rozdzielania par klucz-wartość i podwójnego przecinka (,,) do dodawania kolejnych parametrów:
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789

Zadbaj o to, aby struktura adresów URL była łatwa do zrozumienia

Aby ułatwić wyszukiwarce Google (i użytkownikom) lepsze zrozumienie Twojej witryny, zalecamy utworzenie prostej struktury adresów URL z uwzględnieniem tych sprawdzonych metod.

Sprawdzone metody

Używaj opisowych adresów URL

W miarę możliwości używaj w adresach URL czytelnych słów zamiast długich numerów identyfikacyjnych.

Zalecane (proste, opisowe słowa) Niezalecane (nieczytelne, długie numery identyfikacyjne)
https://example.com/wiki/Aviation
https://example.com/index.php?topic=42&area=3a5ebc944f41daa6f849f730f1

Używaj języka odbiorców

Zalecane – użyj w adresie URL słów w języku odbiorców (a w razie potrzeby w formie transliteracji). Jeśli na przykład Twoi odbiorcy wyszukują w języku niemieckim, użyj w adresie URL słów w tym języku:

https://example.com/lebensmittel/pfefferminz

Jeśli Twoi odbiorcy szukają w języku japońskim, użyj w adresie URL słów w tym języku:

https://example.com/ペパーミント

W razie potrzeby użyj kodowania UTF-8

W razie potrzeby linkując do stron w swojej witrynie, użyj kodowania UTF-8 w atrybutach href linków. Niezastrzeżone znaki ASCII mogą być w formie niezakodowanej. Dodatkowo znaki spoza zakresu ASCII powinny być zakodowane w formacie UTF-8. Na przykład:

Zalecane (kodowanie UTF-8) Niezalecane (znaki inne niż ASCII)
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
https://example.com/نعناع
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
https://example.com/杂货/薄荷
https://example.com/gem%C3%BCse
https://example.com/gemüse
https://example.com/%F0%9F%A6%99%E2%9C%A8
https://example.com/🦙✨

Używaj łączników do rozdzielania słów

Zalecamy oddzielanie słów w adresach URL, o ile jest to możliwe. W szczególności zalecamy stosowanie w adresach URL łączników (-) zamiast podkreśleń (_) do rozdzielania słów, ponieważ ułatwia to użytkownikom i wyszukiwarkom identyfikowanie pojęć w adresie URL. Ze względów historycznych nie zalecamy używania podkreśleń, ponieważ ten styl jest już powszechnie używany do oznaczania pojęć, które powinny występować razem, na przykład w różnych językach programowania do nazywania funkcji (takich jak format_date).

Zalecane Niezalecane

Używanie łączników (-) do rozdzielania słów:

https://example.com/summer-clothing/filter?color-profile=dark-grey

Używanie podkreśleń (_) do rozdzielania słów:

https://example.com/summer_clothing/filter?color_profile=dark_grey

Łączenie słów w adresie URL:

https://example.com/greendress

Używaj jak najmniejszej liczby parametrów

Zawsze, gdy jest to możliwe, skracaj adresy URL, usuwając niepotrzebne parametry (czyli parametry, które nie zmieniają treści).

Pamiętaj, że w adresach URL rozróżniana jest wielkość liter

Podobnie jak w przypadku innych klientów HTTP zgodnych z IETF STD 66, wyszukiwarka Google obsługuje adresy URL z uwzględnieniem wielkości liter (np. Google traktuje /APPLE/apple jako odrębne adresy URL z własnymi treściami). Jeśli serwer WWW nie rozróżnia wielkich i małych liter w adresie URL, zastosuj w całym tekście litery tej samej wielkości. Ułatwi to Google ustalenie, czy adresy URL wskazują tę samą stronę.

W przypadku witryn multiregionalnych

Jeśli Twoja witryna działa w wielu regionach, zastanów się nad strukturą adresów URL, która ułatwi kierowanie geograficzne witryny. Więcej przykładów użycia struktury adresów URL znajdziesz w artykule o używaniu adresów URL przeznaczonych dla określonych lokalizacji.

Zalecane (korzystanie z domeny krajowej):

https://example.de

Zalecane (korzystanie z podkatalogu dla kraju z domeną gTLD):

https://example.com/de/

Unikaj typowych problemów z adresami URL

Zbyt złożone adresy URL – a szczególnie takie, które zawierają kilka parametrów – mogą sprawiać problemy robotom ze względu na dużą liczbę adresów URL odsyłających do takich samych lub podobnych treści witryny. W związku z tym Googlebot może nadmiernie ograniczać przepustowość lub mieć problemy z indeksowaniem całej zawartości witryny.

Zbyt duża liczba adresów URL może być wynikiem różnych sytuacji. Może to być na przykład:

Częste problemy

Addytywne filtrowanie zbioru elementów

Wiele witryn wyświetla ten sam zbiór elementów lub wyników wyszukiwania na kilka różnych sposobów, pozwalając użytkownikowi filtrować wyświetlane elementy w zależności od wybranych kryteriów (na przykład: pokaż mi hotele na plaży). Jeśli witryna dopuszcza addytywne łączenie filtrów (przykład: hotele na plaży z centrum fitness), liczba adresów URL (widoków danych) w witrynie rośnie lawinowo. Tworzenie dużej liczby nieznacznie zmodyfikowanych list hoteli jest niepotrzebne, bo Googlebotowi wystarczy niewielka liczba list, na podstawie których będzie w stanie dotrzeć do strony każdego hotelu. Na przykład:

  • Zwracanie listy wszystkich tanich hoteli:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461
  • Zwracanie listy wszystkich tanich hoteli na plaży:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
  • Zwracanie listy wszystkich tanich hoteli na plaży z centrum fitness:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270

Nieistotne parametry

Nieistotne parametry w adresach URL mogą powodować dużą liczbę adresów URL, np.:

  • Parametry odesłania:
    https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories
  • Parametry sortowania w zakupach:
    https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Identyfikatory sesji:
    https://example.com/search/noheaders?sessionid=6EE2BF1AF6A3D705D5561B7C3564D9C2

Rozważ użycie pliku robots.txt, aby zablokować dostęp Googlebota do tych problematycznych adresów URL.

Problemy związane z kalendarzami

Kalendarz generowany dynamicznie może zawierać linki do przyszłych i wcześniejszych dat bez żadnych ograniczeń. Na przykład:

https://example.com/calendar.php?d=13&m=8&y=2011

Jeśli witryna ma kalendarz bez daty końcowej, dodaj do linków tworzących kolejne strony kalendarza atrybut nofollow.

Umieszczenie linku względnego do strony nadrzędnej na niewłaściwej stronie może tworzyć nieskończone przestrzenie, jeśli serwer nie odpowie odpowiednim kodem stanu HTTP w przypadku nieistniejących stron. Na przykład link do strony nadrzędnej, taki jak <a href="../../category/stuff">...</a> w witrynie https://example.com/category/community/070413/html/FAQ.htm, może prowadzić do fałszywych adresów URL, np. https://example.com/category/community/category/stuff. Aby to naprawić, użyj w linkach adresów URL odnoszących się do katalogu głównego (zamiast nadrzędnego).

Rozwiązywanie problemów ze strukturą adresów URL związanych z przeszukiwaniem

Jeśli zauważysz, że wyszukiwarka Google indeksuje te problematyczne adresy URL, zalecamy: