Mężczyzna jadący na skuterze
Blog Nowe funkcje

Sitemap.xml dla bazy wiedzy w Sugesterze

Sylwia Cerecka

Sylwia Cerecka, 2022-03-31

Wyjeżdżając w nieznane, zaopatrujemy się w mapy, lokalne przewodniki, włączamy gps - wszystko po te, by bezbłędnie dotrzeć w te miejsca, które po prostu trzeba zobaczyć.

A co robią serwisy, żeby boty wyszukiwarek dotarły do wszystkich najważniejszych stron, na których im zależy? Tworzą sitemapy.

Czym jest sitemapa, mapa witryny?

Sitemap.xml to cyfrowa mapa, która zawiera wszystkie aktywne adresy URL Twojej strony internetowej. Może też zawierać mapę wszystkich plików graficznych, znajdujących się na stronie.

Wyszukiwarki takie jak Google, Yahoo czy Bing używają sitemap, żeby znaleźć różne strony w obrębie witryny internetowej.
Sitemapy mówią botom Google, które strony w serwisie są ważne, kiedy strona była ostatnio aktualizowana, w jakim języku został utworzony wpis (hreflangi) oraz jaki jest priorytet podstrony w domenie.

Mapy witryny używa się, by przekazać informacje na temat tego, jaki rodzaj treści zawiera strona, włączając w to także treści związane z newsami, grafikami lub video.  
Wyróżnić można:

  • mapy stron pod Google News - które będą zawierały tytuł artykułu i datę publikacji
  • mapy stron video - w których będą zawarte m.in. tytuł filmu, opis, długość filmu czy to po jakiej dacie film nie będzie już dostępny 
  • mapy stron dla grafik i zdjęć - zawierające informacje na temat pojedynczej grafiki, podpis grafiki, tytuł czy adres URL do licencji obrazu

 

Najszybszym sposobem na sprawdzenie (o ile plik nie jest ukryty) czy strona internetowa ma sitemap jest dopisanie w adresie URL domeny końcówki /sitemap.xml

Np. pomoc.sugester.pl/sitemap.xml

Co to jest plik sitemap.xml?

Plik sitemap.xml to plik tekstowy zawierający listę adresów URL. Sitemapy dostarczane są w formacie xml, który Google może szybko przeanalizować w celu znalezienia nowych adresów URL. 

XML - Extensibel Markup Language - to język znaczników, który pozwala przedstawiać dane w taki sposób, żeby były one łatwe do odczytania zarówno dla ludzi, jak i maszyn.

 

Dla optymalnego działania sitemapy plik powinien być przygotowany zgodnie z pewnymi standardami:

  • Zawierać nie więcej niż 50k adresów URL

  • Być mniejszy niż 50 MB

  • Mieć kodowanie UTF-8

  • Być skompresowany w formacie .gz

 

Przykładowy plik sitemap będzie wyglądał podobnie do tego

Fragment pliku sitemap

Plik sitemap.xml można opublikować w dowolnym miejscu witryny. Najczęstszym rozwiązaniem jest jednak umieszczanie mapy witryny w głównym katalogu witryny.

 

Dlaczego sitemapy są takie ważne?

Jak sama nazwa wskazuje Sitemapa to mapa i jest przeznaczona dla robotów indeksujących strony internetowe. Sitemapy pomagają wyszukiwarkom odkryć nowe strony, nawet jeśli nie są one podlinkowane na stronie głównej serwisu. Dzięki takim mapom boty wyszukiwarek znacznie lepiej sobie radzą z indeksowaniem poszczególnych elementów strony internetowej, i robią to szybciej. 

Każda strona internetowa, która chce się pozycjonować w internecie, powinna mieć stworzoną sitemapę. Mapy są szczególnie ważne dla:

  • Dużych stron internetowych, które posiadają wiele podstron
  • Nowych stron internetowych
  • Stron, które zawierają dużo grafik i filmów
  • Stron, które często dodają nowe treści lub je aktualizują

Sitemapy mogą się różnić, w zależności od potrzeb wyszukiwarki, ale z reguły ich podstawowy typ wystarczy, żeby strona poprawnie się wyświetlała w wynikach wyszukiwania. 

 

Mapa witryny a SEO witryny

Jeśli witryna jest poprawnie zbudowana, a treści w niej zawarte poprawnie połączone, roboty nie będą miały problemu ze znalezieniem poszczególnych adresów URL i zindeksowaniem ich. Może się jednak zdarzyć, że cały proces będzie trwał dłużej, a niektóre adresy będą pojawiały się z czasem lub będą pomijane z nieznanych powodów przez wyszukiwarki.
W takim przypadku mapa witryny ułatwi botom znalezienie wszystkich adresów URL i poprawi wyniki indeksowania. Dzięki mapie nowe lub zmienione treści będą też łatwiej zidentyfikowane. Należy jednak pamiętać, że umieszczenie adresu URL w mapie nie jest jednoznaczne z zaindeksowaniem podstrony, jest to wyłącznie sugestia. Mimo wszystko jednak warto jest mieć mapę strony, ponieważ daje ona wiele korzyści witrynie.

 

Dobra sitemapa czyli jaka?

Przy tworzeniu sitemapy warto skorzystać z kilku dobrych praktyk:
 

  • należy zamieszczać dokładnie takie adresy URL jakie są na stronie tzn. jeśli strona znajduje się pod adresem https://www.twoja-strona.pl/ to nie należy w mapie witryny umieszczać adresu bez www czyli https://twoja-strona.pl/
  • należy zwrócić uwagę na poprawność kodowania UTF-8, ponieważ Google jest na to bardzo wyczulony
  • jeśli jakieś linki są nieaktywne, mało ważne, to trzeba je usunąć z sitemapy
  • jeżeli strony są zduplikowane, należy wskazać tę ważniejszą, nadrzędną (tzw. URL kanoniczny)
  • dobrą praktyką jest dodanie sitemap do pliku robots.txt file
  • nie należy umieszczać identyfikatorów sesji z URL w mapie witryny, ponieważ zmniejsza to indeksowanie duplikatów tych adresów URL
  • dobrze jest zamiast jednej obszernej mapy witryny stworzyć kilka mniejszych, tak by przestrzegać ograniczenia - do 50k URL zawartych w sitemapie i do 50MB wielkość sitemapy. W takim przypadku dobrze jest użyć pliku sitemap_index.xml, w którym zbieramy wszystkie sitemapy stworzone w ramach jednej witryny
  • w przypadku stron dla różnych wersji językowych, można użyć hreflang lub tagów HTML, by wskazać naprzemienne URLe

 

Warto pamiętać!
Sitemapy wskazują Google, które linki w obrębie witryny są ważne. Jednak Google nie zapewnia, że każdy z linków zawartych w mapie będzie zaindeksowany.
Google ignoruje tagi i
Google używa tagu  wtedy, kiedy jest on konsekwentnie weryfikowany i dokładny (np. przez porównanie ostatniej modyfikacji strony).
Kolejność adresów URL w sitemap nie jest istotna.


Generatory sitemap

Mapę witryny można stworzyć ręcznie, natomiast w przypadku dużych serwisów najlepiej skorzystać z dostępnych programów, stron i wtyczek, które pozwolą stworzyć idealną sitemapę.
W przypadku CMSów najprawdopodobniej mają one już wtyczkę, która umożliwia stworzenie sitemapy. Wystarczy poszukać informacji dotyczących generowania pliku sitemap.xl przez dany CMS. 
Np. w przypadku Wordpressa można skorzystać z wtyczek RankMath lub YoastSEO.
Jeśli witryna nie jest oparta na CMSie, można skorzystać z rozwiązań w chmurze jak np. XML sitemap Generator czy xml-sitemaps.com

 

Zgłoszenie sitemapy do Google

Ostatnim krokiem przy tworzeniu mapy witryny jest zgłoszenie pliku sitemap.xml do Google. Najprostszym sposobem jest zgłoszenie za pomocą Google Search Console. W zakładce Sitemaps można zgłosić wszystkie swoje mapy. Tutaj też można sprawdzać, co jakiś czas, kiedy ostatnio Google zajrzał do naszej mapy.

Innym sposobem jest umieszczenie w pliku robots.txt dyrektywy:

Sitemap: dowolnadomena.com/sitemap.xml

 

Mapa witryny dla bazy wiedzy

Sitemap.xml dla bazy wiedzy daje wyszukiwarkom informacje na temat wszystkich adresów do wszystkich postów publicznych znajdujących się w bazie wiedzy. Tutaj ważną informacją jest to, że mapa zawiera linki tylko do postów publicznych, czyli takich do których użytkownik ma dostęp bez konieczności zalogowania. 

Każda nowa baza wiedzy w obrębie jednego konta w Sugesterze będzie miała swoją oddzielną mapę witryny, ponieważ każda baza wiedzy jest pod osobnym linkiem. Oznacza to, że jeśli mamy stworzoną np. bazę wiedzy dla klientów, wewnętrzną bazę wiedzy dla pracowników i bazę wiedzy w języku angielskim, to każda z tych baz będzie miała swoją osobną mapę witryny dostępną po dodaniu do URL końcówki /sitemap.xml

Poniżej przykłady dla polskiej i angielskiej wersji językowej bazy wiedzy dla klientów Sugestera

Plik sitemap.xml dla polskiej bazy wiedzy dostępna pod linkiem pomoc.sugester.pl/sitemap.xml

Sitemap bazy wiedzy Sugestera

 

Plik sitemap.xml dla angielskiej bazy wiedzy dostępna pod linkiem help.sugester.com/sitemap.xml

Sitemap bazy wiedzy dla wersji angielskiej

W mapie witryny dla bazy wiedzy zostały użyte tagi:

  • tag otwarcia i zamknięcia
  •  - tag nadrzędny, rozpoczynający i zamykający poszczególne adresy URL w sitemapie
  • - mówiący o lokalizacji danego adresu URL w witrynie, podany w pełnej formie z https lub http
  • - informujące o dacie ostatniej aktualizacji linka lub treści


Tutaj podajemy jeszcze pomocny link: https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?hl=pl