Zaindeksowanie podstron to pierwszy i najważniejszy etap pozycjonowania. Indeks jest fundamentem wszelkich działań SEO. Strona może pojawiać się w wynikach wyszukiwania i agregować ruch wyłącznie za pośrednictwem adresów, które zostały zaakceptowane przez wyszukiwarkę. Co więcej, w wielu niszach istnieje dość ścisła korelacja: wzrost objętości indeksu przekłada się na wzrost obecności w wyszukiwarce oraz na wzrost ruchu. Pracę z indeksem znacznie ułatwia podstawowe narzędzie SEO – Google Search Console – które w nowej, stale aktualizowanej wersji udostępnia wiele przydatnych danych. Jedna z najświeższych nowości to możliwość szczegółowej analizy pojedynczych adresów. Mieliśmy przyjemność przetestować nową funkcjonalność i zastosować do audytowania indeksu, co zostało opisane w poniższym poradniku.
Podstawą pracy z Google Search Console jest cierpliwość. Większość działań przebiega w skali co najmniej kilku dni. Dodanie strony po raz pierwszy do GSC początkowo daje wyłącznie komunikaty „Brak danych” – pomiary są dopiero zbierane. Dodanie mapy strony również nie skutkuje natychmiastową, szczegółową analizą adresów, ponieważ ta jest dostępna najwcześniej po kilku dniach. Weryfikacja zgłoszonych błędów również trwa pewien czas. Analiza SEO indeksowania nie jest jednorazowym, jednodniowym działaniem, lecz procesem, do którego sukcesywnie należy wracać w skali dni i tygodni.
Najważniejsze adresy:
- Nowa wersja Google Search Console
- Dotychczasowa wersja Google Search Console
- Support Google dotyczący stanu indeksowania
1. Dodanie właściwej wersji strony do Google Search Console
2. Utworzenie i zgłoszenie map stron złożonych z 1000 elementów
3. Eksport wszystkich analiz stanu indeksu
4. Analiza adresów
4.1. Przesłany URL nie został oznaczony jako strona kanoniczna
4.2. Pobrano, ale jeszcze nie zindeksowano
4.3. Wykryta – obecnie niezindeksowana
5. Przegląd stanu indeksu
5.1. Strona zawiera przekierowanie
5.2. Nieprawidłowość związana z indeksowaniem
5.3. Duplikat strony, który nie zawiera tagu strony kanonicznej / Alternatywna strona zawierająca prawidłowy tag strony kanonicznej
5.4. Nie znaleziono (404)
5.5. Pozorny błąd 404
5.6. Wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik
6. Monitoring zmian i usuwanie tymczasowych map stron
1. Dodanie właściwej wersji strony do Google Search Console
W skrócie: Dodaj stronę pod Google.com/webmasters/tools/home.
Szczegółowo:
- Wpisz w wyszukiwarkę komendę site:strona.pl, by poznać wersję, którą Google uznaje za główną. Może to być www.strona.pl lub strona.pl, a także https:// lub bez https://. W poniższym przykładzie właściwą wersją jest adres z www. oraz z https://:
- Dodaj właściwą formę pod Google.com/webmasters/tools/home. W przypadku błędnego adresu, tj. bez właściwych przedrostków i właściwego protokołu, dane nie będą wyświetlane poprawnie!
- Skutecznie zweryfikuj prawa do strony za pomocą dowolnej z metod zaproponowanych przez GSC.
- Dane mogą być już obecne jeśli strona była podłączona pod innym kontem. W innym przypadku odczekaj kilka dni zanim pojawią się pierwsze dane:
2. Utworzenie i zgłoszenie map stron złożonych z 1000 elementów
W skrócie: Dodaj mapy stron pod Search.google.com/search-console.
Szczegółowo:
- Wygeneruj kompletną mapę strony za pomocą modułu wbudowanego w CMS, oprogramowania Screaming Frog lub innego dowolnego narzędzia (na przykład nielimitowane online). Użycie własnych map stron daje bardzo istotną przewagę w stosunku do analizy całego indeksu dostępnego w GSC – możliwość pracy z adresami wybranymi wyłącznie przez pozycjonera, a więc najbardziej interesującymi z punktu widzenia SEO.
- Raporty w GSC obejmują maksymalnie 1000 elementów. By móc w pełni przeanalizować wszystkie podstrony, podziel kompletną mapę stron na wiele liczących po 1000 adresów i zgłoś je osobno pod Search.google.com/search-console:
Możliwość pracy z większą ilością adresów niż 1000 to kolejna przewaga pracy z mapami stron nad pracą z całym stanem indeksu. - W ciągu kilkunastu minut Google analizuje techniczną poprawność zgłoszonych plików. Jeśli są poprawne, odczekaj od kilku dni do tygodnia, zanim ich treść zostanie zweryfikowana.
3. Eksport wszystkich analiz stanu indeksu
W skrócie: Wyeksportuj wszystkie elementy stanu indeksu dostępne pod przyciskiem:
- Po wejściu w wyżej wskazany raport indeksu, zaznacz 4 kategorie stanu:
- Wejdź w każdą z przyczyn i wyeksportuj listy stron:
Uwaga, pamiętaj o odpowiednim nazwaniu plików – domyślnie eksport każdej listy jest tak samo nazwany (Index Coverage Drilldown). - Powtórz dla każdej mapy strony i połącz pliki dotyczące tych samych przyczyn, które pochodzą z różnych map stron.
4. Analiza adresów
W skrócie: Przegląd adresów w narzędziu inspekcji dostępnym w pasku na górze GSC:
(Stan na 4 lipca 2018: dostępne tylko na niektórych kontach, w ciągu kilku tygodni będzie wdrożone globalnie.)
Szczegółowo:
- Kategorie dotyczące błędów, ostrzeżeń oraz prawidłowych adresów są najmniej interesujące – informują o oczywistych problemach lub potwierdzeniach, a także od lat są dostępne w standardowej wersji Google Search Console. Najciekawsza jest nowa kategoria „Wykluczone”, która udostępnia wszystkie adresy wykluczone z wyświetlania w wynikach wyszukiwania i dzieli je aż na 18 przyczyn. Szczegóły przyczyn oraz działań w ich sprawie są dostępne w supporcie Google.
- Sprawdź w narzędziu inspekcji wybraną ilość adresów (optymalnie: jak najwięcej) i spisz uwagi wskazanych przez Google na temat zakwalifikowania do danej przyczyny (poprawność pobierania, adres kanoniczny użytkownika, adres kanoniczny wybrany przez Google, strona odsyłająca).
- Większość map stron generuje trzy poniższe przyczyny wykluczeń.
4.1. Przesłany URL nie został oznaczony jako strona kanoniczna
Podstrony powiązane z tą przyczyną, mimo przynależności do kategorii „wykluczone”, w praktyce często nie zostały wykluczone i są obecne w indeksie. Nie oznacza to jednak, że są wartościowe – mają niewielką widoczność i nie agregują istotnego ruchu, ponieważ w ich miejsce jest wyświetlany inny adres. Ten adres czasem jest bezpośrednio wskazany w narzędziu inspekcji adresów:
Jak widać, w tym przypadku wyszukiwarka zignorowała również wdrożony tag canonical i jako właściwy uznała inny.
Zdarza się, że adres kanoniczny nie jest w ogóle wskazany w narzędziu:
To bardzo ważna informacja, ponieważ wskazuje na wykrycie zewnętrznej duplikacji. Wyszukiwarka Google uznała zewnętrzną stronę jako autora treści. W tym przypadku otrzymujemy wyraźne wskazanie niskiego autorytetu domeny (niższego od domeny, która skopiowała treść), a także potencjalnego mechanizmu ograniczającego skuteczne pozycjonowanie grupy podstron (na przykład nieoryginalna treść na pozycjonowanej stronie, kopiowanie opisów produktów przez porównywarki cenowe i inne).
Uwaga, możliwe jest pojawienie się komunikatu „Nie można wyświetlić adresu URL, bo nie ma go w żadnej z Twoich usług” w przypadku pracy z niepoprawną wersją strony w Google Search Console – przykładowo po dodaniu wersji www.strona.pl, narzędzie inspekcji może wykazać nawet stronę główną jako wykluczoną z powodu kanonikalizacji na zewnętrzny adres (którym jest na przykład strona.pl – bez przedrostka www.).
4.2. Pobrano, ale jeszcze nie zindeksowano
Podstrony z tej kategorii zazwyczaj mają problemy różnorodnej natury:
- brak treści
- treść niskiej jakości
- duplikacja wewnętrzna
- duplikacja zewnętrzna
Nazwa tej przyczyny jest mylna, ponieważ oczekiwanie na jeszcze nie przyniesie żadnego efektu. Ilość podstron w tej klasyfikacji nie zmienia się na przestrzeni miesięcy:
Konieczne są działania – zazwyczaj dotyczą treści, która została oceniona przez wyszukiwarkę Google jako niewarta zaindeksowania.
4.3. Wykryta – obecnie niezindeksowana
W teorii to adresy, które otrzymały późniejsze miejsce w kolejce robota indeksującego. W praktyce jest tak tylko w pierwszych tygodniach po dodaniu mapy strony, co zazwyczaj widać po szybkim spadku ilości tych podstron:
W późniejszym czasie pozostające tu adresy zazwyczaj należą już do innych przyczyn (dwie wcześniejsze lub nawet do kategorii „prawidłowe”), lecz ich status jeszcze nie został zaktualizowany w Google Search Console. Z tego powodu, wskazana lista jest nieprzydatna w pierwszych tygodniach po zgłoszeniu mapy strony (informuje wyłącznie o kolejce), natomiast po pewnym czasie (zależnym od wielkości kolejki) można ponownie przeanalizować wszystkie adresy by zakwalifikować je do właściwych prac.
5. Przegląd stanu indeksu
W skrócie: Przegląd grup adresów w stanie indeksu niezawężonym do map stron.
- Mapy stron pozwalają na szczegółową pracę z adresami, jednak ich zalety są częściowo wadami: ograniczają się do wybranych adresów, a ponadto operują na mniejszej ilości przyczyn (zazwyczaj 3 rodzaje). Wyszukiwarka Google dociera do adresów nie tylko za pomocą linkowania wewnętrznego, ale także z zewnątrz, a nawet z zachowanego archiwum (na przykład stara struktura strony sprzed kilku lat), stąd wygenerowanie map stron na podstawie budowy witryny nie dostarcza pełnego wglądu w indeks. Szczegółową analizę map stron należy uzupełnić przeglądem stanu indeksu wykazanego w Google Search Console bez zawężenia do map stron.
- Sprawdź w narzędziu inspekcji reprezentatywne adresy (należących do poszczególnych sekcji, na przykład kilkadziesiąt produktów, kilkanaście kategorii, kilkanaście podstron informacyjnych) pochodzące z każdej z przyczyn i spisz uwagi wskazanych przez Google na temat zakwalifikowania do danej przyczyny (poprawność pobierania, adres kanoniczny użytkownika, adres kanoniczny wybrany przez Google, strona odsyłająca). Po kliknięciu na adres w danej przyczynie można od razu przejść do narzędzia inspekcji:
- Dodatkowe, najczęstsze przyczyny wykluczeń zostały poniżej opisane.
5.1. Strona zawiera przekierowanie
To zazwyczaj standardowe adresy, które zostały przekierowane i nie jest potrzebna bezpośrednia modyfikacja. Narzędzie inspekcji adresów może jednak wskazać miejsca – zewnętrzne oraz wewnętrzne – z których jest linkowana nieaktualna wersja adresu:
Warto wrócić do tego typu miejsc i zmodyfikować linki na aktualne.
5.2. Nieprawidłowość związana z indeksowaniem
Wykazane tu adresy najczęściej są nieistniejącymi podstronami z nagłówkiem HTTP 404, do których robot indeksujący dotarł w bliżej nieokreślony sposób – zazwyczaj nie istnieją w linkowaniu wewnętrznym. Większość listowanych podstron charakteryzuje się zmienionymi lub nawet dopisanymi parametrami, które nie istnieją. Ich lista to w zasadzie nieprzydatny zbiór adresów odwiedzonych z niewiadomych powodów, co potwierdza pracownik Google.
5.3. Duplikat strony, który nie zawiera tagu strony kanonicznej / Alternatywna strona zawierająca prawidłowy tag strony kanonicznej
Adresy dotyczące tej przyczyny są często wspólne z badanymi wcześniej w mapach stron adresami w „Przesłany URL nie został oznaczony jako strona kanoniczna”. Postępowanie jest analogicznie do wskazanego w punkcie 4.1.
5.4. Nie znaleziono (404)
W poprzednich wersjach błędy 404 były wykazywane jako błędy – aktualnie trafiły do kategorii „wykluczone”, jednak nie umniejsza to ich istotności. Podobnie jak w przypadku podstron wykazanych jako przekierowane, również należy prześledzić zewnętrzne i wewnętrzne miejsca linkujące nieistniejący adres i wdrożyć odpowiednie modyfikacje.
5.5. Pozorny błąd 404
W przeciwieństwie do poprzedniej przyczyny, podstrony z tej kategorii zwracają nagłówek HTTP 200, jednak ich postać została uznana za typową dla nieistniejącego adresu. Może to być pusta treść odpowiedzi (pusta strona) lub treść z komunikatem typu „Nie znaleziono”. Zazwyczaj obecne tu adresy wskazują na szerszy problem w używanym CMSie – mechanizm, który pozwala na ładowanie nieistniejących adresów z nagłówkiem istniejącgo adresu.
5.6. Wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik
Do wyboru innego kanonicznego adresu może dojść w połączeniu z dowolną przyczyną. Ta lista podstron zawiera zazwyczaj niewielką pulę adresów, których wyłącznym problemem jest niepoprawnie ustawiony tag canonical (według wyszukiwarki). Dotyczy to najczęściej pojedynczych podstron, które należy przeanalizować i zmodyfikować na indywidualnym poziomie. Należy tu pamiętać, że poprawność tagu canonical jest definiowana podobieństwiem treści między kanoniczną i kanonikalizowaną podstroną, stąd podstawową przyczyną są różnice między nimi. Jeśli wynikają one z budowy CMSa, wdrożenie kanoniczności można zastąpić przekierowaniem 301.
6. Monitoring zmian i usuwanie tymczasowych map stron
W skrócie: Kontroluj stany liczbowe przyczyn po wdrożeniu poprawek i zastąp testowe mapy stron właściwymi:
- W poprawnej mapie strony, wszystkie adresy powinny należeć do kategorii prawidłowe. Ich ilość można monitorować w czasie:
Jest to jednocześnie bezpośrednia miara skuteczności prac nad objętością indeksu. - Po okresie audytu i wdrażania zmian, mapy strony podzielone na 1000 adresów można usunąć i zastąpić końcowymi – większymi i bardziej zoptymalizowanymi. Usuwanie jest dostępne w starej wersji Google Search Console. Należy pamiętać by usunąć lub podmienić dotychczasowe pliki map stron, ponieważ mogą być odczytywane nawet po usunięciu z GSC.
- Końcowy efekt: wzrost jakości i objętości indeksu.
Podsumowanie
Już w drugiej połowie 2017 roku pojawiały się delikatne zapowiedzi ocieplenia współpracy firmy Google ze światem SEO. Nową wersję Google Search Console należy zdecydowanie ocenić jako pozytywny krok w tym kierunku. Otrzymaliśmy narzędzie SEO, które jest wyjątkowe, ponieważ dostarcza bezpośrednią i zazwyczaj jasną ocenę wszystkich adresów w indeksie z punktu widzenia wyszukiwarki: niepotrzebne jest odczytywanie za pomocą zewnętrznych narzędzi, scrapowanie wyników wyszukiwania czy sięganie do czasochłonnych ręcznych analiz. Z pewnością wszystkie wypisane wyżej porady nie wykorzystują pełni możliwości GSC – artykuł będzie regularnie aktualizowany wraz z nowymi obserwacjami oraz narzędziami. Czekamy m.in. na udostępnienie narzędzia do inspekcji adresów za pośrednictwem API, co powinno znacznie przyspieszyć pracę z portalami o większej objętości.
Jeden komentarz
Olek
Wpis idealny dla mnie 🙂 Od niedawna pracuję w branży i własnie niedługo będę zaczynał robić audyty SEO, trochę się tym martwiłem, ale już czuję się pewniej 🙂 Może jakieś wskazówki jeszcze przed pierwszym audytem?