Google Search Console jest narzędziem przydatnym w identyfikowaniu problemów z indeksacją, ale na pewno nie jest wystarczające. Można w nim znaleźć przykłady stron, które nie są zindeksowane, ale nie można zakładać, że lista ta jest kompletna.
Content
Gdzie w Google szukać informacji o niezindeksowanych stronach?
Aby znaleźć informacje o niezindeksowanych stronach w obrębie domeny należy przejść do widoku Indeksowanie > Strony.
Można w pierwszej kolejności skorzystać z raportów Strony > Strona wykryta – obecnie niezindeksowana oraz Strony > Strona zeskanowana, ale jeszcze nie zindeksowana.
Co oznaczają te statusy?
1) wykryta – obecnie niezindeksowana
To znaczy, że Google chodząc po serwisie, jego sitemapie, a także innych serwisach trafił na odniesienia do adresów URL w badanej domenie, ale jeszcze ich nie przecrawlował i nie podjął decyzji, czy je indeksować, czy nie.
2) zeskanowana, ale jeszcze nie zindeksowana
Strona została przecrawlowana, ale Google jeszcze nie dodało jej do indeksu.
3) Pozostałe statusy
Większość pozostałych statusów w raporcie Indeksowanie w Google Search Console odnosi się do stron niezindeksowanych z konkretnych powodów. Czyli nie są to strony, na indeksację, których czekamy, tylko takie, których indeksacja nie będzie miała miejsca ze względu na poszczególne kwestie techniczne – błędy 4xx, przekierowania 3xx, dyrektywy noindex lub duplikaty (ze wskazaniem innego adresu kanonicznego lub bez).
Minusy sprawdzania statusów indeksowania
Próba pozyskania listy niezindeksowanych stron z Google Search Console w ten sposób powinna dać jakieś odpowiedzi, ale nie jest to metoda idealna, ponieważ:
- nie uwzględnia URL, których Google jeszcze nie wyłapał, których po prostu nie zna,
- te raporty mają często opóźnienie względem rzeczywistości i w praktyce część tych URL może już być w indeksie,
- każdy z tych raportów podaje tylko przykładowe strony, a nie wszystkie, co w przypadku bardzo dużego serwisu jest bardzo problematyczne.
Zatem pewnie uda się znaleźć niezindeksowane strony, ale nie ma gwarancji, że to będą wszystkie niezindeksowane adresy URL.
Jak zatem sporządzić listę stron do zindeksowania?
Lepszym rozwiązanie będzie wyciągnięcie listy URL z sitemapy lub własnego crawla (np. za pomocą Sitebulb lub Screaming Frog SEO Spider), a następnie sprawdzenie tego narzędziem do weryfikacji indeksacji. Są toole (Seowl, Gindex.me), które za pomocą operatora site i/lub inurl odpytują SERP-y o konkretne URL i informują, co jest w odpowiedzi, a co nie. Narzędzia wykonują wirtualnie ten proces na większą skalę:
Oczywiście można to robić na piechotę, korzystając z inspektora URL w Google Search Console lub wysyłając do Google zapytanie o fragment tekstu w cudzysłowie, ale po co…
Korzystanie z narzędzi odpytujących SERP-y też nie załatwia jednak wszystkiego. Zindeksowane adresy URL nie zawsze pojawiają się w odpowiedzi w SERP-ach. Co do zasady, jeśli w SERP-ach jest pozytywna odpowiedź, to adres jest w indeksie. Jednak jeśli jej nie ma, to nie ma pewności, czy jest, czy nie. I wtedy dopiero należy zrobić analizę ręczną tego, co nam zostanie z badania operatorem site.
Można pójść zatem krok dalej i skorzystać z narzędzia integrującego Google Inspection Tool z arkuszami:
Są to jednak (poza trialami) rozwiązania płatne, ale przecież nie ma nic (sensownego) za darmo 😉