Wszystko o algorytmie Pingwin

Żyjemy w niesamowitych czasach: wirtualna wyszukiwarka o nazwie Google daje zatrudnienie 57 tysiącom osób. Dla porównania w całym Opolu jest mniej więcej tyle samo pracowników we wszystkich branżach. A więc na Ziemi istnieje wyszukiwarkowe Opole, rozproszone miasto orbitujące wokół białej witryny z niebieskimi linkami. Co robi tak duża masa ludzi? To samo co każda korporacja – pieniądze.

Wiem: Google wiele mówi o misjach, celach, zasadach. Jeśli ktoś jeszcze nie widział wpisu o tej firmie na Wikipedii, zaspoileruję że już większość drugiego zdania stanowią tego typu rzeczy. Na tej samej zasadzie piłkarze przed każdym meczem zapowiadają ładną, widowiskową grę – brzmi to lepiej niż „wystarczy nam 1:0 po tragicznie nudnym meczu”. Na szczęście tutaj możemy darować sobie kurtuazję i przejść do rzeczy: tak, piłkarze grają by wygrywać, a Google prowadzi wyszukiwarkę i pozostałe usługi by zarobić.

Co to wszystko ma wspólnego z algorytmami?

W samej Polsce z wyszukiwarki korzysta 15 milionów osób miesięcznie. To potężne medium reklamowe. Wiele firm płaci by się w nim znaleźć. A mogą to robić na dwa sposoby: albo zapłacić Google za umieszczenie linku w reklamie przy wynikach, albo zapłacić firmie pozycjonującej za umieszczenie linku w samych wynikach. Wynika z tego zależność – im mniej skuteczny jest drugi sposób, tym więcej firm zwróci się z pieniędzmi do Google.

24 kwietnia 2012 wraz z nadejściem algorytmu Pingwin, korporacja Google wypowiedziała otwartą wojnę pozycjonerom. Wcześniejsze działania generalnie były spójne z troską o jakość wyników wyszukiwania, przynajmniej w swojej koncepcji. Na przykład ostatnio opisana Panda prawdopodobnie nie tylko karze, ale również nagradza strony. Natomiast Pingwin to armata wymierzona prosto w pozycjonerów.

Umówmy się: dostrzeżenie tego nie jest filozofią, to nie jest nawet poziom Talesa. Dobrze to obrazuje casus metatagu keywords. W zamierzchłych początkach wyszukiwarka Google brała pod uwagę to co było wpisane w metatagu keywords. Twórcy stron po zauważeniu tego, zaczęli nadużywać go, upychając tam wiele słów by pojawiać się w jak największej ilości zapytań. Z tego powodu Google po prostu zaczęło ignorować ten metatag.

To samo mogło stać się z linkami wykrytymi jako pozycjonujące – ale zamiast tego strony zostały ukarane. Bez sięgania do głębokich arkanów nauk akademickich jasne jest, że kary są stosowane by wymusić określone zachowanie. Google wysłało sygnał: przestańcie pozycjonować, zdobywanie jakichkolwiek linków jest złe. I starannie pielęgnuje atmosferę zainicjowanego konfliktu. Firma podała znacznie mniej informacji o Pingwinie niż o Pandzie. Nieliczne odpowiedzi pracowników bywają sprzeczne, jak na przykład tegoroczna informacja o tym, że Pingwin jest algorytmem działającym na żywo – która potem została sprostowana, że jednak jest manualnie odświeżany. Obrazu dopełnia taka błahostka jak etymologia: wewnętrzna nazwa algorytmu nigdy nie wypłynęła do mediów, ponieważ zdaniem Google zbyt wiele powiedziałaby o sposobie działania. Dlatego jako przydomek wybrano sympatycznego Pingwina. Brzmi jak tajemnica strzeżona skuteczniej niż szczegóły budowy bomby atomowej (skuteczniej ponieważ amerykańskie instrukcje atomowe zostały kilka lat temu wykradzione przez wywiad pewnego azjatyckiego mocarstwa).

Przejście do technikaliów dotyczących Pingwina od początku jest naznaczone powyższym podejściem. Czego dotyczy algorytm? Zgodnie z wykładnią Google: tego co narusza wytyczne Google dla webmasterów. W wersji polskiej to ponad 300 odpowiedzi na najróżniejsze pytania…

Google na swoim blogu we wpisie wprowadzającym algorytm omówiło karanie za linki oraz za zbyt dużą ilość słów kluczowych. To dwa zupełnie różne elementy, więc zasadne jest pytanie czy na pewno znajdują się w tym samym algorytmie. Być może, zgodnie z retoryką wojenną, pomiar słów kluczowych na stronie to tylko zasłona dymna? Doświadczenia wskazują, że algorytm Pingwin dotyczy przede wszystkim linków.

Na jakie linki Pingwin jest wrażliwy?

Wspomniane wytyczne dla webmasterów prezentują następującą listę:

  • kupowane i sprzedawane linki
  • szeroko zakrojone wymiany linków pomiędzy stronami
  • automatycznie pozyskiwane linki
  • wiele linków z artykułów sponsorowanych i wpisów gościnnych
  • reklamy tekstowe bez atrybutu „nofollow”
  • linki w treści lub podpisach z nienaturalnym anchorem (np. „pizza poznań”)
  • linki w widgetach
  • wiele linków w stopkach

Jednak nad listą jest bardzo jasne ostrzeżenie: na celowniku Google są wszystkie linki bez atrybutu „nofollow”, które zostały pozyskane z myślą o wyszukiwarce.

(Dygresja: polskie tłumaczenie odbiega od sensu angielskiego oryginału. W oryginale pada słowo „intended”, które oznacza zamiar domyślnego podmiotu, czyli w tym przypadku osoby pozycjonującej. W polskiej wersji w ogóle nie ma podmiotu osobowego, a w miejscu „intended” jest czasownik „mogą” uosabiający linki…)

Wbrew pozorom to całkiem dużo mówi o technicznej stronie algorytmów. Google daje do zrozumienia, że algorytm ocenia czy linki powstały przypadkiem i naturalnie, czy jednak stworzył je pozycjoner. Krótko mówiąc: Pingwin tropi pozycjonerów. Być może o to chodziło ze zbyt wiele wyjawiającą nazwą, że w oryginale ma coś wspólnego z myślistwem?

Po teoretycznym wstępie i uznaniu, że wszystkie zdobyte linki są zagrożone, czas na bardziej praktyczne podejście. Złe linki cechuje nieodpowiednie umiejscowienie (stopki, niska jakość otoczenia), nienaturalna forma (słowo kluczowe jako anchor) i zbyt duża ilość. Dobre linki to te, które nie mają żadnej z tych właściwości. Warto jednak pamiętać, że Pingwin nie karze za jeden zły link, lecz za stosunek złych do dobrych:

Patrzymy na wszystkie dane związane z twoją stroną. Jeśli zobaczymy, że sprawy toczą się w dobrym kierunku, wtedy nasze algorytmy wezmą to pod uwagę. (…) Nie powiedziałbym, że musisz mieć powyżej 50% (dopowiedź: dobrych linków) i wtedy algorytm odpuści twoją stronę. Jest wiele odcieni szarości, które algorytm może ocenić jako: to bardzo źle wyglądało, ale intensywnie pracują nad tym żeby to poprawić.

Jeśli złych linków jest zbyt dużo, strona kończy z karą (filtrem algorytmicznym) w trakcie najbliższego odświeżenia Pingwina. Do tej pory algorytm był uruchamiany zaledwie 6 razy:

Pingwin 1.0     24/04/2012 — 5% zapytań zmienionych
Odświeżenie 26/05/2011 — 0.1%
Odświeżenie 05/10/2012 — 0.3%
Pingwin 2.0 22/05/2013 — 2.3%
Odświeżenie 04/10/2013 — 1%
Odświeżenie 17/10/2014 — 1%

Przykład wykresu ruchu z wyszukiwarki na stronie, która uległa Pingwinowi:

W trakcie odświeżenia część witryn zostaje ukarana, natomiast z części stron kary zostają zdjęte. Dzieje się tak, gdy właściciele usuną nienaturalne linki i/lub zrzekną się ich w narzędziu disavow. Odzyskanie ruchu wygląda na przykład tak:

Zdarza się też, że nie udaje się już odzyskać całego ruchu sprzed uderzenia:

Należy dodać, że z odświeżenia na odświeżenie, kolejne aktualizacje algorytmu były coraz bardziej rozciągnięte w czasie. Ostatni powrót Pingwina pod koniec 2014 roku trwał aż 6 tygodni, w trakcie których część stron wyszła z filtra by potem… ponownie dostać karę w trakcie tego samego odświeżenia.

Co dalej?

Do tego momentu (październik 2015) usłyszeliśmy już kilka zapowiedzi pracowników firmy Google, według których niedługo pojawi się nowa aktualizacja Pingwina. Według wstępnych szacunków, ma do tego dojść pod koniec roku. Wszyscy podkreślają, że algorytm wymagał ogromu pracy ze względu na wdrożenie nowej formuły – aktualizacji w czasie rzeczywistym / live / na żywo. Niestety Google kontynuuje politykę informacyjną polegającą na braku informacji, stąd na razie możemy tylko próbować domyślać się co będzie znaczyło ‚live’ w kontekście Pingwina. Drobny promyk światła na sprawę rzuca pracownik Google:

Zasadniczo, zarówno Panda jak i Pingwin są wbudowane w infrastrukturę działającą w czasie rzeczywistym, lecz dane muszą być aktualizowane osobno.

Zmiana zatem powinna dotyczyć danych o które opiera się Pingwin. Czy będą to po prostu nowe roboty indeksujące dane na potrzeby algorytmu? Rozwiązania typu bieżące wdrażanie disavow? Zwykłe zapętlenie przetwarzania wyników, wytaczające się tydzień po tygodniu? Czy może odwilż na froncie walki Google z pozycjonerami? Prawdopodobnie w przeciągu najbliższych miesięcy poznamy odpowiedź.

Zalinkowane źródła: pl.Wikipedia.org, GoogleWebmasterCentral.blogspot.com, Support.google.com, Seroundtable.com. Grafiki: Lehigh.edu, blog.Kissmetrics.com, GoogleWebmasterCentral.blogspot.com, Support.google.com, SearchEngineWatch.com.

Komentarze: 2

  • Stania

    Stania

    Odpowiedz

    No i w końcu znikną „naturalne linki” typu Najtańsza pożyczka Bemowo ….

    Pozdrawiam – dobry artykuł

  • ;)

    ;)

    Odpowiedz

    * kupowane i sprzedawane linki
    * szeroko zakrojone wymiany linków pomiędzy stronami
    * automatycznie pozyskiwane linki

    Często reklamowane na forum pio, widocznie jeszcze google wszystkiego nie wycięło ;).

    Naturalne linki. Zauważyłem… i zdziwiłem się.
    Np w formie stylu stopki wordpress… nazwy firm* idealnie zgodne z adresem więc czysty oficjalny odnośnik zgodny z polityką wyszukiwarki 😉

    Oczywiście stronę „polecającą” i firmę nie łączy nic poza tym że obie są w internecie, nawet kontynent inny.

    Są pewnie jeszcze bardziej wyrafinowane sposoby 😀 .

Skomentuj

Twój email nie zostanie upubliczniony. Wymagane pola zostały oznaczone *
Możesz używać następujących tagów HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>