Semantyczne słowa kluczowe (Latent Semantic Indexing) to wyrazy lub wyrażenia powiązane kontekstowo. Mianem LSI określa się też proces wyszukiwania informacji podczas przetwarzania języka naturalnego (LSI), który identyfikuje relacyjność konkretnych słów, a przez to pozwala na bardziej precyzyjne wyszukiwanie. Uważa się, że słowa kluczowe powinny stanowić 1–2% tekstu. Część z nich to frazy powiązane semantycznie, pozwalające wyszukiwarkom i osobom z nich korzystającym na lepsze zrozumienie treści. Poprawne określanie intencji użytkownika i trafne odczytywanie kontekstu to czynniki, które prawdopodobnie będą miały coraz większe znaczenie w skutecznym pozycjonowaniu. Jaką rolę odgrywa w tym LSI i dlaczego niektórzy specjaliści SEO uważają, że… nie należy się tym przejmować?
LSI – teoria czy metoda SEO?
Czym jest LSI?
LSI to metoda komputerowa i technika przetwarzania języka naturalnego, która umożliwia zaawansowaną analizę danych, w wyniku której da się znaleźć korelacje między pojęciami pozornie niezwiązanymi. Mówiąc prościej – dzięki LSI łatwo określić relacje między słowami i umieścić je w konkretnym kontekście, choć jest to związane z analizą statystyczną, a nie rozumieniem słów w dosłownym sensie. LSI jest nazywana teorią SEO (szczególnie wśród osób, które uważają, że sama koncepcja LSI nie ma wpływu na SEO) lub metodą, choć to drugie określenie wydaje się nieco na wyrost, jeśli weźmiemy pod uwagę ograniczenia rozumienia języka przez Google. Teoretycznie LSI pomaga określić temat artykułu lub strony, ponieważ identyfikuje słowa często współwystępujące. Jeśli w tekście znajdą się frazy: kawa mrożona, mleko, lód, zimna woda, a kawa mrożona będzie frazą główną, Google zinterpretuje stronę w kategoriach kulinarnych.
Samo korzystanie z LSI budzi wątpliwości, ponieważ jest to stara technologia, a Google nigdy nie potwierdziło, że z niej korzysta. Sam John Mueller stwierdził, że „ There’s no such thing as LSI keywords – anyone who’s telling you otherwise is mistaken, sorry”, jednak zdarzało się już, że informacje udostępniane przez Google nie korespondowały z działaniem algorytmów. M.in. z powodu wypowiedzi Muellera część specjalistów SEO traktuje LSI jako teorię, a nie ważny czynnik rankingowy. Z kolei Josuha Hardwick w swoim artykule pisze o LSI jako semantycznie powiązanych wyrażeniach i podmiotach: „LSI keywords don’t exist, but semantically-related words, phrases, and entities do, and they have the power to boost rankings”. Nie ma wątpliwości, że Google analizuje relacje między słowami i dba o to, żeby dostarczać wzbogaconą treść:
„These relevance signals help Search algorithms assess whether a webpage contains an answer to your search query, rather than just repeating the same question. Just think: when you search for 'dogs’, you probably don’t want a page with the word 'dogs’ on it hundreds of times. With that in mind, algorithms assess if a page contains other relevant content beyond the keyword 'dogs’ – such as pictures of dogs, videos or even a list of breeds. It’s important to note that, while our systems do look for these kind of quantifiable signals to assess relevance, they are not designed to analyse subjective concepts such as the viewpoint or political leaning of a page’s content”.
Joshua Hardwick
Z tego powodu, nawet jeśli LSI nie istnieje w formie, którą neguje John Mueller, to na pewno słowa kluczowe LSI pełnią rolę „wzmacniająca” główną frazę kluczową i mogą pomóc w pozycjonowaniu.
Semantyczne słowa kluczowe, czyli słowa… podobne?
Powiązane słowa kluczowe nie zawsze są bezpośrednio związane z główną frazą, dlatego w LSI duży nacisk kładzie się na kontekst, a nie samo podobieństwo między słowami. Chcąc zidentyfikować semantyczne keywordsy dla naszej frazy głównej, nie wybierzemy wyłącznie synonimów tylko frazy powiązane znaczeniowo. Paradoksalnie, ukryte indeksowanie semantyczne rozwiązuje problem polisemiczności, ponieważ pozwala określić faktyczny temat danej strony. Z tego samego powodu nie opłaca się korzystać z generatorów treści i narzędzi AI, które tworzą teksty za pomocą wyrazów bliskoznacznych.
Przykład: semantycznym słowem kluczowym nawiązującym do Hurghada będzie TUI z powodu powiązań kontekstowych.
Fraza LSI posiada oczywiste powiązania relacyjne z frazą główną, jednak nie ma tego samego znaczenia, dlatego frazą LSI nie będzie np. pies (w relacji do czworonoga). Keywordsy LSI są często również mylone z frazami długiego ogona. Mogą być częścią wyrażeń long tailowych, ale częściej to dwie odrębne frazy.
Frazy LSI (np. apple, appstore, itunes, iphone gesty (w odniesieniu do iPhone)) | Frazy długiego ogona (Np. buty skórzane z zamkiem, karma dla psów z nadwagą (w odniesieniu do fraz głównych buty skórzane i karma dla psów)) |
mogą być ogólne lub specyficzne, | specyficzne, |
mają dużo wyszukiwań lub prawie w ogóle nie są wyszukiwane, | węższe znaczeniowo i pojemnościowo niż frazy LSI, |
„obudowują” główną frazę kluczową lub frazę long tailową, pozwalając na lepszą identyfikację tematu artykułu, | mają lepszy współczynnik konwersji, |
pełnią funkcję „wspierającą” w pozycjonowaniu, | są łatwiejsze w pozycjonowaniu, |
różnicują synonimiczne frazy. | mniejszy wolumen wyszukiwań w porównaniu do bardziej ogólnych i „pojemnych” fraz. |
Jakie problemy rozwiązuje LSI?
Polisemiczność
Ukryte indeksowanie semantyczne radzi sobie z polisemicznością na poziomie całej witryny. Jeśli „cookie” połączymy z „milk” czy „recipe”, Google poprawnie określi stronę jako miejsce z przepisami. Z kolei „cookie” występujące z keywordsami LSI „chrome” lub „safari” będzie sygnałem, że strona dotyczy plików cookie i nie ma nic wspólnego z jedzeniem. LSI za pomocą analizy słów współwystępujących jest w stanie określić, czy za intencją użytkownika stoi chęć upieczenia ciastek czy usunięcie cookies w przeglądarce.
Bez dodatkowych LSI Google wyświetla wyszukiwania, które w szerszym kontekście odpowiadają na „cookie”:
Keyword Stuffing
Aktualizacja Koliber (Google Hummingbird Update) umożliwiła lepsze rozumienie słów kluczowych – Google zaczęło analizować całe wyrażenie, w wyniku czego ucierpiały witryny stosujące tzw. keyword stuffing, czyli wielokrotne powtarzanie tej samej frazy kluczowej, co miało zwiększyć jej wagę. LSI dostarcza fraz „uzupełniających”, które mogą zastąpić powtarzalne keywordsy. Ma to kilka zalet:
- główna fraza jest „podbijana” za pomocą LSI,
- tekst jest atrakcyjniejszy dla użytkownika,
- algorytmy mogą głębiej analizować tematykę witryny, a treść jest bardziej zrozumiała.
Przykład keyword stuffingu:
Samo słowo niedziela jest trudno zastąpić, ale zamiast powtarzać niedziela handlowa, warto zastosować wyrażenia pochodne (np. zakupy w niedziele).
Synonimizacja
Synonimiczność wynika z nawyków językowych użytkowników, ich kompetencji, a także preferencji komunikacyjnych. Nie ma potrzeby stosowania na siłę synonimów, jeśli w tekście znajdują się frazy powiązane semantycznie, ponieważ Google powiąże frazy ze słowami współistniejącymi.
Warto pamiętać, że frazy LSI nie zawsze będą miały dużą liczbę wyszukiwań, ale mimo to ich użycie pozwala wyszukiwarce na lepsze zrozumienie tematu strony i podnosi autorytet danego tekstu.
Uzupełnienie docelowego słowa kluczowego frazami LSI jest sposobem na odświeżenie starej treści i poprawienie jej pozycji w wyszukiwarce. Research pod kątem LSI powinien być stałym elementem cyklicznej optymalizacji tekstów, ponieważ umożliwia wyświetlanie się witryny na większą liczbę fraz oraz ułatwia algorytmom zrozumienie, o czym jest dany artykuł i strona. Frazy powiązane semantycznie stosuje się wszędzie tam, gdzie frazy główne i poboczne, czyli w śródtytułach, adresach url, znacznikach i treści.
Budowanie relacji kontekstowych między słowami
Naturalne tworzenie sieci kontekstowej
Tworzenie sieci powiązanych słów kluczowych jest do pewnego stopnia naturalne, ponieważ przy tworzeniu contentu np. na bloga poświęconego pielęgnacji włosów większość tematów będzie dotyczyła głównego wątku, projektując w ten sposób sieć semantyczną. Jednak nie zawsze tak jest. Z trudniejszą sytuacją mamy do czynienia np. w przypadku sklepów internetowych. Budowanie relacji kontekstowych w obrębie kategorii nie jest takie łatwe, ponieważ bazujemy na mniejszej puli pojęć. Warto jeszcze raz podkreślić, że LSI to nie synonimy, dlatego szafka nocna i stolik nocny, nie spełniają założeń ukrytego indeksowania semantycznego.
Jak znaleźć słowa kluczowe LSI?
Wyszukiwania podobne i sugestie Google
Skorzystanie z wyszukiwarki jest najprostszym sposobem, żeby poznać pojęcia powiązane semantycznie. Sugestie poniżej są odpowiedzią na frazę olejowanie włosów:
Emulgowanie włosów jest silnie powiązanym pojęciem (do zmycia oleju z włosów potrzebne jest jego zemulgowanie, czyli umycie odżywką lub maską. Połączenie oleju z kosmetykiem umożliwia usunięcie tłustej warstwy), mimo to Ahrefs na frazę olejowanie włosów nie wyświetla frazy sugerowanej przez Google. Znajdziemy za to olejowanie włosów emulgowanie. Propozycja Ahrefsa ma wolumen 0, tymczasem emulgowanie włosów (wg danych z tego samego narzędzia) już 200.
Sugestie od Google również są źródłem pojęć powiązanych semantycznie:
Jednak, tak samo jak w przypadku każdej innej analizy, przy ustalaniu keywordsów nie należy wybierać fraz bezrefleksyjnie. Kurs strzyżenia włosów jest bardzo dobrą frazą, spełniająca założenia LSI, ale nie sprawdzi się, jeśli prowadzimy sklep z maszynkami do włosów, przeznaczonych do domowego strzyżenia. Cztery pierwsze propozycje trafniej odpowiadają frazie głównej.
Narzędzia do wyszukiwania fraz powiązanych semantycznie
Jednym z najpopularniejszych narzędzi jest Keyword Tool, który wyświetla tzw. long tailowe frazy kluczowe (frazy z długiego ogona) oraz pojęcia z ukrytego indeksowania semantycznego. Wykorzystuje funkcję autouzupełniania, dzięki czemu zwraca wyniki zawierające sugestie Google. Innym narzędziem, które dostarcza powiązane frazy z długiego ogona, jest Answer The Public (pomocny także przy poszukiwaniu inspiracji na temat lub tytuł artykułu).
Kolejną propozycją jest lsigraph.com – narzędzie to „generuje słowa kluczowe LSI, które kocha Google”. To oficjalne hasło, które dużo mówi o sile LSI, choć według niektórych źródeł rola słów powiązanych kontekstowo jest przeceniana – w dużej mierze ze względu na swoje ograniczenia.
Nagłówki H1 i H2 – dlaczego… nie działają?
Samo umieszczenie głównej frazy kluczowej w tytule (nagłówku poziomu pierwszego – h1) oraz powiązanych fraz kluczowych w śródnagłówkach (h2–h6) nie jest wystarczające. Copywriter SEO, jeśli nie wie, czym jest LSI, zastosuje podane frazy kluczowe w sztuczny sposób i chociaż gotowy artykuł może być dobrze zoptymalizowany, nie będzie tak dobry, jak tekst wzbogacony w naturalny sposób o semantyczne słowa kluczowe. Przy projektowaniu treści warto wziąć pod uwagę frazy exact match, frazy long tailowe oraz LSI. Tekst wykorzystujący te trzy rodzaje może wysoko rankować w wynikach wyszukiwania, jednak przegra z artykułem pisanym przez eksperta, którego znajomość semantycznych słów kluczowych będzie w naturalny sposób wzbogacona przez wiedzę branżową. Terminy powiązane pojęciowo często są specyficzne i ma to znacznie zwłaszcza w tematach specjalistycznych (np. artykule na temat powłok polimocznikowych).
W jaki sposób sobie z tym poradzić? Najlepszym rozwiązaniem wydaje się samodzielne pisanie treści (jeśli zajmujemy się osobiście pozycjonowaniem swojej witryny), ale to tylko pozornie dobre wyjście, bo o ile rozwiązuje problem naturalnego wzbogacenia tekstu o frazy powiązane semantycznie, to prawdopodobnie nie sprawdzi się w kontekście technicznej optymalizacji pod SEO. Z drugiej strony, ścisłe trzymanie się przez copywritera SEO listy LSI, np. wygenerowanej w lsigraph, doprowadzi do przeładowania treści frazami powiązanymi i nie podniesie autorytetu artykułu, bo jego sens zostanie rozmyty. Kompromisem jest skorzystanie z usług copywritera SEO, który posiada wiedzę z określonej dziedziny, dzięki czemu będzie w stanie w naturalny sposób umieścić semantyczne słowa kluczowe. Teksty pisane przez ekspertów samoistnie spełniają założenia ukrytego indeksowania semantycznego, bo content niejako „pisze się sam” ze względu na znajomość tematu, jednak w większości przypadków wystarczy powierzchowna znajomość branży lub pogłębiony research i świadome stosowanie fraz LSI.
Podsumowanie
LSI koresponduje z metodą klastrów tematycznych (topic cluster). Tworzenie contentu obudowanego wokół głównego tematu i powiązanego kontekstowo ma coraz większe znaczenie w pozycjonowaniu, chociaż samo ukryte indeksowanie semantyczne bywa bagatelizowane ze względu na fakt, że trudno dokładnie zmierzyć jego skuteczność. Warto również podkreślić, że technologia LSI powstała w latach 80. i nie została stworzona na potrzeby SEO (ani w ogóle witryn internetowych). Planując strategię SEO, opłaca się stosować LSI z co najmniej kilku powodów, nawet jeśli nie wierzymy, że algorytmy Google z korzystają z ukrytego indeksowania semantycznego przy interpretowaniu zapytań użytkowników i powiązywaniu ich ze słowami kluczowymi: unikamy w ten sposób keyword stuffingu, różnicujemy treść, zwiększamy szansę na poprawną interpretację tematu tekstu oraz stwarzamy okazję do trafienia w niszę (podobnie jak w przypadku fraz long tailowych).
2 komentarze
Zgred
A googlersi już w 2019 powiedzieli, że LSI w ogóle nie jest brane pod uwagę.
Kamil Rybicki
Komentowany artykuł również zawiera informację, że Google nigdy nie potwierdził stosowania LSI. Jeśli chodzi natomiast o same wypowiedzi pracowników Google, polecam lekturę innego artykułu: https://nprofit.net/pl/wypowiedzi-pracownikow-firmy-google-w-swiecie-seo/. Myślę, że następujący cytat będzie tutaj najbardziej odpowiedni: „Najprościej potraktować wypowiedzi pracowników firmy Google podobnie jak cała branża traktuje wytyczne o systemach wymiany linków – ignorować.”