Google wykorzystuje do swojej działalności wiele różnych algorytmów odpowiedzialnych za istotne zadania. Jednym z nich jest RankBrain mający istotny wpływ na określanie rezultatów wyszukiwania. Warto dowiedzieć się czegoś więcej na jego temat.
Czym jest RankBrain?
Pod nazwą RankBrain kryje się specjalny system, dzięki któremu Google są w stanie lepiej zrozumieć możliwy cel zapytania wpisywanego przez użytkownika. Algorytm ten powstał wiosną 2015 roku, ale oficjalnie ogłoszony został dopiero w październiku 2015.
Na początku RankBrain wykorzystywano w przypadku zapytań, których wcześniej wyszukiwarka nie napotkała. Stanowiły i nadal stanowią one około 15% wyszukań. Następnie algorytm rozwinięto tak, aby miał wpływ na wszystkie rezultaty wyszukiwania.
W swej istocie RankBrain to system uczenia maszynowego tworzący Hummingbird. Sprawił on, że wyszukiwarka Google przestała skupiać się na odczytywaniu liter, a zaczęła kłaść nacisk na reprezentowane przez nie Entity (podmiot).
Można stwierdzić, że RankBrain to wstępny system przesiewu. Gdy do Google wprowadzone jest zapytanie, algorytm wyszukiwania dopasowuje zapytanie do zamiaru użytkownika. W ten sposób możliwe jest dostarczenie najlepszej treści w jej najlepszych formach.
Dlaczego Google wprowadziły RankBrain?
Początkowo celem RankBrain było rozwiązanie jednego, ale bardzo poważnego problemu. Było nim to, że około 15% zapytań nie posiadało kontekstu ani nie przeprowadzono ich wcześniejszej analizy w celu ustalenia czy ich rezultaty są dobre lub nie spełniają zamiarów użytkowników.
W przypadku RankBrain mamy do czynienia ze skupieniem się na podmiotach, a także kontekstach środowiskowych (np. lokalizacja wyszukującego) oraz na przewidywaniu znaczenia.
Może to być prosty proces zrozumienia tego, że kolejność słów może stanowić funkcję procesu wyszukiwania.
Bill Slawski na temat RainBrain w przestrzeni wyszukiwania
To an equestrian a horse is a large 4 legged animal, to a carpenter, a horse has 4 legs, but it doesn’t live in fields or chew hay, to a gymnast a horse is something I believe you do vaults upon; with RankBrain context matters, and making sure you capture that context is possibly a key to optimizing for this machine learning approach.
Jak działa RankBrain?
Co prawda Google nie wyjaśniły jak dokładnie działa RankBrain. Niemniej jednak, można mieć pewne przypuszczenia dotyczące funkcjonowania tego algorytmu.
Nowa funkcja wyszukiwania
Przede wszystkim trzeba zacząć myśleć jak maszyna. W przypadku RankBrain wyszukiwarka rozumie charakter funkcjonowania Entities i możliwe jest skupienie się na znaczeniu danego zapytania wpisywanego w wyszukiwarce.
Entities (podmioty)
Jednym z podstawowych mechanizmów RankBrain jest możliwość rozpoznawania Entities. Jeśli algorytm zrozumie, że zapytanie zawiera takie same Entities, jak inne zapytanie widziane wcześniej, wówczas może to stanowić wskazanie, że zestawy rezultatów mogą być podobne, identyczne lub pozyskane z tej samej listy odnośników URL.
TOP10
W 2013 roku, jeśli chodzi o odpowiadanie na zapytania z wykorzystaniem nieustrukturyzowanych danych, Google opisały metodę, w której można:
- Dodawać Entities do ich własnego indeksu.
- Sprawdzać Entities w ramach własnego top 10.
- Przewidywać jakie Entities są powiązane ze sobą oraz z najlepszymi odpowiedziami na zapytania.
Monitorowanie
Należy pamiętać, że jest to system uczenia maszynowego. Nieodłączna jest w tym przypadku funkcja określania, testowania, śledzenia i dopasowywania.
Zasadniczo system będzie postrzegać zapytania z uwzględnieniem mierzenia sukcesu. Następnie oceniane będą różne sygnały i kontrolowana będzie ich skuteczność.
System został uruchomiony po to, aby rozwiązać problem zapytań, jakich Google jeszcze nie napotkało. Zwykle zawierają one mało słów, które można monitorować.
Trzeba pamiętać, że system nie tylko skupia się na Entities znajdujących się w zapytaniu, ale również na Entities wykorzystanych do jego stworzenia. Oznacza to więc samego użytkownika, jego lokalizację oraz urządzenie.
Są to zmienne, które RankBrain będzie uwzględniać tak samo jak w przypadku analizy i porównania ruchu pomiędzy urządzeniami stacjonarnymi a mobilnymi. Uwzględniana będzie też godzina i typ urządzenia, aby zrozumieć jak różni użytkownicy dokonują interakcji z daną formą działalności w różnych scenariuszach.
Na podstawie powyższych informacji można stwierdzić, że Google wprowadziło RankBrain, aby lepiej zrozumieć zapytania.
RankBrain jako czynnik rankingowy
Zgodnie z informacjami dostarczonymi przez Google, RankBrain osiągnął spory sukces od jego wprowadzenia na początku 2015 roku. Ma on ogromny wpływ na sporą liczbę zapytań. Duże znaczenie tego systemu samodzielnej nauki sprawiło, że stał się on trzecim najważniejszym czynnikiem rankingowym wyszukiwarki. RankBrain odgrywa istotną rolę w określaniu stosowności zapytań.
Dużą różnicą w porównaniu z aktualizacjami, które Google opublikowało do tej pory jest to, że system sam uczy się nowości, a zmiany w algorytmie nie są wykonywane za sprawą człowieka. Jednak nawet jeśli RankBrain zajmuje trzecie miejsce na liście czynników rankingowych Google to nadal jest jednym z setek czynników wykorzystywanych przez Google do określenia stosowności i jakości strony internetowej w stosunku do zapytania oraz do prawidłowego ustalania rezultatów wyszukiwania.
RankBrain a wyszukiwanie Google
Obecnie po powiązaniach pomiędzy stronami internetowymi (linki zwrotne backlinks) oraz sygnałach semantycznych, takich jak zachowanie użytkownika, RankBrain jest trzecim najważniejszym czynnikiem rankingowym.
Można więc stwierdzić, że RankBrain stanowi istotną część składową wyszukiwania Google, które opiera się na algorytmie zwanym Hummingbird. Uwzględnianych jest do 200 różnych czynników, czyli tak zwanych sygnałów, aby ustalić czy dana informacja jest zgodna z zamiarami użytkownika odnośnie wyszukiwania i czy można ją wyświetlić w rezultatach wyszukiwania. Informacja ta może posiadać dowolną formę, taką jak strona internetowa, aplikacja, dokument czy też materiał filmowy.
Przed wprowadzeniem RankBrain, rezultaty wyszukiwania były obliczane z wykorzystaniem statystycznych kryteriów oceny, które zostały stworzone przez ludzi. W przypadku uzyskiwania niezadowalających rezultatów wyszukiwania, wartości te były sprawdzane, zmieniane, a czasami nawet całkowicie usuwane. Takie kryteria oceny mogą być postrzegane jako filtry powiązane z wybranymi aspektami algorytmu Google.
Niektóre z tych filtrów są znane i zapożyczyły swoje nazwy ze świata zwierząt. Przykładem może być Panda skupiająca się na treści i stosowności stron internetowych, z kolei Penguin (pingwin) analizuje jakość linków ze stron. Pidgeon (gołąb) skupia się na wyszukiwaniu lokalnym.
Jakie strony będą czerpać korzyści z RankBrain?
Wykorzystanie RankBrain oraz przejście z czysto statystycznych na semantyczne czynniki rankingowe w algorytmie Google prowadzi do poniższych wniosków odnośnie stron czerpiących z tego korzyści. Są to strony i elementy, takie jak:
- Strony z przejrzystą i łatwą do zrozumienia architekturą informacji.
- Strony z unikalną treścią, które są zgodne z intencjami użytkownika (nawet na poziomie artykułu).
- Strony z możliwością spełnienia potrzeb wyszukiwania nakierowanego na konwersję.
- Ustrukturyzowane dane (znaczniki ustrukturyzowanych danych).
- Entities (zapytania w wyszukiwarce powiązane z osobami, miejscami i faktami) oraz ich powiązania semantyczne.
- Treść nakierowana na użytkownika.
- Zróżnicowanie treści powiązane ze wszystkimi aspektami Entity (podmiotu).
Mogą to być różnego rodzaju obrazy, grafiki, materiały wideo zasługujące na ich osobne wyświetlenie w rezultatach wyszukiwania Google (Knowledge Graph, Universal Search, Featured Snippets). Przed RankBrain jeszcze długa droga do uzyskania statusu niezależnego systemu AI. Algorytm ten jeszcze nie uczy się niezależnie, tylko jest „szkolony” przez inżynierów Google. Niemniej jednak, wdrożenie uczenia maszynowego powinno ułatwić sprawę w przypadku złożonych zapytań oraz odpowiadania na wcześniej nieznane zapytania bez pomocy człowieka