Autorem poniższego tekstu jest Umay Jones – specjalistka ds. reklamy i public relations. Umay urodziła się w Turcji, ukończyła Uniwersytet Egejski w Izmirze. Już ponad 10 lat ona działa w sektorze reklamy cyfrowej i zajmuje się promowaniem największych marek międzynarodowych. Przez ostatnie 5 lat Umay mieszka w Wielkiej Brytanii i pracuje w agencji Webcertain na stanowisku kierownika ds. cyfrowego marketingu medialnego.
Źródło: http://blog.webcertain.com
Nowa wyszukiwarka nie miała łatwo przy wejściu na nowy dla niej rynek turecki. Szczególnie, jeśli weźmiemy pod uwagę, że już od ponad 15 lat na rynku panował taki poważny monopolista jak Google. Niemniej jednak wejście Yandexa do Turcji zakończyło się sukcesem. Celem wyszukiwarki jest posiadanie 20-25% udziału w ruchu wyszukiwania, a to wcale nie jest mała liczba. Nawiasem mówiąc, te procenty Yandex musi „odebrać” Googlowi.
Turcja stała się pierwszym z niesłowiańskich krajów, na rynek którego Yandex zdecydował się wejść, zaczynając swoją ekspansję międzynarodową. Jednocześnie turecka wyszukiwarka stała się dla spółki ważnym pilotażowym projektem. Populacja Turcji wynosi 80 milionów osób, z czego 36 milionów są aktywnymi użytkownikami internetu. Właśnie dlatego ten kraj okazał się tak atrakcyjny dla Yandexa.
W momencie wejścia spółki na rynek zagraniczny istniał poważny problem w postaci bariery językowej. Jednak Yandex zdecydował, że jest w stanie osiągnąć sukces na tureckim rynku, a w przyszłości będzie mógł poszerzyć zakres swojej działalności na rynkach innych państw. I to nawet bez względu na różnice językowe i kulturowo-historyczne. Taka decyzja stała się sprawdzianem dla rosyjskiej wyszukiwarki-giganta oraz wyzwaniem dla zagranicznych konkurentów.
Wchodząc na rynek Turcji najbliższy konkurent Yandexa – Google – trzymał się standardowej strategii, nie starając się dostosować do jakichkolwiek cech językowych regionu. To było istotnym błędem ze strony wyszukiwarki. Szczególne trudności w korzystaniu z Google mieli użytkownicy języków ałtajskich, którzy musieli używać do wprowadzania zapytań dostosowaną wersję alfabetu łacińskiego. Ten problem nie ominął również użytkowników z Turcji: oficjalny język kraju należy do turkijskiej gałęzi hipotetycznej rodziny języków ałtajskich.
Jednak tureccy użytkownicy Google z czasem przyzwyczaili się do korzystania z wyszukiwarki. Na dzień dzisiejszy oni nawet wypracowali pewne nawyki w pracy z wyszukiwarką. Jednak oprócz tego, że różne języki mają różne systemy zapisu, cechy osobliwe każdego języka wymagają od wyszukiwarek znacznie inteligentniejszego podejścia do analizy i przekazywania informacji. Szczególnie, gdy przy wyszukiwaniu określonych zapytań należy uwzględnić specyfikę piśmiennictwa.
Często podczas przetwarzania informacji w wielu językach pojawiają sie błędy i rozbieżności. Współczesny alfabet turecki jest odmianą alfabetu łacińskiego. Składa się z 29 liter, w tym ma takie specyficzne symbole, jak: Ç, Ğ, ı, İ, Ş, i Ü. Ciekawy fakt: przy wpisywaniu zapytania większość tureckich użytkowników internetu popełnia błędy właśnie w trakcie wpisywania tych liter na klawiaturze.
Większość osób woli wpisywać te litery bez użycia znaków diakrytycznych. Wynika to z chęci zaoszczędzenia czasu lub z używania klawiatury, nieprzystosowanej do tureckiego alfabetu. Niestety takie podejście i wynikające z niego literówki często prowadzą do błędów krytycznych, utraty sensu i błędnych wyników wyszukiwania. Używanie nieprawidłowych znaków górnych lub dolnych w nowoczesnym języku tureckim może doprowadzić do całkowitej zmiany sensu słowa.
Celem eksperymentu, opisanego w artykule, jest zrozumienie tego, czy Yandex potrafił pokonać tę barierę językową i na ile wyniki wyszukiwania, wyświetlane tureckim użytkownikom są dokładne.
Twarzą w twarz: Yandex kontra Google
Runda pierwsza
Aby sprawdzić dokładność automatycznych podpowiedzi, autorka tego artykułu wprowadziła do wyszukiwarek Yandex i Google zapytanie [Yasama] (co w tej postaci oznacza „ustawodawstwo”). Warto zauważyć, że po zamianie w słowie litery „s” na ş [Yaşama] znaczenie słowa się zmienia na „zamieszkanie”.
Po wpisaniu do wyszukiwarki Google zapytania [Yasama] automatycznie wyświetlane podpowiedzi nawiązywały do „ustawodawstwa”. Dodatkowych wyników nie było:
Po wpisaniu tego samego zapytania w wyszukiwarce Yandex lista automatycznych podpowiedzi jest bardziej rozbudowana i użytkownik ma więcej opcji i wyrazów do wybrania, [Yasama] lub [Yaşama]. Przy tym wyszukiwarka bierze pod uwagę wszystkie możliwe pisownie słowa w języku tureckim:
Na podstawie wyników pierwszej rundy Yandex wygrywa 1 do 0.
Runda druga
Następnie warto porównać liczbę zapytań użytkowników do wyszukiwarek na podstawie wspomnianych słów oraz wyrazów z użyciem tych słów. Jak można zauważyć, Yandex „wywalczył” swój udział zapytań właśnie ze względu na to, że system zapewnia użytkownikom automatyczne podpowiedzi dla wszystkich możliwych opcji pisowni wyrazu:
W celu zapewnienia jasności i czystości eksperymentu autorka artykułu wzięła pod uwagę dane z serwisu Yandex.Wordstat, który pokazuje statystyki zapytań użytkowników Yandex. Jak widać, w tureckiej wersji wyszukiwarki Yandex.Wordstat nie rozróżnia semantyki słów, odbierając je jako różne warianty pisowni tego samego słowa.
W tym samym czasie „Planer słów kluczowych” Google Adwords rozróżnia zachowania użytkowników w procesie wyszukiwania informacji związanych z takimi zapytaniami. Zapytanie [Yaşama] w znaczeniu „zamieszkanie” nie jest zbyt popularne w przypadkach, gdy słowo jest używane w wyszukiwarce oddzielnie od innych słów kluczowych. Google to rozumie. Niemniej jednak, czasownik [mieszkać/ zamieszkać] jest wspominany przez użytkowników w różnych kontekstach znacznie częściej niż połączenie [stanowić prawo].
Ważne jest również zauważyć, że Yandex w tej chwili nie jest jeszcze na tyle popularny, jak Google, udział jego wyszukiwarki na terenie kraju wynosi około 5%. Dlatego przy porównywaniu liczby przetwarzanych przez wyszukiwarki zapytań mogą wystąpić niewielkie rozbieżności i niezgodności. Niemniej jednak, nawet takie obliczenia warunkowe pozwalają ocenić stopień popularności wyszukiwarek wśród użytkowników internetu.
W ten sposób wynik drugiej rundy jest 1 do 1.
Runda trzecia
Powszechnie wiadomo, że język turecki kryje w sobie ogromną ilość pułapek i trudności lingwistycznych. Struktura języka tureckiego jest skomplikowana pod względem morfologii. Język ten jest aglutynacyjny, a słowa w nim powstają za pomocą „sklejania”. Każdy formant w języku tureckim zawiera jednocześnie kilka nierozłącznych wartości. Słowa są tworzone poprzez połączenie fonetycznie afiksów niezmiennych i innych morfem. Ponadto, w języku tureckim jeden czasownik może mieć tysiące koniugacji.
W poniższej tabeli pokazano, w jaki sposób w języku tureckim są tworzone różne formy czasownika:
Wiedza o strukturze języka tureckiego prowadzi do trzeciego etapu analizy porównawczej wyszukiwarek Yandex i Google. Ona pozwalają prześledzić, na ile oba systemy są w stanie jakościowo przetworzyć zapytania, w których wykorzystywane są różne formy czasowników.
Wyobraźmy sobie, że jakaś osoba zamierza odwiedzić Stambuł. Przygotowując się do podróży, użytkownik posługujący się językiem tureckim wprowadza do wyszukiwarki Google zapytanie [İstanbul’a gidiyoruz] („Wybieramy się do Stambułu”). Jak widać na zrzucie ekranu, na pierwszych miejscach w wynikach wyszukiwania okazują się te wyniki, w których czasownik jest używany w tej samej formie, co w zapytaniu. Dopiero na drugiej i trzeciej stronie wyników widzimy linki do stron, zawierających zmodyfikowane formy czasownika, które są tworzone poprzez dodanie przyrostka. Często właśnie obecność różnorodnych form czasownika w SERP powoduje, że wyniki wyszukiwania są bardziej dokładne i różnorodne.
Po wprowadzeniu takiego zapytania w wyszukiwarce Yandex autorka artykułu odkryła już na pierwszej stronie wyników wyszukiwania wiele różnych form czasownika, takich jak: [İstanbul’a nasıl gidilir] („Jak dojechać do Stambułu”), [İstanbul’a gidince İstanbul’dan пе alınır] („Co kupić będąc w Stambule”), itp.
Jak można zauważyć, baza językowa Yandexa okazała się bardzo duża, w wyniku czego na rynku Turcji Yandexowi przyznano status inteligentnej wyszukiwarki.
Na podstawie wyników trzeciej rundy prowadzi Yandex: 2 do 1.
Runda czwarta
Na ostatnim etapie testów postanowiono sprawdzić obie wyszukiwarki na zdolność do wykrywania równocześnie kilku znaczeń synonimicznych tej samej frazy. Tym razem w wyszukiwarki wpisano zapytanie [ağır kaldırabilenler].
Ta fraza ma kilka znaczeń:
1. Osoba, która jest w stanie podnosić ciężary (to jest bezpośrednie i najbardziej rozpowszechnione znaczenie wyrażenia).
2. Osoba, która jest zdolna do przezwyciężenia trudności (przenośne znaczenie wyrażenia).
3. Przedmiot, który może pomieścić w sobie więcej, niż pozwala na to jego rzeczywista pojemność (stosuje się dość rzadko).
Umiejętność rozpoznawania pierwotnego znaczenia wyrażenia świadczy o czystości i dokładności wyników wyszukiwania.
Wyniki wyszukiwania wykazały, że Yandex rozpoznaje i analizuje zdecydowanie większą liczbę znaczeń, niż Google. W wynikach rosyjskiej wyszukiwarki częściej można znaleźć znacznie więcej form tego samego słowa, utworzonych za pomocą przyłączenia różnych morfemów. Na pierwszych 30 stronach wyszukiwania Yandex autorka artykułu nie znalazła wtórnych znaczeń słowa.
Podobny eksperyment z Google wykazał w wynikach wyszukiwania obecność różnych form wyrazowych. Jednak tylko 4 na 10 najlepszych wyników wyszukiwania były związane z podstawowym pierwotnym znaczeniem zapytania. Pozostałe wyniki odnoszą się w większym stopniu do wtórnych znaczeń słów użytych przy wpisywaniu zapytania.
Pomimo faktu, że wyniki wyszukiwania Google charakteryzują się większą różnorodnością w porównaniu do wyników Yandex, wyniki wyszukiwania w Google były mniej trafne w stosunku do zapytania, niż wyniki wyszukiwania w Yandex.
Pod koniec czwartej rundy wynik jest 3 do 1 na korzyść Yandexa.
Czy Yandex będzie mógł osiągnąć zamierzonego celu?
Wyniki eksperymentu pozwalają stwierdzić, że Yandex znacznie lepiej rozumie i rozpoznaje strukturę słów w języku tureckim, niż Google. Jednak nie jest to jedyną zaletą wyszukiwarki: Yandex również dobrze rozpoznaje wyrazy zawierające znaki diakrytyczne i umie odróżnić je od podobnych słów składających się ze liter alfabetu łacińskiego. Takie podejście zapewnia maksymalną kompletność i prawidłowość wyników wyszukiwania. Poza faktem, że Yandex pozwala tureckim użytkownikom znaleźć odpowiednie wyniki, on również wyświetla ogromną liczbę wyników, które zawierają różne formy tego samego słowa. Często użytkownik musi przewinąć kilka stron z wynikami wyszukiwania, aby znaleźć potrzebną informację.
Dla porównania, Google oferuje swoim użytkownikom znacznie mniejszą liczbę wyników wyszukiwania. Wyniki te są mniej różnorodne i zawierają mniej form wyrazowych. Zazwyczaj w wynikach występują sformułowania, zawierające dokładny ciąg słów kluczowych. Zmusza to użytkownika do kilkukrotnego ponownego sformułowania zapytania w celu znalezienia pożądanej informacji.
W sumie Yandex ma wszelkie predyspozycje do tego, aby w najbliższej przyszłości osiągnąć sukces na rynku tureckim. W dniu 84-lecia reformy języka tureckiego Yandex wykazał swój szacunek do piśmiennictwa kraju, usuwając z nazwy wyszukiwarki nietypowy dla języka tureckiego znak „X”. Logo firmy pojawiło się na głównej stronie wyszukiwarki w następującej formie pisemnej: Yandeks.
Rosyjska spółka robi duże postępy w zaspokajaniu potrzeb nosicieli języka tureckiego, pozycjonując się w tym regionie jako wyszukiwarka dwujęzyczna. Potencjalnie Yandex ma wszelkie szanse, aby zająć w regionie stabilną pozycję, a nawet zdobyć znaczący udział w rynku. Jednak pozostaje pytanie, na ile łaskawy będzie dla wyszukiwarki rynek lokalny i czy zareaguje pozytywnie na obecność na nim rosyjskiej spółki.
Tłumaczenie: www.konstantinkanin.com