Két óriási ötlet kellett a keresés megszületéséhez: az internet tartalmának felindexelése
– ezt a DEC Altavista nevű őskeresője tette meg –, a másik meg a találatok sorba
állítása. Ez utóbbi volt a Page rank egyrészt az oldal-rangsor szókapcsolat, másrészt
a megalkotó, Larry Page neve miatt.
A DEC, a világ egyik leghíresebb és legnagyobb nagygép-gyártója ma már nem létezik,
Larry Page pedig, ha valaki nem tudná, a Google alapító-tulajdonosa és ügyvezető
igazgatója. Az Altavista keresőből lett a Yahoo! keresőgépe, amelyet ma már a
Microsoft Bing motorja hajt. A keresőpiacot ma az jellemzi, hogy a Google-ön kívüli
összes szolgáltatásnak együttvéve kisebb a részesedés, mint a Google részesedésének
fele.
A Moore-motor
Még legalább tíz évig érvényes lesz a Moore-törvény: a számítógépek teljesítménye
másfél-kétévente megkétszereződik: 2022-ben tehát a harminckétszerese lesz a mainak.
Ez a növekedés a hajtómotorja egyrészt a kezelendő adatok szaporodásának, másrészt
a hálózati sávszélesség növekedésének.
A mennyiségi növekedés pedig időnként minőségi ugrásokat eredményez, általában
felfelé, néha pedig lefelé… A legközelebbi jövőben a legkülönfélébb dolgok válnak
majd intelligenssé a beléjük épített számítógépek erősödésével, egészen bizonyosan
a keresés is okosodni fog. Egyébként rendkívül tanulságos, hogy a keresők mennyire
okosnak tűnnek csak attól, hogy a keresőkifejezésben foglalt szavak együttes előfordulásait
megtalálják. Ettől ugyanis releváns találatokat hoznak az élő nyelvű, kérdő mondatokra
– amelyek az angol nyelvben ragozatlan szavakból állnak össze.
Google-válaszok
Amit Singhal, a Google keresésért felelős alelnöke válaszolt néhány kérdésünkre. Arra, hogy
a Google hogyan viszonyul a Facebookon fellelhető tartalomhoz, megismételte a
hivatalos álláspontot: „Ami nyilvánosan elérhető, azt a Google megtalálja. Vannak
webhelyek, amelyekhez a Google nem fér hozzá.” Nos, bárki üzenőfala csak a Facebook-ba
jelszóval történő bejelentkezés után látható, tehát a posztokat és kommenteket
nem fogja a Google megtalálni.
Sokkal érdekesebb, amit a közeljövőről gondol Amit Singhal. Szerinte öt éven
belül meg fog változni a személyes viszonyunk a számítógépekkel. Összeér a felhő,
az érintőképernyő, a beszédfelismerés, a „big data” és még néhány, ma már látható
fejlesztés. A zsebünkben levő készülék betű szerint számítógépek ezreivel kapcsol
össze, aminek bizonyosan lesz néhány mélyreható következménye. Az alelnök nem
bánná, ha például a határidőnaplója szerényen figyelmeztetné: „Most van egy szabad
órád, nem vennél valami játékot a fiadnak?” Vagyis hogy a felhő, amin ezúttal
a számítógéprendszernek éppen az adott használóhoz köthető intelligenciáját kell
érteni, a használó gyengéd segítőjeként működik majd – a lehető legtágabb értelemben.
Reméljük, a Google kitart a „Don’t be evil” (ne légy gonosz) alapfilozófia mellett,
és ez a gyengéd segítőkészség nem segíti túlzottan bizonyos termékek értékesítését.
A Google szent képlete |
---|
rank = qs x max_cpc
ahol:
rank: az adott hirdetés rangsora a találatlista feletti vagy melletti hirdetéslistában
való megjelenéshez
qs: quality score, az adott hirdetés Google által meghatározott minőségi jellemzője
cpc: cost per click, egy kattintásért fizetett díj
max_cpc: ennek maximuma, amit a hirdető határoz meg.
A qs jellemzőt a Google adja – és nem tudható pontosan, hogyan számolja. Ahogy
a találatok rangsorolása is a titkos receptek közé tartozik. Nem a hirdető szabja
meg, értékes-e a hirdetése. Hogy is tehetné, hiszen a „tulipán” keresőkifejezés
esetében a „napraforgó” hirdetés értéktelen, viszont a „szotyola” keresőkifejezésnél
releváns. Legfontosabb komponense az átkattintási arány (click through rate, ctr).
Beleszámít ezenfelül a qs-be a hirdetés szövege, a céloldal (landing page) kivitele,
szövege és relevanciája (szerepel-e benne-rajta a keresőkifejezés vagy ahhoz hasonló)
– és sok minden más. |
A magyar üzlet
Vadász Illéssel, a Google Magyarország stratégiai elemzőjével beszélgettünk a keresőhirdetés
itteni alakulásáról. Magyarországon gyorsabban nő a keresések száma, mint az internet-ellátottság.
Komplex jelenség ez, mert a vezetékes internetet használók száma lassan nő, a
mobilinternetezőké meg rendkívül gyorsan. Utóbbiak keresési szokásai egészen mások,
mint az „asztali” keresőké.
Számtalan tényező befolyásolja, mi fog történni a hirdetéssel, mi lesz a hatása.
Ezt a bonyolultságot nem a Google okozza, hanem a keresőhirdetés mondhatni antropológiai
(az emberi természet és viselkedés által meghatározott) működése. Gondoljunk bele:
mi késztet bárkit arra, hogy rákeressen a „spenótos garnéla” kifejezésre – ha
nem tudja, hogy ez az étel létezik, és szeretne hozzájutni. Nincs mindenkinek
térlátása sem, a bonyolult összefüggések felfogása is lehet genetikusan meghatározott.
De amaz is és ez is elég jól fejleszthető…
A hirdetőnek meg kell határoznia, milyen keresőkifejezésekre adott találatlista
mellett jelenjen meg a hirdetése. Az egyszerű kifejezések nem csak az ő termékének
a hirdetését fogják felhozni, amelyek között elvész az övé. A bonyolultabb kifejezések
meg senkinek nem fognak eszébe jutni… Itt az a filozófiai mélységű alapszabály
érvényesül, hogy a termékünket meg kell különböztetni. Rántott húst mindenki kínál,
no de medvehagymás panírral? Vagy frissen, 3 perc alatt? Vagy minél nagyobb, annál
olcsóbb?
Bonyolult, mint a térlátás
Vadász Illés a hirdetésüzlet legfőbb kihívásának az említette, hogy a hirdetők
számára – a tv-ben vagy óriásplakátokon való reklámozáshoz képest – a keresőhirdetés
jóval összetettebb folyamat. Az internetes technológiákban amúgy is meglehetősen
járatlan hazai kisvállalkozásoktól szemléletváltást követel ez az új fajta marketing,
mindenekelőtt azt, hogy tudjanak élni a beállítási lehetőségek sokaságával. Vannak
egyébként sikertörténetek is, amelyek szereplői gyakran olyan fiatal vállalkozók,
akik egyrészt már az anyatejhez is széles sávon jutottak hozzá, másrészt kreatívan
tudták kihasználni a róluk már meglévő előképet a célrétegben.
A Google már dolgozik a bonyolultság leküzdésén. Amerikában bétatesztelik az
AdWords dinamikus keresőhirdetés-kiegészítését, amely automatizálja a kulcsszavak
meghatározását: ha a használó megadja a „landing page”-t, akkor abból a szoftver
„kivonja” a kulcsszavakat, sőt összeállítja magát a keresőhirdetést. (Landing page: ahova a látogató jut, ha a keresőhirdetésre kattint. – a szerk.) Az eddigi tapasztalatok (a nem ragozó angol nyelvterületen…) jók, annak ellenére,
hogy a hirdetések nem mindig teljesen értelmesek. Ha a használó módosítja a weboldalát,
akkor automatikusan megváltozhatnak a kulcsszavak is. „A keresőhirdetés az érdeklődőket
hozza, de az üzlethez jó »landing page« is kell.” – tanítja Vadász Illés. Azt
kell tehát olyanra alakítani, hogy a látogató maradjon, sőt, ha lehet, vásároljon.
Bing-vallomás
Nos, én nem használom a Microsoft Bing keresőjét. Most, e cikk írásával kapcsolatban
természetesen kipróbáltam, ahogy akkor is, amikor megjelent. Kétségtelen, hogy
működik, méghozzá jól: releváns szöveges és képtalálatokat hoz. De.
Ahogy a Google-ból szinte ki sem lehet irtani a magyar vonzást (akkor is magyar
találatokat hoz, amikor nem azokra lenne szükség, egyre több külföldi oldalra
tesz be magyar reklámokat stb.), úgy a Bing egyáltalán nem „magyaros”. Magyar
keresőkifejezésre persze magyar találatokat ad, nincsenek benne reklámok. Nemhogy
magyarok, semmilyenek. Igen, persze, ennek is lehet örülni, de paradox módon a
Google szöveges apróhirdetésecskéit megszoktam. Kötődnek az aktuális kereséshez,
többször rájuk kattintottam már – mert érdekelt, mint kínálnak. Igen, ebből él
– a Google.
Valamiért a Microsoftnak nem kell a magyar hirdető. Abszolút érthető, hogy a
piac méretével arányos befektetéseket tesz – mint például az Apple…
Ki kell használni ezt a tulajdonságot. Ha külföldi találatokra vágyunk, használjuk
a Binget. Képkeresésben is ugyanolyan jó, mint a Google. És nem, nem gyűjti a
keresési szokásainkat (vagy nem vettem észre, mert rövid ideig használtam?), amivel,
megint paradox módon, a nyílt forrású, önkéntesen fejlesztett és üzemeltetett,
hangsúlyozottan személyiadat-védő DuckDuckGo keresőnek tesz alá, mert annál azért
jobb: gyorsabb, szebb, képeket és híreket is keres.
Nincsenek online alkalmazások. Illetve vannak – de azok fizetősek: az Office
365-ról van szó, ugye. Nyilván az összes online Microsoft-alkalmazás keresési
szolgáltatásait a Bing-motor nyújtja majd, beleértve például a Skype-ot is – most
már. Úgyhogy a Bing jövője biztosított, a Microsoft vadiúj, Surface nevű tabletjének
felhő alapú alkalmazásaiba építve is. Előbb-utóbb biztos kicsit jobban fog tudni
magyarul is.
Nagy vállalatok saját keresője
Már régebb óta léteznek tudásmenedzsment-termékek a Montanánál Infovadász néven.
A magyar termékcsaládot egy nagy nemzetközi tudásmenedzsment-rendszerre építették
fel. Az egyik legnagyobb referenciájuk a 2009 nyara óta működő Rendőrségi Szövegbányász
Rendszer. Apró Antal, a Montana tudásmenedzsment üzletágának vezetője szerint a keresőtechnológiák
előtt álló legnagyobb kihívás, hogy a használók minél kevesebb kiinduló adatból
egyre relevánsabb találatokat követelnek. Ezért sokkal könnyebb, ha nem az emberiség
teljes tudásanyagából kell keresni, hanem valamilyen szakmai részterület fogalom-
és szabálytárárból. Vagy egy cég dokumentumkészletéből.
Apró Antal szerint az adatbevitel manapság már nem probléma, akár örökölt, hagyományos
nyomtatott dokumentum vagy azok intelligens beszkenneléséből, akár élőbeszéd szöveges
dokumentummá alakításából származzanak. A feldolgozás, az értelmes szabályrendszer
felállítása és a meghatározott alkalmazási környezethez hangolása jelenti a kihívást.
Az Infovadász technológiáját a Montana alkalmazásával, a Naprakész témafigyelő
szolgáltatásán át lehet megtapasztalni.
A mi keresőnk
Nem titok, hogy az itbusiness.hu portál keresőszolgáltatásait a WebLib programozta.
A megoldás az Apache Solr nevű, nyílt forrású alapkomponensre épül, amelyet nyelvészeti
eszközök és saját fejlesztésű modulok egészítenek ki. Mint Kása Károly fejlesztési igazgató az előnyökről és a hátrányokról elmondta: „a WebLib akkor
előnyös, amikor nem sablonmegoldás, a keresés letudása a cél, hanem igazán értő,
a kereső szándékára intelligensen reagáló szolgáltatás az igény. Ebben segítenek
számítógépes nyelvész és programozó matematikus szakértőink. Hátrányunk pedig,
hogy nincs pár perc alatt összekattintható, dobozos megoldásunk. Az ügyféllel
együtt dolgozva, az optimálisan testre szabott megoldás bevezetése erőfeszítést
igényel.”
Intelligens keresőrendszer kiépítésének legösszetettebb része az adott szakterületet
feldolgozó szakszótár létrehozása jelenti. Ez a Google Knowledge Graph-jához hasonló,
de szűkebb tématerületet lefedő kifejezéshálót takar. A WebLib több ilyet épített,
energetika, egészségügy és álláskeresés témakörökben. Adatbegyűjtésre az Infoharvester
nevű terméküket alkalmazzák, amely strukturált és strukturálatlan adatok begyűjtésére
is alkalmas, a feldolgozást és tárolást modern, elosztott (Hadoop) hardverháttérrel
végzi.
„Arra törekszünk, hogy a begyűjtésből és a keresésekből előálló adathalmazból
nyert információ visszaforgatásával versenyképesebbé tegyük ügyfeleink működését.
A strukturálatlan adatok nyelvi elemzésével olyan összefüggések tárhatók fel,
amelyek korábban rejtve maradtak” – körvonalazta a jövőt Kása Károly.