Címlapon

12_wordpress_420
Forrás: -

A keresés jövője

A keresés legalább annyira megváltoztatta az internet használatát, mint amekkora befolyása volt (van) az internetnek az egész világra. Ezért a keresés továbbfejlődésére még akkor is érdemes figyelni, ha az it néhány éve kikerült a „nagyközönség” figyelmének középpontjából.

Két óriási ötlet kellett a keresés megszületéséhez: az internet tartalmának felindexelése – ezt a DEC Altavista nevű őskeresője tette meg –, a másik meg a találatok sorba állítása. Ez utóbbi volt a Page rank egyrészt az oldal-rangsor szókapcsolat, másrészt a megalkotó, Larry Page neve miatt.

A DEC, a világ egyik leghíresebb és legnagyobb nagygép-gyártója ma már nem létezik, Larry Page pedig, ha valaki nem tudná, a Google alapító-tulajdonosa és ügyvezető igazgatója. Az Altavista keresőből lett a Yahoo! keresőgépe, amelyet ma már a Microsoft Bing motorja hajt. A keresőpiacot ma az jellemzi, hogy a Google-ön kívüli összes szolgáltatásnak együttvéve kisebb a részesedés, mint a Google részesedésének fele.

 


 

 

A Moore-motor

Még legalább tíz évig érvényes lesz a Moore-törvény: a számítógépek teljesítménye másfél-kétévente megkétszereződik: 2022-ben tehát a harminckétszerese lesz a mainak. Ez a növekedés a hajtómotorja egyrészt a kezelendő adatok szaporodásának, másrészt a hálózati sávszélesség növekedésének.

A mennyiségi növekedés pedig időnként minőségi ugrásokat eredményez, általában felfelé, néha pedig lefelé… A legközelebbi jövőben a legkülönfélébb dolgok válnak majd intelligenssé a beléjük épített számítógépek erősödésével, egészen bizonyosan a keresés is okosodni fog. Egyébként rendkívül tanulságos, hogy a keresők mennyire okosnak tűnnek csak attól, hogy a keresőkifejezésben foglalt szavak együttes előfordulásait megtalálják. Ettől ugyanis releváns találatokat hoznak az élő nyelvű, kérdő mondatokra – amelyek az angol nyelvben ragozatlan szavakból állnak össze.

 

Google-válaszok

Amit Singhal, a Google keresésért felelős alelnöke válaszolt néhány kérdésünkre. Arra, hogy a Google hogyan viszonyul a Facebookon fellelhető tartalomhoz, megismételte a hivatalos álláspontot: „Ami nyilvánosan elérhető, azt a Google megtalálja. Vannak webhelyek, amelyekhez a Google nem fér hozzá.” Nos, bárki üzenőfala csak a Facebook-ba jelszóval történő bejelentkezés után látható, tehát a posztokat és kommenteket nem fogja a Google megtalálni.

Sokkal érdekesebb, amit a közeljövőről gondol Amit Singhal. Szerinte öt éven belül meg fog változni a személyes viszonyunk a számítógépekkel. Összeér a felhő, az érintőképernyő, a beszédfelismerés, a „big data” és még néhány, ma már látható fejlesztés. A zsebünkben levő készülék betű szerint számítógépek ezreivel kapcsol össze, aminek bizonyosan lesz néhány mélyreható következménye. Az alelnök nem bánná, ha például a határidőnaplója szerényen figyelmeztetné: „Most van egy szabad órád, nem vennél valami játékot a fiadnak?” Vagyis hogy a felhő, amin ezúttal a számítógéprendszernek éppen az adott használóhoz köthető intelligenciáját kell érteni, a használó gyengéd segítőjeként működik majd – a lehető legtágabb értelemben.

Reméljük, a Google kitart a „Don’t be evil” (ne légy gonosz) alapfilozófia mellett, és ez a gyengéd segítőkészség nem segíti túlzottan bizonyos termékek értékesítését.

 

A Google szent képlete

rank = qs x max_cpc

ahol:

rank: az adott hirdetés rangsora a találatlista feletti vagy melletti hirdetéslistában való megjelenéshez

qs: quality score, az adott hirdetés Google által meghatározott minőségi jellemzője

cpc: cost per click, egy kattintásért fizetett díj

max_cpc: ennek maximuma, amit a hirdető határoz meg.

A qs jellemzőt a Google adja – és nem tudható pontosan, hogyan számolja. Ahogy a találatok rangsorolása is a titkos receptek közé tartozik. Nem a hirdető szabja meg, értékes-e a hirdetése. Hogy is tehetné, hiszen a „tulipán” keresőkifejezés esetében a „napraforgó” hirdetés értéktelen, viszont a „szotyola” keresőkifejezésnél releváns. Legfontosabb komponense az átkattintási arány (click through rate, ctr). Beleszámít ezenfelül a qs-be a hirdetés szövege, a céloldal (landing page) kivitele, szövege és relevanciája (szerepel-e benne-rajta a keresőkifejezés vagy ahhoz hasonló) – és sok minden más.

A magyar üzlet

Vadász Illéssel, a Google Magyarország stratégiai elemzőjével beszélgettünk a keresőhirdetés itteni alakulásáról. Magyarországon gyorsabban nő a keresések száma, mint az internet-ellátottság. Komplex jelenség ez, mert a vezetékes internetet használók száma lassan nő, a mobilinternetezőké meg rendkívül gyorsan. Utóbbiak keresési szokásai egészen mások, mint az „asztali” keresőké.

Számtalan tényező befolyásolja, mi fog történni a hirdetéssel, mi lesz a hatása. Ezt a bonyolultságot nem a Google okozza, hanem a keresőhirdetés mondhatni antropológiai (az emberi természet és viselkedés által meghatározott) működése. Gondoljunk bele: mi késztet bárkit arra, hogy rákeressen a „spenótos garnéla” kifejezésre – ha nem tudja, hogy ez az étel létezik, és szeretne hozzájutni. Nincs mindenkinek térlátása sem, a bonyolult összefüggések felfogása is lehet genetikusan meghatározott. De amaz is és ez is elég jól fejleszthető…

A hirdetőnek meg kell határoznia, milyen keresőkifejezésekre adott találatlista mellett jelenjen meg a hirdetése. Az egyszerű kifejezések nem csak az ő termékének a hirdetését fogják felhozni, amelyek között elvész az övé. A bonyolultabb kifejezések meg senkinek nem fognak eszébe jutni… Itt az a filozófiai mélységű alapszabály érvényesül, hogy a termékünket meg kell különböztetni. Rántott húst mindenki kínál, no de medvehagymás panírral? Vagy frissen, 3 perc alatt? Vagy minél nagyobb, annál olcsóbb?

 

Bonyolult, mint a térlátás

Vadász Illés a hirdetésüzlet legfőbb kihívásának az említette, hogy a hirdetők számára – a tv-ben vagy óriásplakátokon való reklámozáshoz képest – a keresőhirdetés jóval összetettebb folyamat. Az internetes technológiákban amúgy is meglehetősen járatlan hazai kisvállalkozásoktól szemléletváltást követel ez az új fajta marketing, mindenekelőtt azt, hogy tudjanak élni a beállítási lehetőségek sokaságával. Vannak egyébként sikertörténetek is, amelyek szereplői gyakran olyan fiatal vállalkozók, akik egyrészt már az anyatejhez is széles sávon jutottak hozzá, másrészt kreatívan tudták kihasználni a róluk már meglévő előképet a célrétegben.

A Google már dolgozik a bonyolultság leküzdésén. Amerikában bétatesztelik az AdWords dinamikus keresőhirdetés-kiegészítését, amely automatizálja a kulcsszavak meghatározását: ha a használó megadja a „landing page”-t, akkor abból a szoftver „kivonja” a kulcsszavakat, sőt összeállítja magát a keresőhirdetést. (Landing page: ahova a látogató jut, ha a keresőhirdetésre kattint. – a szerk.) Az eddigi tapasztalatok (a nem ragozó angol nyelvterületen…) jók, annak ellenére, hogy a hirdetések nem mindig teljesen értelmesek. Ha a használó módosítja a weboldalát, akkor automatikusan megváltozhatnak a kulcsszavak is. „A keresőhirdetés az érdeklődőket hozza, de az üzlethez jó »landing page« is kell.” – tanítja Vadász Illés. Azt kell tehát olyanra alakítani, hogy a látogató maradjon, sőt, ha lehet, vásároljon.

 

Bing-vallomás

Nos, én nem használom a Microsoft Bing keresőjét. Most, e cikk írásával kapcsolatban természetesen kipróbáltam, ahogy akkor is, amikor megjelent. Kétségtelen, hogy működik, méghozzá jól: releváns szöveges és képtalálatokat hoz. De.

Ahogy a Google-ból szinte ki sem lehet irtani a magyar vonzást (akkor is magyar találatokat hoz, amikor nem azokra lenne szükség, egyre több külföldi oldalra tesz be magyar reklámokat stb.), úgy a Bing egyáltalán nem „magyaros”. Magyar keresőkifejezésre persze magyar találatokat ad, nincsenek benne reklámok. Nemhogy magyarok, semmilyenek. Igen, persze, ennek is lehet örülni, de paradox módon a Google szöveges apróhirdetésecskéit megszoktam. Kötődnek az aktuális kereséshez, többször rájuk kattintottam már – mert érdekelt, mint kínálnak. Igen, ebből él – a Google.

Valamiért a Microsoftnak nem kell a magyar hirdető. Abszolút érthető, hogy a piac méretével arányos befektetéseket tesz – mint például az Apple…

Ki kell használni ezt a tulajdonságot. Ha külföldi találatokra vágyunk, használjuk a Binget. Képkeresésben is ugyanolyan jó, mint a Google. És nem, nem gyűjti a keresési szokásainkat (vagy nem vettem észre, mert rövid ideig használtam?), amivel, megint paradox módon, a nyílt forrású, önkéntesen fejlesztett és üzemeltetett, hangsúlyozottan személyiadat-védő DuckDuckGo keresőnek tesz alá, mert annál azért jobb: gyorsabb, szebb, képeket és híreket is keres.

Nincsenek online alkalmazások. Illetve vannak – de azok fizetősek: az Office 365-ról van szó, ugye. Nyilván az összes online Microsoft-alkalmazás keresési szolgáltatásait a Bing-motor nyújtja majd, beleértve például a Skype-ot is – most már. Úgyhogy a Bing jövője biztosított, a Microsoft vadiúj, Surface nevű tabletjének felhő alapú alkalmazásaiba építve is. Előbb-utóbb biztos kicsit jobban fog tudni magyarul is.

 


 

 

Nagy vállalatok saját keresője

Már régebb óta léteznek tudásmenedzsment-termékek a Montanánál Infovadász néven. A magyar termékcsaládot egy nagy nemzetközi tudásmenedzsment-rendszerre építették fel. Az egyik legnagyobb referenciájuk a 2009 nyara óta működő Rendőrségi Szövegbányász Rendszer. Apró Antal, a Montana tudásmenedzsment üzletágának vezetője szerint a keresőtechnológiák előtt álló legnagyobb kihívás, hogy a használók minél kevesebb kiinduló adatból egyre relevánsabb találatokat követelnek. Ezért sokkal könnyebb, ha nem az emberiség teljes tudásanyagából kell keresni, hanem valamilyen szakmai részterület fogalom- és szabálytárárból. Vagy egy cég dokumentumkészletéből.

Apró Antal szerint az adatbevitel manapság már nem probléma, akár örökölt, hagyományos nyomtatott dokumentum vagy azok intelligens beszkenneléséből, akár élőbeszéd szöveges dokumentummá alakításából származzanak. A feldolgozás, az értelmes szabályrendszer felállítása és a meghatározott alkalmazási környezethez hangolása jelenti a kihívást.

Az Infovadász technológiáját a Montana alkalmazásával, a Naprakész témafigyelő szolgáltatásán át lehet megtapasztalni.

 

A mi keresőnk

Nem titok, hogy az itbusiness.hu portál keresőszolgáltatásait a WebLib programozta. A megoldás az Apache Solr nevű, nyílt forrású alapkomponensre épül, amelyet nyelvészeti eszközök és saját fejlesztésű modulok egészítenek ki. Mint Kása Károly fejlesztési igazgató az előnyökről és a hátrányokról elmondta: „a WebLib akkor előnyös, amikor nem sablonmegoldás, a keresés letudása a cél, hanem igazán értő, a kereső szándékára intelligensen reagáló szolgáltatás az igény. Ebben segítenek számítógépes nyelvész és programozó matematikus szakértőink. Hátrányunk pedig, hogy nincs pár perc alatt összekattintható, dobozos megoldásunk. Az ügyféllel együtt dolgozva, az optimálisan testre szabott megoldás bevezetése erőfeszítést igényel.”

Intelligens keresőrendszer kiépítésének legösszetettebb része az adott szakterületet feldolgozó szakszótár létrehozása jelenti. Ez a Google Knowledge Graph-jához hasonló, de szűkebb tématerületet lefedő kifejezéshálót takar. A WebLib több ilyet épített, energetika, egészségügy és álláskeresés témakörökben. Adatbegyűjtésre az Infoharvester nevű terméküket alkalmazzák, amely strukturált és strukturálatlan adatok begyűjtésére is alkalmas, a feldolgozást és tárolást modern, elosztott (Hadoop) hardverháttérrel végzi.

„Arra törekszünk, hogy a begyűjtésből és a keresésekből előálló adathalmazból nyert információ visszaforgatásával versenyképesebbé tegyük ügyfeleink működését. A strukturálatlan adatok nyelvi elemzésével olyan összefüggések tárhatók fel, amelyek korábban rejtve maradtak” – körvonalazta a jövőt Kása Károly.