Utánajártunk

38_The_Next_Web.jpg
Forrás: ITB
Kis országnak kis adat

Big boom előtt kettővel a magyar adat

A meghatározás szerinti big data-projektek a hazai piac éretlensége miatt egyelőre hiányoznak itthonról. De ha a meghatározás szellemét vesszük figyelembe, akkor rengeteg az olyan projekt, amely meglepő eredményekkel kecsegtet(ne).

Megbecsülni sem meri senki, mennyi adat keletkezik naponta. A szakértők abban egyetértenek, hogy 2017 során nagyjából annyi adat keletkezhet, amennyit eddig az emberek 5000 éves történelmük során előállítottak. Ezeknek az adatoknak azonban kevesebb mint 0,5 százalékát elemezzük üzleti döntések meghozatala céljából.

Legutóbb az IBM 2014-ben írt le egy emberi ésszel felfoghatatlannak tűnő számot: 2,5 milliárd gigabájtnyi adattal lesz gazdagabb az emberiség 24 óra leforgása alatt. De végső soron nem is az adat mérete számít, hanem az, hogy mire, hogyan használják fel őket.

 

Elvétve találni magyar projekteket

Az IDC Hungary meghatározása szerint Magyarországon elvétve találni big data-projekteket – mondja Bakk József, a vállalat szoftverpiaci elemzője. Az is rontja a helyzetet, hogy a fejekben még káosz uralkodik, ami a big datát illeti. A szakértő szerint az a tény, hogy cégen belül sok adat létezik (bár gyakori, hogy tévesen mérik fel az adatmennyiséget), nem feltétlenül jelent big data-projektet, az adat mennyisége csak részben definiálja a big datát. Az üzleti analitikával is gyakran összemossák a hasonló projekteket. Létezik átfedés a két szegmens között, de gyakori, hogy a big data-projektek nem üzleti analitikáról szólnak, vagy fordítva, az üzleti analitika nem jelent big data-projektet.

A szakma a több „V-s meghatározást” fogalmazott meg, az IDC ebből a 4 V-t vallja, vagyis a big datás projekteket a volume (mennyiség), velocity (sebesség), value (érték) és a variety (változatosság) jellemzi. Az ilyen projektekben legalább 100 TB-nyi adatot kezelnek, ezek 60 Gbájt/s sebességgel érkeznek a szervezetbe, üzletileg kritikus adatokat jelentenek és több forrásból származnak. A Gartner klasszikus meghatározása szerint a big data nagy mennyiségű és sebességű információs vagyont jelent, melyet a döntéshozatalhoz, újszerű látásmódhoz költséghatékonyan és innovatív módon dolgoznak fel. Ezeknek az alapkritériumoknak még nagyon kevés hazai projekt felel meg.

Öröm az ürömben

Nem is baj, hogy egyelőre nincs sok big data-projekt Magyarországon, mert képzett szakemberek tekintetében elég rosszul állunk. A megnövekedett big datás feladatok kiszolgálására becslések szerint 10-12 ezer adattudósra lenne szükség. Biztató, hogy több hazai felsőfokú intézményben elindult már a big data-szakértő képzés, ugyanakkor a multinacionális cégek hamar elszipkázzák ezeket az embereket. A magyar cégeknek nehéz hasonló szakembereket találni – akik már a piacon vannak, azok megfizethetetlenek a kisebb cégek számára, de gondban vannak a meghatározott fizetésekkel zsönglőrködő állami szervezeteknél is. A megoldás a munkatársak belső képzése lenne, ahogyan az a cikkben említett Motimentnél is történt. Náluk azért ment könnyebben ez a feladat, mert a belső munkafázisaik jól szegmentáltak.

 

Nem a szabály a fontos

A Gartner úgy véli, hogy a big data és az elemzés nyitja meg az utat a vállalatok digitális transzformációja felé. Az adat, és az a mód, ahogyan azt a cégek elemzik, illetve ahogyan az elemzések következtetéseit a gyakorlatban hasznosítják, meghatározza a vállalatok együttműködését, versengését. Ebből szempontból nézve új korszakba léptünk be.

Az adatok mennyisége mellett Bakk József szerint az is hasonlóan fontos, hogy másfajta szemléletmódot, ökoszisztémát és eszközöket igényelnek a big data-projektek. Vagyis nem feltétlenül kell az adatok mennyiségéhez és sebességéhez ragaszkodni, ha az adatokon alapuló projekt üzleti értéket teremt.

Big data téren a nagy nemzetközi IT-cégek állnak az élen, hiszen nekik volt és van megfelelő erőforrásuk ezekre a projektekre kellő energiát fordítani.

 

Éretlen még a piac itthon

Hogy Magyarországon miért nincsenek igazi big datás projektek, azt Bakk József a hazai piac éretlenségével magyarázza. A mozgolódás azonban számottevő. Egyre több kis- és közepes méretű vállalat jön rá arra, hogy ez nem egy „nice to have” technológia, hanem olyan eszköz, amelynek muszáj lennie a cégen belül, hiszen versenyelőnyt, hatékonyságot, optimális működést jelent. A szakértő magyar vonatkozásban a távközlési szektorban látott olyan sikeres big data-projekteket, melyek már a pilotprogram végén megtérültek. Több iparágban (banki szféra, gyártás, mezőgazdaság, közlekedés, kereskedelem) is várható, hogy az IoT-eszközök elterjedése az adatmennyiség megnövekedését és az erre épített big datás fejlesztések sokasodását hozza. Pozitívumként említi a szakértő, hogy nagyon sok vállalat rövidtávú tervében szerepel már valamilyen big data-projekt elindítása.

 

Elemzés a kulcs

Öt-hat éve túl hypeolt szókapcsolat a big data Both András, a Lechner Tudásközpont infokommunikációs igazgatója szerint, aki úgy véli, ma már a big data analysis-ről, vagyis az elemzésről folyik a diskurzus. Meglátása szerint az áttörtést a big datával kapcsolatban a korábban szintén felkapott web 2.0 hozta meg. A web második generációja képes adatokat kérni, gyűjteni a felhasználóról, akár viselkedés alapján is, és néha a felhasználó akarata ellenére. Az internet szerkesztése a user kézébe került, így egyre több adat keletkezett, gyűlt össze. Nem meglepő módon az első igazi big data-projektek a pénzügyi szektorból érkeztek, ahol régóta minden elektronikusan folyik, majd a közösségi média lépett egy nagyot.

Nem piac, hanem hatás

A Gartner egy december végi webináriuma szerint a big data nem egy meghatározott piacra, hanem a meglévő technológiai piacokra gyakorol összetett hatást. Kimutathatóan növeli a költést az ellátási lánccal kapcsolatos technológiák, üzleti intelligencia, alkalmazás-infrastruktúra, adatintegráció, adatbázis-menedzsment, adattárolás-menedzsment, közösségi média és tartalomelemzés terén.

Both András úgy véli, sok projekt foglalkozik big datával Magyarországon, hiszen a nagy multinacionális cégek, de lassan az összes államigazgatási szereplő is indított adattárház beruházást. Az új IT-rendszerek elindítása után pedig mindenki rájön arra, hogy érdemes lenne visszamérni az adatokat, hogy ezzel támogassák a döntéseket vagy újraértékesítsék az információt.

Az állam a közérdekű adatok újrahasznosításával lendíthet óriásit a hazai big data-projekteken. Az állami adatok csapjait lezárni nem érdemes, a külföldi példák is azt mutatják, hogy a másodlagos hasznosítási projekteknek erős GDP-növelő hatásuk van. A nemzeti adatpolitikáról szóló Fehér Könyv megszületésével elkezdődött a jövő, az ott megfogalmazottakat már csak a gyakorlatban kellene tudni alkalmazni.

 

Big data az irodai élethez

A lazábban vett értelmezés szerint big data-projektekkel foglalkoznak a Motiment módszertant kidolgozó cég munkatársai. Irodai folyamatoptimalizáló megoldásként tekintenek termékükre, melynek lényege, hogy az irodai környezetben végzett munkát teszik hatékonyabbá. A folyamat- és kollaborációs mérések mellett szoftver-ergonómiai méréseket is végeznek, tízezred másodperces pontossággal. Számítógépenként naponta 300-500 ezer naplósor születik, vagyis egy 100-200 fős projekt keretén belül egy év alatt 2,5 TB-nyi nyersadat keletkezik.


 

Mészáros Zsolt ügyvezető szerint azért van mindenhol szükség részletes adatgyűjtésre, mert egy adott időpillanat figyelmen kívül hagyása nem pótolható, előre nem lehet tudni, hogy milyen veszteségtípusok dominálnak az ügyfél folyamataiban. Módszertanuk igencsak lerövidített lényege, hogy az adatok elemzése után a döntéshozó kap egy toplistát azokról a területekről, ahol relatív kevés beruházással magas hatékonyságnövekedés érhető el. Például egy nagyvállalati környezetben végzett projekt kapcsán kiderült, hogy a távmunka az emberek 20-25 százalékánál nem jó megoldás. A távmunkát elemző adataik kimutatták, hogy az együttműködési veszteségek markáns eltéréseket mutatnak abban az esetben, ha a munkakörnyezetet nem optimalizálták a megváltozott körülményekre. Az otthoni környezetből végzett munka esetében több időbe telik gyors választ kapni, mint a céges környezetben egymás mellett lévő kollégától. Vagy nem mindegy, milyen sebességű internettel kapcsolódik a dolgozó az irodai környezethez, hiszen a több száz megás fájlok megnyitása sok időt elvesz, ha lassú a kapcsolat. A mérések minden hibára és veszteségi pontra könyörtelenül rámutatnak, az adatszakértő feladata a toplista felállítása azokról a veszteségi pontokról, amelyekkel érdemes foglalkozni. Az adatok továbbá lehetővé teszik, hogy például eltérő munkakörök (jogász versus hr-es) hatékonyságát is össze lehessen mérni.

A hasonló projektek egyébként gyors megtérülést ígérnek, általában már egy-egy pilotprojekt végén is jelentkezik a beruházás áldásos hatása. Tartós együttműködésnél a 30-35 százalékos hatékonyságnövekedés reálisnak tekinthető.

 

Építésügyi adatok egy helyen

Az állami szférából hozott big data-projektre példát Both András. Az Országos Építésügyi Nyilvántartás a következő években megújul. Ennek részeként terveznek egy olyan BI-rendszert bevezetni, amely a 2009 óta a mai napig gyűjtött építésügyi adatokat egy értelmezés szerint, egy helyen, denormalizált formában gyűjti és tárolja. Ez a nyilvántartás olyan egyedi építészeti vagy szakági tervekkel dolgozik, melyek sokszor egymagukban is, fájlonként óriási adatot jelentenek – elég, ha például a 4-es metró teljes tervállományára gondolunk.

A rendszer elsődleges célja a döntéshozatal segítése. Ugyanakkor a statisztikai hivatal, az adóhatóság vagy az érdeklődő piaci szereplők felé így könnyebb lenne adatot szolgáltatni.

Both András szerint az építésügyi adatok további izgalma projektek alapját képezhetik. Például a Buliding Information Modelling, vagyis épületinformációs modellezés segítségével rengeteg (az épített környezetünkkel kapcsolatos) adatot lehet tárolni, feldolgozni és később felhasználni.