Technology

05_flickr.com_420px
Forrás: -

Rácsok és felhők

A grid computing nem új fogalom, de vajon ugyanazt jelenti-e most is, mint kezdetben, vagy a technológiák fejlődésével és az alkalmazások „felhősödésével” a számítóhálózatnak vagy rácsnak nevezett grid is, csendes evolúcióval, beáll a láthatatlan informatikai közműszolgáltatások sorába? A helyzet nem egyértelmű.

Klaszter – grid – virtualizáció – cloud – saas: megannyi fogalom. Hogy viszonyulnak ezek egymáshoz, vannak-e átfedések, több-e az egyik a másiknál, lehet-e a gridet (számítóhálózatok, rácsok) a felhőbe vinni? Megannyi kérdés, amelyek megválaszolására vár minden laikus döntéshozó – akik bár hallomásból ismerik az említett fogalmakat, lényegüket tekintve még nem látnak tisztán. Ami egyébként nem is könnyű dolog, hiszen még a szakértők is vitatkoznak azon, hogy hol a határ a grid és a cloud között, illetve azonos-e a kettő. Több elképzelést is ismertetünk.

 

Osztott rendszerek és fürtök

A grid lényegében a hálózaton párhuzamosan elosztott rendszerek evolúciójának az eredménye. A történet addig nyúlik vissza, amikor a számítástechnikusok felismerték, hogy az elszigetelt rendszerek összekapcsolása megsokszorozza a számítási teljesítményt. Aztán az elosztott rendszerek gridekké álltak össze, ma pedig itt a cloud computing, amely grid technológiát is felhasznál – fogalmazza meg véleményét Máray Tamás, a Nemzeti Információs Infrastruktúra Fejlesztési Intézet (NIIFI) műszaki igazgatóhelyettese.

Máray Tamás, NIIFI
Máray Tamás, NIIFI
A párhuzamos számítógépekkel az volt a baj, hogy – lévén egyedi termékek – drágák voltak, s csak nagyvállalatok vagy fontos állami intézmények engedhették meg maguknak az alkalmazását. A problémán az segített, hogy a mérnökök elkezdtek piacon hozzáférhető, viszonylag olcsó számítógépeket összekötni, s a processzorok összeadódó feldolgozási ereje megtöbbszörözte a teljesítményt – teszi hozzá Németh Zsolt, az MTA Sztaki tudományos főmunkatársa. Ezekből a hétköznapi elemekből jöttek létre a fürtök vagy klaszterek.

A fürt lényegében azonosfajta erőforrások csoportosított halmaza, amelyek mindegyike képes ugyanolyan jellegű feladatot ellátni. A fürtkialakítást legalább két célból szokták használni: az egyik változat a nagy rendelkezésre állás biztosítása – ekkor egy-egy kieső elem feladatát veszi át a fürt többi eleme, így a működés zavartalan marad. A másik alkalmazás nagy számítási teljesítmény előállítása: a fürt tagjai között a feladatot az ütemező elosztja, és a sok komponens vagy csomópont – párhuzamosan dolgozva a részfeladatokon – gyorsabban produkálja a végeredményt – magyarázza Sepp Norbert, az IBM Hungary hardvertechnikai szakértője.

A fürtöket többnyire lokálisan alakították ki, így kapacitásuk véges volt. Hogy még nagyobb számítási teljesítmény álljon rendelkezésre, a szervezetek ezeket a klasztereket összekapcsolták, megosztották – mint Németh Zsolt mondja, kölcsönös bizalmon alapuló hozzáféréssel –, s ebből lett a grid.

 

Fürtök és rácsok…

A grid computingban különféle számítógépek vesznek részt közös feladatok megoldásában. A szabad erőforrásokat – általában processzorfeldolgozási ciklusokat – megfelelő köztesréteg segítségével ajánlják fel. Sepp Norbert szerint többnyire egy központi komponens osztja szét a feladatokat a munkára ajánlkozók között, valamint a részfeladatokat használható eredménnyé kombinálja össze. A grid konfigurációja időben és térben változó, ám a platformok sokfélesége és a szabad kapacitások felhasználásának képessége miatt nagyon jó erőforrás-kihasználást tesz lehetővé.


Bár a grid és a fürt egyaránt elosztott feladat-végrehajtással jellemezhető, két különbség is van köztük. Az egyik, hogy a fürt homogén, a grid heterogén komponensekből áll. A másik, hogy a grid időben nem garantált módon kínálja fel végrehajtásra az erőforrás-szeletkéket, ezért tipikusan nem tudjuk előre, hol fog tartani a feldolgozás épp akkor, amikor a grid-erőforrások visszakerülnek a „gazdájukhoz”, és eltűnnek a rácsból; a grid ütemezőjének ezt figyelembe kell vennie a teendők szétosztásakor.

 

Virtualizáció

A cloud computing az adatközpontok fejlődésének olyan állomása, ahol az informatika közműként jelenik meg. Akárcsak a többi közmű esetén – legyen szó vízszolgáltatásról, gázról, elektromosságról vagy távközlésről – a felhasználók a lehetőséget szolgáltatásként veszik igénybe s használat alapján fizetnek érte; az üzemeltetést nem ők végzik, de szabványos, garantált minőségű erőforrás-használathoz jutnak. A felhőre jellemző, hogy bármikor, bárhonnan és széles platformválasztékkal elérhető, önkiszolgáló, internet alapú megoldásokat kínál. Felhők létrehozásához fejlett virtualizációval kialakított, megosztható, magas biztonsági és rendelkezésre állási igényeket kielégítő környezet szükséges, amelyet a szolgáltatók központilag felügyelnek.

Németh Zsolt, MTA Sztaki
Németh Zsolt, MTA Sztaki
A virtualizáció központi fogalom a modern rendszereknél. Azt a képességet értik rajta, hogy a fizikai felépítéstől független „nézetben” tudunk biztosítani erőforrásokat az igénylőknek.

A biztosított erőforrások felosztása, használata időben változhat, és lehetőség van azok átrendezésére akár működő alkalmazások alatt is, lehetővé téve az erőforrások jó kihasználását. A virtualizáció alapszolgáltatás a legtöbb modern szerver és operációs rendszer esetén. Nélküle elképzelhetetlen hatékony, költségkímélő, energiatakarékos adatközpont.

Máray Tamás szerint éppen a virtualizáció az, amely közös a gridben és a cloudban, bár a megközelítés és a technológia sok mindenben különböző. Megszűnt ugyanis a fizikai gép fogalma, s helyüket olyan absztrakt fogalmak foglalták el, mint számítási kapacitás, tárolási kapacitás, programok hozzáférhetősége stb. A szolgáltatások többrétegűek, a gridre leginkább a cloud infrastruktúra-szolgáltatása (infrastructure as a service) hasonlít – bár, a griddel ellentétben, ez esetben sem tudni, a világ melyik szerverparkjában van az a kiszolgáló, amelyen az adatainkat tároljuk.

 

Felhőmodellek

A felhő megvalósítási modellje egyébként többféle lehet: nyilvános felhőnél a végfelhasználó másokkal együtt használja a szolgáltató által kínált lehetőségeket, és kevés beleszólása van abba, honnan kapja az erőforrásokat, s nincs módja arra sem, hogy a szolgáltatást az egyedi igényeihez igazítsa. A magánfelhő esetén a vállalat informatikai határain belül épül fel a felhőkörnyezet, a végfelhasználók adatai nem hagyják el a vállalatot, és az egyedi igények kielégítése a vállalati it-részleg hatáskörén belül lehetséges. Költség- és méretgazdaságossági szempontok indokolhatják másfajta változatok, például közösségi felhő vagy menedzselt magánfelhő kialakítását.

Sepp Norbert szerint mindezek alapján látszik, hogy egymáshoz kapcsolódó fogalmakról van szó, s látszanak köztük a határvonalak is. Egy dolog jól körvonalazódik: a felhő mint szolgáltatási modell ellentétes a grid koncepcióval: az előbbinél mért és fizettetett, kiszámítható szolgáltatásról, az utóbbinál egy időben változó struktúrájú – és logikájában jórészt önkéntes – architektúráról beszélünk.

Németh Zsolt, MTA Sztaki
Németh Zsolt, MTA Sztaki
Németh Zsolt is felhívja a figyelmet, hogy a cloud computing nem feltétlenül tekinthető a grid utódjának vagy leágazásának, mivel nem a számítási kapacitást előtérbe helyező tudományos, hanem a nagy adatmennyiség kezelését preferáló céges világból jött. Mellesleg sokan nincsenek is tisztában a felhőszámítás mibenlétével, fogalmával, holott nap mint nap használják a végül is ezen a technológián alapuló közösségi oldalakat, keresőszájtokat, webáruházakat.

 

Évtizedes fejlődés

Máray Tamás szerint a gridek terjedését a kommunikációs hálózatok elmúlt tíz évben végbement fejlődése eredményezte – ezt megelőzően ugyanis csak a fizikailag egymáshoz közel lévő számítógépeket lehetett megbízhatóan és viszonylag olcsón összekapcsolni fürtté. A fejlődés folytán ma már a távoli erőforrásokat is nagyon olcsón, valamint nagyon nagy és jó minőségű sávszélességgel el lehet érni. A felhőszámításhoz pedig ott van a grid kapcsolódási pontja: a világ a grideken keresztül tanulta meg, miként lehet együttműködő erőforrásokat létrehozni webszolgáltatás alapú megközelítéssel.

Egyébként szinte nincs a tudományoknak olyan területe, amelyikben ne lehetne használni a grideket, így a műszaki és természettudományokon, időjárás-modellezésen, gyógyszerkutatáson stb. kívül lehet alkalmazni például gazdasági és nyelvészeti modellezésre, de brókercégeknek is lehetőségük van kiszámolni, hogy a különféle részvényvásárlási opciókkal mekkora nyereségre lehet szert tenni. Minden esetben azonban nagy paramétertér, sok alternatíva átfogásáról van szó.

A rácstechnológia alkalmazása ezért kifizetődő is: egy adott feladat megoldásához nem szükséges például drága laboratóriumi kísérleteket végezni hosszú időn keresztül, ott van helyette a hatékonyabb, gyorsabb és pontosabb szimuláció.

 

Grid vagy/és cloud?

A felhőszámításban teljesen más a feladat, s a szolgáltatásokat megpróbálják teljesen elfedni a felhasználó elől. Itt a lényeg a feladat elvégzése, függetlenül attól, hogy az hol történik – ez a felhasználót valójában nem is érdekli.

Mint láttuk, több átfedés is van a különböző fogalmak között, ugyanakkor a grid és a többi technológia közötti alapvető különbség az, hogy a rendszer elemei nagy földrajzi területen elosztva helyezkednek el. A gridek állhatnak fürtökből, s attól függetlenül, hogy az összekötött gépek különbözőek, a rendszeren hasonló szolgáltatások futhatnak.

Távolság és sebesség

Mind a cloudban, mind a gridben a kommunikáció sebességét és így a szolgáltatások igénybe vehetőségét nagyban befolyásolja a rendszer elemeinek egymástól való földrajzi távolsága. Ugyanis a távolság növekedésével nő a válaszidő is, vagyis az az intervallum, amely alatt egy adatcsomag oda-vissza megjárja az utat.

A kapcsolókkal és útválasztókkal terhelt szélessávú hálózatokon ráadásul csak kétharmadnyi fénysebességgel száguldanak a bitek, s ez, bizonyos idejű késleltetés felett, például a kép- és hangszolgáltatások akadozását eredményezi.

Haraszti Attila szerint a csomópontok, a földrészek közötti átterhelés is következményekkel jár, ugyanis a rendszer nehezen viseli a késleltetési idő vagy a válaszidő ugrándozásait.

 

A grid használatának első lépese az aggregáció, azaz a különböző típusú gépek mint erőforrások közös kezelése. Az aggregált erőforrás-halmazok lehetnek virtualizáltak is, így ugyanis könnyebb rájuk osztani a feladatokat. S miután megtörtént az elosztás, indulhatnak is a szolgáltatások, beleértve az olyan újabb fogalmakat, mint asp, xaas (akármi mint szolgáltatás) és a cloud computing – magyarázza a grid és a cloud vegyülését nem kizárva Haraszti Attila, a HP Magyarország üzletfejlesztési igazgatója.

A legjellemzőbb igénybe vett szolgáltatások a platform-, a szoftver- és az infrastruktúra-szolgáltatás.

A szolgáltatások ellentételezése többféleképpen történhet: processzor, tárhely, idő stb. alapon. Amit viszont a felhasználó – például egy magyar kisvállalat – nem kap meg, az a cloud vagy a grid elérésének, illetve a rendelkezésre állásának a szavatolása. Mert a hazai internetszolgáltató hiába garantál bizonyos sávszélességet a saját területén, a nemzetközi hálózat sávszélességéért és a cloud- vagy gridszolgáltató adatközpontjának eléréséért nem felel. Így érthető, hogy egy felelős vállalkozás – a biztonsági aggályokon túlmenően – kétszer is meggondolja, hogy adatait egy távoli helyen található szerverre helyezi.

Az egyébként, hogy egyáltalán érdemes-e cloud- vagy gridszolgáltatást igénybe venni, több tényezőtől függ. Ha például egy nagy létszámú értékesítési csapat ideje nagy részét úton tölti, s naponta egyszer feltölti az adatokat az ország vagy a világ különböző pontjairól, akkor megéri felhőszolgáltatást igénybe venni. Ha viszont egy cégnek csak egyetlen telephelye van helyben dolgozó alkalmazottakkal, akkor üzleti megoldásait nem fogja házon kívülre helyezni. Új alkalmazást, tárhelyet, virtuális gépet nagyon könnyű kapni, viszont általában nem tisztázott, hogyan lehet megszabadulni tőlük, ha már nincs rájuk szükség – s ez, bizony, minden dinamikus erőforrás-allokáció problémája.