Technology

Hőgye Attila és Rausch Márk, Telvice
Hőgye Attila és Rausch Márk, Telvice
Forrás: ITB

Mesterséges intelligenciával támogatott harmadik generációs monitoring

A harmadik generációs monitoring-megoldások mélyebb betekintést nyújtanak az alkalmazások belső működésébe, ebben a mesterséges intelligencia is segítségünkre van. Cikksorozatunk második részében a Telvice Kft. szakértői, Hőgye Attila és Rausch Márk, a harmadik generációs monitoring megoldásban rejlő technológiai- és üzleti értékeket mutatják be.

– Mi a különbség a második és harmadik generációs monitoring között?

Hőgye Attila (H. A.): A legtöbb régi ügyfelünk a közelmúltig 2. generációs monitoringot (Dynatrace AppMon-t) használt. Itt a fő hangsúly az alkalmazások működésének vizsgálatán van, így az infrastruktúra monitoring képességei mellett képes a megfigyelt alkalmazások által kiszolgált kéréseket ügyfél oldaltól a szerver oldalon át, egészen az adatbázisig end-to-end követni.  Mivel az eszköz metódus mélységig végzi a feladatát, ezért mély betekintést nyújt az alkalmazások belső működésébe, sőt az ügyféloldali elégedettségre is kitér. A leggyakoribb probléma, hogy a gyűjtött adatokat manuálisan, szakértői ráfordítással kell elemezni és értelmezni, ami sokszor meghaladja az emberi teljesítőképesség határait.

– Mi indokolja a harmadik generációs rendszerek megjelenését?

H. A.: Az egyre növekvő tranzakciószám és az új, felhős, konténeres technológiák megjelenése új lehetőségeket teremt, de emellett nagy terhet is ró az informatikára. Napjainkban, amikor a nagyvállalati infrastruktúrák egyre inkább a felhő irányába mutatnak, és a microservice-ek jelentik a hiperskálázott alkalmazások építőkockáit, elkerülhetetlen a monitoring újfajta megközelítése: a felhasználószám növekedésével és a microservice-es technológiák elterjedésével emberi erővel nem, vagy csak rengeteg időráfordítással követhetőek a kritikus alkalmazások.

– Ebben pedig a továbbfejlesztett AI is szerephez jut.

H. A.: Valóban. A továbbfejlesztett, 3. generációs monitoringban kiemelkedő szerepet kap a mesterséges intelligencia, mely képes automatikusan rendszerezni, értelmezni a gyűjtött infrastruktúra- és tranzakciós adatokat, csökkentve ezzel az IT-ra nehezedő terhet. Az AI nem áll meg az adatok időbeli korrelációjánál, hanem tisztában van az alkalmazást alkotó szolgáltatások hierarchiájával, így az ok-okozati összefüggéseket is képes automatikusan feltárni, tudja detektálni a problémát, megmutatni a probléma gyökérokát és üzleti hatását, azaz, hogy mely felhasználókat és szolgáltatásokat, milyen mértékben érint. Az AI emellett auto-adaptív módon folyamatosan követi a monitorozott környezet dinamikus változásait (konténerek keletkezését és megszűnését, új funkcionalitások megjelenését stb.).

– Mennyire igényli ezt a felhasználói kör, mi a fogadtatása ennek az új technológiának?

H. A: Felhasználóink visszajelzése alapján is azt mondhatjuk, hogy az újgenerációs monitoring képes a hibák pontos és gyors detektálására, minimális emberi ráfordítás mellett lerövidíti a probléma feltárására és javítására fordított időt. Intuitív, egyszerű felülettel rendelkezik, mely könnyen értelmezhető. Emellett könnyen és gyorsan, pár óra alatt bevezethető, és szabadon mozgatható a monitorozni kívánt szerverek között.

– Milyen irányokba fejlődnek tovább a 3. generációs monitoring-rendszerek?

H. A: A 3. generációs monitoringban rejlő lehetőségek nem állnak meg itt. A Dynatrace két éve bevezetett változata az üzemeltetés mellett jelentősen támogatja a fejlesztés munkáját is: komoly lehetőséget teremt arra, hogy ne mehessen ki hibás, vagy rosszul működő kód éles környezetbe. Automatikus Hot-Spot detektáló képességével optimalizálható az elkészült kód, melyet egy automatikus teszt kiértékelő rendszer (Quality Gate) támogat, és ez óriási segítség a tesztelőknek. Az újgenerációs monitoringgal szembeni másik fontos elvárás, hogy könnyen integrálható legyen és együttműködjön a nagyvállalati környezetben használt ticketing, service management, loggyűjtő, CI-CD és elemző-jelentéskészítő technológiákkal. Ezen technikák alkalmazása a jövőben elvezethet odáig, hogy autonóm működésű, felhős rendszereket alakíthatunk ki a Dynatrace segítségével, melyek képesek a hibák önálló(!) felismerésére és elhárítására.

– A Telvice fejlesztési munkái hogyan kapcsolódnak a monitoring területhez?

Rausch Márk (R. M.): Az általunk fejlesztett SLA riporting a Dynatrace robosztus technológiájára épít. Feladata, hogy a Dynatrace által mért komplex service metrikákat ügyfeleink az üzleti területnek és a vezetőknek emészthető, egyszerű formában biztosítsa. A Telvice SLA megoldásának lényege, hogy a szolgáltatás menedzsment és/vagy az üzlet egyszerűen és automatikusan juthat hozzá a Dynatrace rendszerrel mért szolgáltatás objektív minőségi adataihoz, így az SLA szerződések kritériumai számára a rendszer működéséhez és rendelkezésre-állásához közelebb álló, pontosabb adatokat szolgáltasson. A nagyvállalati informatika számára hatalmas előny, hogy automatikusan állnak elő a kész SLA riportok, előállításukhoz kevesebb emberi erőforrás szükséges és kizárható az emberi hiba lehetősége. További előny, hogy nemcsak időzítve, hónap végén vagy hetente láthatjuk a szolgáltatások és az egész alkalmazás rendelkezésre-állásának eredményét, hanem valós időben követhetjük az SLA kritériumokat meghatározó jellemzők aktuális állapotát. A megoldás objektíven és bizonyítható módon támasztja alá a szolgáltatásokat nyújtó és az azt igénybe vevő fél szerződéses megállapodását és annak teljesítését.

– Ez milyen plusz üzleti értéket jelent?

R. M: A napi üzemeltetésben nyújtott segítség mellett az üzlet számára plusz érték, hogy a vezetői döntéseket naprakész, élő rendelkezésre-állási adatok segítésével, aktuális információkkal támogatjuk. Erre egy példa: az elmúlt egy órában néhány szolgáltatás megsértette az SLA-ban leírt paramétereket. A Dynatrace segítségével könnyen és azonnal elérhetők az ilyenkor fontos információk, kimutatva például, hogy hány felhasználót érintett a probléma, mely információ segíthet előre felmérni az esetleges üzleti veszteséget. Lényeges szempont az is, hogy a javítás módjára vonatkozóan is kaphatunk pontos információt, melynek köszönhetően a javítási idő jelentősen lerövidülhet.

 

Az egyre növekvő számú digitális szolgáltatások miatt kulcsfontosságú, hogy ismerjük és folyamatosan monitorozzuk, milyen szolgáltatásminőséget kapnak az ügyfelek. Következő cikkünkben a felhasználói élmény méréséhez kapcsolódó technológiákról fog beszélni Hőgye Attila, a Telvice szakértője.