FEJLETT ADATKEZELÉSI TECHNOLÓGIÁK
(BIG DATA, MI, FELHŐ)
A modern
technológiák a mai eszközöket követve a legfrissebb, legkorszerűbb megoldásokat
nyújtják a felhasználók részére. A klasszikus megoldások egy idő után elavulttá
válnak, így szükséges felváltani ezeket újakkal. A modern technológiák napra
készek, követnek minden egyes újdonságot, ellentétben a klasszikus
megoldásokkal.
Az utóbbi években
jelentősen nőttek az adatgyűjtési lehetőségeink. Számtalan cég, a bankoktól az
energiaszektoron át az autóiparig, korábban ismeretlen mennyiségű adathoz
tudott jutni a saját tevékenységéről. Olyan sok adathoz, ami már minőségi
ugrást jelentett a megelőző korszakokhoz képest. Egy bizonyos adatmennyiség
felett már olyan alaposan meg lehet ismerni egy adott ipari folyamatot,
digitális szolgáltatást vagy akár emberi viselkedésmintákat, hogy már jó
hatékonysággal lehet jóslatokat, predikciókat megfogalmazni a segítségükkel.
A
big data
fogalma alatt azt a komplex
technológiai környezetet (szoftvert, hardvert, hálózati modelleket) értjük,
amely lehetővé teszi olyan adatállományok feldolgozását, amelyek annyira nagy
méretűek és annyira komplexek, hogy feldolgozásuk a meglévő adatbázis-menedzsment
eszközökkel jelentős nehézségekbe ütközik. A „big data” elképzelhetetlen a
felhők nélkül. Egy informatikai rendszer kiépítéséhez a felhasználók ma már nem
nagy hardver komplexumokat vásárolnak vagy lízingelnek, hanem sokkal inkább
virtuális szervereket vagy felhős PaaS szolgáltatókat bérelnek. Ennek rengeteg
előnye van. Gazdaságosan és gyorsan lehet nagy számítógépfürtöket létrehozni,
rugalmasan változtatható a virtuális végrehajtóegységek száma, ami fontos lehet
sok alkalmazásnál.
A big data
technológiák egyre szélesebb körben kezdtek elterjedni, alternatívát kínálva a
hagyományos relációs adatbázisokon alapuló adattároláshoz képest.
A FŐBB MOTIVÁCIÓS TÉNYEZŐK A BIG DATA ELTERJEDÉSÉHEZ
- Költséghatékonyság: a hagyományos szemléletű relációs adatbázis és SAN alapú tárolás infrastrukturális költségénél olcsóbban lehet tárolni és feldolgozni az adatokat.
- Adatbetöltési teljesítmény: nagy sebességgel, nagy mennyiségben keletkező adatok tárolásánál a big data előnyösebb lehet a hagyományos relációs adatbázisoknál.
- Lekérdezési, elemzési teljesítmény: olyan elemzési célú lekérdezéseknél, amelyek egyszerre nagyobb adatmennyiséget mozgatnak meg akár többször is, a big data szemlélet gyorsabb lehet egy relációs rendszerhez képest.
- Valós idejű adatfeldolgozás: nagy sebességgel, nagy mennyiségben keletkező adatokon történő azonnali transzformációk elvégzésére hatékonyabb egy big data platform.
- Strukturálatlan, vagy lazán strukturált adatok tárolása, elemzése: ilyen típusú adatok tárolása és lekérdezése relációs adatbáziskörnyezetben nehézkesebb vagy problémás választás lehet.
A folyamatosan
növekvő nagy mennyiségű adatokhoz kapcsolódó átfogó elemzések elkészítéseképpen
merül fel az igény az üzleti intelligencia szükségességére. Egy
BI rendszer
megléte jelentősen támogatja az elkészült
riportok alapján a vállalaton belüli vezetői döntéshozatalt, illetve egy átfogó
képet nyújt a vállalat működéséről az illetékes területek számára
egyaránt.
Ezekhez az
elemzésekhez azonban képesnek kell lenni a bennük rejlő információk,
összefüggések feltárására is, erre szolgál az
adatbányászat
,
melynek különféle eszközei léteznek. Adatbányászat
során vizsgáljuk az adatokat, információkat nyerünk ki belőlük és
ezekkel az új információkkal új tudás kinyerése a cél.
A meglévő
adatkészletek alapján a múltbeli adatokból kiindulva meghatározott eszközökkel
prediktív analízist
(PA) is tudunk készíteni.
Azaz: múltba visszamenőleges adatokból következtetni a jövőre.
Az
üzleti
intelligenciát
szolgáló PA
az adatbányászat és a matematikai elemzés eszközeivel dolgozik. Az IT üzemeltetést
támogató prediktív analitikák akár valós időben is készítenek hasonló
elemzéseket.
FELHASZNÁLÁS TERÜLETEI
A prediktív
elemzésekből egy sor területen származhatnak üzleti előnyök. Sok adat és sok
változó mellett a PA segít az adatok kiértékelésének automatizálásában, ami
gyorsítja a döntéshozatali folyamatot. Az ügyfelek, beszállítók és többi
partner illetve a munkavállalók múltbéli viselkedéséből következtetni lehet
arra is, hogy mit tesznek majd adott körülmények között a jövőben.
(Természetesen az adatvédelmi szabályok szigorú betartása mellett). Ez segíthet
meghatározni a legjobb lépések kiválasztását, akár egyes ügyfél és tranzakciók
szintjén is.
Azok a döntések,
amelyekre korábban órákat kellett szánni, immáron akár másodpercek alatt is
meghozhatók az előre kialakított banki termékek vagy új telefonelőfizetés
testre szabott ajánlásán át akár csalások valós idejű beazonosításáig. A hasonló
adatcentrikus PA-t korán bevezetők már ott tartanak, hogy a döntéshozatal során
akár a megelőző üzleti hét vagy nap teljes feldolgozott adatbázisaira tudnak
támaszkodni. Ez a reakcióidő korábban elképzelhetetlen lerövidüléséhez, a piaci
folyamatok és a pillanatnyi döntések majdnem valós idejű szintetizálásához
vezet. Különösen olyan időszakokban jelenthet ez nagy segítséget, amikor a
szokásosnál gyorsabbak és gyakoribbak a nagy változások.