Čím dál častěji jsme svědky toho, že se odborné pojmy z IT stávají součástí běžného slovníku. V poslední době se do něj zařadil i termín Big Data. Proč se dnes týkají každého z nás? Jaký nám mohou přinést užitek?
Aby se nestalo, že zpracováním všech dat budou vznikat nová a nová data a požadavky na výpočetní výkon porostou exponenciální řadou, až nebude možné provádět jejich zpracování v reálném čase, musela nastat změna. A toto představuje změna způsobu práce s hromadnými neboli velkými daty – Big Daty. Namísto práce s každou veličinou zvlášť dochází k určitému zobecnění a spíše než na exaktní výsledek je důraz kladen na sledování trendů, indexů a dalších statistických veličin, které lze z dat vyčíst. Ale pojďme postupně.
Co označujeme za Big Data?
Když si dva současníci povídají o úložištích, mluví o megabytech, gigabytech (109) nebo terabytech (1012). Big Data začínají spíše na petabytech (1015), ale jejich objem roste exponenciálně, takže objemy jsou stále vyšší. Současně s tím je nutné tento objem dat zpracovávat v reálném čase. Jako vhodný příklad se uvádí zpracování dat z kamery, nebo i více kamer najednou, a to vše v kontextu s dalšími datovými zdroji.
S tím souvisí i další specifikum, kterým je různorodost formátu takových dat. Nemusí totiž jít o strukturovaná (tedy utříděná a jednoduše čitelná data), ale o kombinaci dat, která jsou každá v jiném formátu, s jinými charakteristikami atd. Jako příklad lze uvést zpracování databázových informací společně s multimediálními daty, obsahy textových dokumentů a vzorců chování uživatelů na internetovém portálu.
Že už se vám to zdá těžko uchopitelné? A právě proto jsou tu Big Data jako nástroj, do kterého jeho tvůrci, dodavatelé a konzultanti zabudovali dostatečnou logiku a nástroje na to, aby se i s takovými daty dalo efektivně pracovat například pro marketingové účely.
Prvními oblastmi, kde se využívala Big Data, byly výzkumné instituce a marketing. Jejich průkopníky se staly společnosti jako Google, eBay nebo Amazon s cílem zmapovat, jak co nejlépe provést uživatele svými stránkami tak, aby se zvýšila výtěžnost z klikání.
Jak je můžeme využít?
Prvními oblastmi, kde se využívala Big Data, byly výzkumné instituce, inovativní projekty a marketing. Ze své podstaty se jejich průkopníky staly společnosti jako Google, eBay nebo Amazon s cílem zmapovat, jak co nejlépe provést uživatele obsahem svých stránek tak, aby se zvýšila výtěžnost z jejich klikání. A že se jim to daří, si všimnete okamžitě, když se vám v reklamě vedle stránky, kterou si náhodně prohlížíte, najednou objeví něco, o co jste se zajímali nebo co si skutečně chcete koupit.
Trochu méně viditelné, ale věřte, že stejně systematické, je využívání podobných principů ze strany bank a finančních institucí. Rozdělení uživatelů kreditních karet do jednotlivých skupin a následné zacílení konkrétních finančních produktů s mnohem vyšší úspěšností je dnes běžnou praxí.
Najednou máte pocit, že vám i při hromadné obsluze vaše banka lépe rozumí a nabízí vám produkty šité na míru. Už jste se také zapojili do nějakého věrnostního programu nebo soutěže v supermarketu? Vnímáte to jako velmi výhodný způsob, jak ušetřit při nakupování? Věřte, že za tím vším jsou velmi sofi stikované výpočty, které ve svém výsledku znamenají to, že zákazníci odcházejí spokojenější a přitom utratí mnohem více.
V neposlední řadě má každý z nás ve své kapse mobilní telefon. Paradoxní je, že i když nemáte chytrý telefon, stále poskytujete velmi zajímavé informace, které mohou být využity ke zlepšení služeb. Nebojte se, nikdo konkrétně vás nesleduje, ale naopak se informace o pohybu vašeho mobilního telefonu smíchají s informacemi o pohybu všech dalších mobilních telefonů, nebo spíše SIM karet, a mohou nabídnout zcela nové služby.
Během vteřiny je možné zjistit, že proud telefonních přístrojů pohybujících se na dálnici se zpomaluje a zastavuje. Automaticky lze vyhodnotit obraz z dopravních kamer v přilehlých místech a zjistit, zda nedošlo k nějaké dopravní komplikaci. To vše se dá obratem přenést na dopravní tabule nad dálnicí a do navigací, které umí dynamicky měnit cestu podle informací poskytovaných z dopravních center. Že se vám to zdá relativně jednoduché a užitečné a že by to usnadnilo život mnoha lidem na cestách? Technické prostředky už jsou k dispozici, jde jen o to, aby se našel obchodní model, který bude dostatečnou motivací pro její zavedení.
Mnohem vyšší ekonomickou hodnotu má informace o tom, kolik lidí se pohybuje v jaké části města v okamžiku, kdy plánuje obchodní řetězec otevření nové prodejny. A pokud si k tomu připojíme i zobecněná data o výši mobilního účtu nebo zprůměrované ceníkové ceně používaného mobilního telefonu v dané oblasti, můžeme vytvořit mapu zobrazující i kupní sílu obyvatel dané oblasti. Podobně se dnes dají do celého zpracování přidat i informace ze sociálních sítí a přesně zacílit reklamní kampaň na ty, kteří mají nejvyšší užitek z dané informace.
Technologie je jedna stránka věci, na opačné straně je lidský rozměr a vyhodnocení užitečnosti pro jednotlivce. A etický rozměr. V digitálním světě jsme se s tím již postupně smířili, ale přesah do reálného světa část společnosti odmítá s odkazem na přílišný zásah do soukromí. I proto je nutné k technologiím Big Dat přistupovat velmi citlivě a důsledně vážit přínosy a nevýhody. Jen tak mohou společnosti jako celek obohatit a posunout kupředu.
Jsou informace o mně v bezpečí?
Předchozí odstavce pracují s faktem, že každý pohyb vašeho telefonu, každé kliknutí na webové stránce nebo jakákoliv jiná informace je někde zaznamenána. Cílem není vás sledovat, spíše jde o vedlejší efekt toho, jak fungují základy technologií. Vše ostatní je nadstavba a její rámec by měl být vždy podřízen vývoji lidské společnosti a hranice by měly být nastaveny do komfortní zóny obsluhy.
Jakékoliv vychýlení z rovnováhy bude znamenat znehodnocení dosažené úrovně obsluhy. Příliš snadná dostupnost informací povede k restrikcím a regulatorním zásahům, které budou reakcí na jakékoliv zneužití. Na druhé straně přílišná omezení sníží komfort služeb a v konečném výsledku jej budou zákazníci vnímat negativně.
Zlatou střední cestou je důsledná generalizace a anonymizace dat, které zabrání zneužití konkrétních údajů a současně umožní pracovat s trendy nad hromadnými daty. A cílem veškerého snažení by mělo být nastavení právě takovéto rovnováhy podpořené možností individuálního nastavení komfortní zóny dle preferencí každého zákazníka.
Převzato z časopisu Komora
Autor článku: Jiří Berger