Digitalizace. Průmysl 4.0. Internet věcí. Big data. Machine learning. Business intelligence… Jsou tyto pojmy jen bublinami, které brzy splasknou, a přijdou další, nebo se za nimi skrývá něco víc? Odpověď není úplně jednoznačná. Na jedné straně platí, že každý z těch pojmů svůj obsah má a neměli bychom je přehlížet. Žádný sám o sobě ale nenese spásu, kterou v nich mnozí chtějí vidět.
Hodnota dat
Těžko si někdo před padesáti lety uměl představit, že sama data mohou být hodnotou, komoditou, s níž se bude obchodovat. A přece tomu tak je. Dat kolem nás je neuvěřitelné množství a z toho množství lze získat neuvěřitelné informace. Z těch správnou interpretací a využitím mohou vzniknout znalosti, často zcela nové úrovně. Takovým příkladem je i tým vědců Neurologické kliniky 1. lékařské fakulty UK a Všeobecné fakultní nemocnice v Praze ve spolupráci s vědci ČVUT Praha – ti pracují na unikátním systému, který analýzou akustického signálu řeči může předpovědět budoucí Parkinsonovu chorobu.
V datech je skutečně skryto netušené bohatství. Stěžejní schopností je rozpoznat, z jakých dat lze získat jaké informace, kde je ta hodnota skryta. „Těžba dat se stává normálním podnikatelským segmentem, data mají obrovský potenciál. Když budete mít aplikaci, která vás bude zdravotně monitorovat, tak nejen že dokáže upozornit na nějakou anomálii, ale z časové řady vašich dat může predikovat budouc nost. Takových příkladů začíná vznikat celá řada,“ říká doktor Chlapek.
Data mining
Pro zasvěcené nic nového, pro laiky možná němý úžas – datové inženýrství se dnes běžně vyučuje, těžba dat je regulérní podnikatelský segment. Tady začínají hrát roli big data. Čím více dat, tím lepší informace se z nich dají vytěžit. S daty se běžně obchoduje na trhu. A nejsou na nich nejcennější osobní údaje někoho konkrétního z nás, ale naopak to, co na nich lze zobecnit. Pro těžení jsou data anonymizována, čištěna, strukturována. A ovšem, někdo musí být schopen alespoň tušit, co by se z nich dalo vytěžit. Mimochodem, slovo těžba je velmi příznačné – někdy i při veškeré snaze můžete mít jen hlušinu, někdy narazíte na zlatou žílu skoro omylem.
Vyznat se v datech je jen první krok k tomu, abyste získal nějakou hodnotu,
abyste lépe poznal jevy a situace a mohl lépe řídit, vyrábět, obchodovat.
Obchod s daty má jednu výhodu – zpřístupní velká externí data i malým společnostem, které samy taková data nevlastní. I ony tak mohou získat znalosti jinak nedostupné. Případně nejen znalosti, ale přímo i služby s nimi spojené. Většina běžných výrobních i obchodních firem může tato data běžně využít pro lepší, respektive efektivnější marketing, může na nich budovat znalost svých zákazníků, poznávat jejich preference, analyzovat konkurenci.
Zajímavou a dosud nepříliš známou možností, jak vytěžit data, která spravuje stát, je projekt Ministerstva vnitra Otevřená data. Ten se snaží zpřístupnit veškerá data, která nejsou ze zákona chráněna, široké veřejnosti. „Bohužel, často se nám stává, že když jednáme na úřadech, slyšíme, že o to stejně není zájem. Určitě by bylo dobré, kdyby se zvláště firmy více zapojily, třeba objeví nový prostor,“ říká docent Martin Nečaský z Matematicko-fyzikální fakulty UK, který je členem projektového týmu.
Porozumět datům
Velká data spravují většinou velké organizace, banky, telefonní operátoři, zdravotní pojišťovny, provozovatelé velkých internetových obchodů. Pro malou či střední českou výrobní společnost asi nejsou big data tématem dneška, mnohem důležitější pro ni je využívat efektivně a co nejvíce vlastní data.
„Není nutné hovořit o big datech, stačí porozumět těm vlastním. V praxi je ale obecně lidí, kteří datům rozumějí, nedostatek. A když už je máte, pak za úplně stěžejní považuji najít porozumění mezi těmi, co se vyznají v datech, a těmi ostatními. Protože vyznat se v datech je jen první krok k tomu, abyste získal nějakou hodnotu, abyste lépe poznal jevy a situace a mohl lépe řídit, vyrábět, obchodovat. A vždycky to s sebou nese práci. Představy, že přijdete na konferenci, něco se dozvíte, přijde firma a ta vám přinese zázračné řešení, jsou nesmyslné. Technologie tu jsou a pro začátek nemusejí být ani příliš sofistikované. Úplně stačí pochopit, že data mám, uvědomit si, že z nich mohu získat hodnotu a pokusit se v nich tu hodnotu skutečně najít. Zapomeňme na big data, začněme malými krůčky, které ukážou efekt,“ radí Martin Nečaský.
A přidává jednu zásadu. Ukládejme si veškerá data v té nejlepší možné, strojově čitelné podobě, ve které vznikla. Protože nikdo nedokáže odhadnout technologie, které přijdou za deset let.
Generace na rozhraní
Z jednoho úhlu pohledu máme možná smůlu, že jsme generací na rozhraní. S technologiemi jsme se naučili zacházet a žít, ale naše děti to zvládají mnohem lépe. V mnoha případech si ani neuvědomujeme, co všechno se z dat kolem nás dá vytěžit. Přiznejme, že trpíme jakousi datovou slepotou a značnou mírou nedůvěry v rozšířenou realitu. Spor mezi taxikáři s tradičními taxametry a moderními aplikacemi chceme řešit regulací, místo abychom pro srovnání podmínek využili data, která všichni zúčastnění mají. Státní zkoušku na dálku složit nelze. Elektronickému receptu se bráníme. A přitom všechny tři situace s využitím technologií budou efektivnější, komfortnější, s přidanou hodnotou pro všechny strany.
Paradoxem je, že online bankingu jsme se příliš nebránili a na sociálních sítích o sobě běžně sdělujeme mnohem citlivější informace, než že bereme vitamin C. Možná je příčinou marketing. Banky nám výhody online bankovnictví vysvětlily poměrně dobře, sociální sítě jsou od dětství samozřejmostí, zatímco výhody elektronického receptu ministerstvo zdravotnictví nijak nekomunikuje. Což odkazuje k druhému problému doby datové. Jestliže prvním krokem je s daty kamarádit a trochu jim porozumět, tím posledním je data srozumitelně interpretovat.
„Někdy může být problémem správně, srozumitelně a pochopitelně výsledky těžení dat prezentovat těm, jimž jsou určeny. Máme vlastní zkušenost, často pracujeme na nejrůznějších projektech. Naučili jsme se výsledky prezentovat na jednom jediném plakátu. Prvotní údiv střídá obvykle následné pochopení. Data jednoznačně mají budoucnost, podívejte se do velkých médií, všechna dnes zaměstnávají několik datových inženýrů, v podstatě datových novinářů.
A na tématech příspěvků specializovaných konferencí se ukazuje, že přibývá těch, které se týkají těžení, tedy ne už tolik databází a technologií, ale přístupu k datům, vztahům mezi nimi. Dnes existují systémy, které si na svou uživatelskou generaci musejí ještě počkat. My jsme například na VŠE připravili návrh systému pro elektronické volby a možná naše děti ho budou používat stejně běžně jako online komunikaci s úřady. My si za úředníkem ještě postaru zajdeme,“ říká Dušan Chlapek.
Otevřená data
Projekt v gesci Ministerstva vnitra ČR. Na adrese https://opendata.gov.cz/start je portál určený orgánům veřejné správy, které plánují otevřít svá data. Popisuje doporučovaný postup otevírání dat a nabízí vzorové publikační plány, které obsahují pro jednotlivé typy orgánů veřejné správy i konkrétní datové sady k publikaci ve formátu otevřených dat. Portál rovněž informuje o školeních připravených k tématu otevřených dat. Otevřená data jsou přístupná všem subjektům i ke komerčnímu využití.
Převzato z časopisu Komora. Autor článku Petr Karban, šéfredaktor časopisu Komora.