Business intelligence

Business intelligence (skrátene BI) je označenie pre informačné technológie, aplikácie a metódy na zber, normalizáciu, analýzu, prezentáciu a interpretáciu obchodných dát – údajov o vývoji v organizácii. Primárnym účelom BI systémov (ako podmnožiny manažérskych informačných systémov) je podpora procesov rozhodovania a plánovania v rôznych oblastiach podnikového manažmentu. BI systémy sa preto niekedy nazývajú aj Systémy na podporu rozhodovania (z angl. Decision Support Systems – DSS).

Definícia a charakteristika

Termín Business Intelligence (BI) v roku 1989 prvýkrát definoval Howard Dresner zo spoločnosti Gartner Group ako množinu konceptov a metodík, ktoré zlepšujú rozhodovací proces za použitia metrík alebo systémov založených na metrikách. Aj keď táto oblasť IT nie je príliš stará, využitie nástrojov BI sa rapídne rozvíja. Za posledné roky zaznamenala značný architektonický, ale aj vecný rozvoj.

BI predstavuje jeden z najvýznamnejších faktorov kvality podnikovej informatiky a s tým súvisiacich posunov v konkurencieschopnosti podnikov. Business Inteligence možno definovať ako aplikačný software využívaný vo firmách pre podporu rozhodovacích procesov, ktoré tu prebiehajú. Dochádza k premene obrovského množstva rôznych dát na informácie, poznatky a znalosti užitočné pre koncového užívateľa. Je to súbor postupov, procesov a technológií, ktoré tieto rozhodovacie procesy podporujú. BI si tiež možno predstaviť ako sadu IS/ICT aplikácií, ktoré sú postavené na špecifických OLAP technológiách a ich modifikáciách.

Business Inteligence má niekoľko základných princípov, medzi ktoré patrí transformácia dát z transakčných a produkčných systémov na analytické dáta, ktoré sú následne využívané pre rozhodovanie. Riešenia BI sú založené na multidimenzionalite uloženia a spracovania dát. Na ukladanie dát sú využívané časové dimenzie a ukladanie prebieha do analytických databáz postupne v jednotlivých časových snímkach. Vzhľadom na to, sú na kvalitu dát kladené vysoké nároky.

Architektúra a funkcionalita

Zdrojové systémy

Medzi zdrojové systémy informácií, s ktorými BI pracuje možno zaradiť systémy ERP, CRM a ďalšie. Integrácia medzi technológiou BI a aplikačným softvérom predstavujúcim z pohľadu BI zdrojové aplikácie už prebieha dlhšiu dobu. V súčasnosti prebieha veľmi silná integrácia BI systémov do celopodnikových informačných systémov ERP, respektíve ERP II.
Podstatou týchto BI aplikácií je to, že obsahujú aj typové analytické aplikácie resp. typový obsah riešení zahrňujúcich preddefinované databázové schémy, typové analytické aplikácie, reporty a ďalšie komponenty pre riešenie projektu, prevažne úzko viazané na obsah štandardného ERP, prípadne iného aplikačného balíka. Takéto riešenie prináša vysokú efektivitu pri riešení projektov a vysoký stupeň integrácie BI s ostatnými aplikáciami. Ako nevýhodu možno uviesť fakt, že vznikajú obmedzenia vzhľadom na produktom tretích strán. Medzi známe príklady patrí systém SAP v spojení s Business Objects alebo systémy Microsoft Dynamics AX a NAV. Zaujímavosťou je, že so štúdií Gartneru vyplýva, že pre mnoho dodávateľov celopodnikových aplikácií sa BI aplikácie stávajú strategickejšou súčasťou ich systému ako ich základná funkcionalita na úrovni ERP, CPM a podobne.

Architektúra BI systémov môže byť v rôznych implementáciách rôzna, ale najčastejšie sa skladá z:

  • dočasných a operatívnych úložísk dát (DSA,ODS)
  • transformačných nástrojov (ETL)
  • dátových skladov (DWH)
  • nástrojov OLAP
  • nástrojov pre reportovanie a dolovanie dát (Data Analytics)

Usporiadanie jednotlivých vrstiev sa líši prípad od prípadu, ale vo všeobecnosti možno definovať základné vrstvy:

  • vrstva pre extrakciu, transformáciu, čistenie a nahrávanie dát
  • vrstva pre ukladanie dát
  • vrstva pre analýzu dát
  • prezentačná vrstva
  • vrstva odborovej znalosti

Okrem týchto piatich vrstiev možno do BI zaradiť aj niektoré ďalšie, ako sú metadáta (dáta o dátach), komponenty pre správu a manipuláciu s dátami a rôzne technické znalosti. BI ako základ svojho riešenia využíva princíp multidimenzionality. To znamená, že dáta sú transformované z relačnej do multidimenzionálnej databázy, kde sú následne spracované pomocou informačnej technológie nazývanej OLAP.

OLAP (Online Analytical Processing)

Ide o informačné systémy pre analýzu veľkého množstva údajov. Výsledkom analýzy sú súhrny a reporty slúžiace ako podklad pre rozhodovanie a riadenie procesov. Najlepším príkladom technológie OLAP je tzv. OLAP kocka.
OLAP kocka je dátová štruktúra, ktorá umožňuje rýchlu analýzu veľkého množstva dát. Usporiadanie dát do OLAP kocky prekonáva bariéry relačných databáz, ktoré nie sú určené na okamžitú analýzu a zobrazenie veľkého objemu dát. Relačné databázy sú určené skôr na vytváranie záznamov zo série transakcií, známej ako OLTP. OLAP pracuje v troch dimenziách, ktorými sú čas, produkt a miesto (napríklad región alebo nejaká konkrétna vymedzená oblasť). OLAP technológia sa zaraďuje medzi jednu z hlavných funkcionalít, ktorú poskytujú BI aplikácie.

ETL

Medzi ďalšiu významnú funkcionalitu patrí proces ETL. ETL označuje mechanizmus získavania dát zo zdrojových systémov podniku, ich následné spracovanie a poskytnutie BI aplikáciam. Táto problematika je pomerne komplikovaná a predstavuje nezanedbateľný podiel v nákladoch na budovanie systémov BI, či už ide o náklady finančné, časové alebo ľudské. V mnohých projektoch bohužiaľ býva táto problematika podceňovaná, predovšetkým v prvotných fázach vývoja a budovania.

Samotná skratka v sebe skrýva tri prebiehajúce procesy: extrakciu, transformáciu a nahrávanie dát.
Extrakcia znamená získanie dát zo zdrojových systémov a následné uloženie do dočasného úložiska. V typickom podniku je niekoľko systémov zaisťujúcich životne dôležité operácie. Väčšinou tieto systémy neboli nasadzované naraz, ale v rôznych časových etapách. Získavanie dát z týchto systémov nie je jednoduché aj preto, že nejde o jednorazovú ale o periodickú činnosť, ktorej úlohou je poskytovať čerstvé dáta pre ďalšie spracovanie.
Transformácia predstavuje proces spracovania dát získaných z primárnych systémov do formy odpovedajúcej požiadavkám systémov dátových skladov. Transformácia zahrňuje celú škálu operácií od konverzií, matematických operácií, filtrovaní, normalizácií a denormalizácií, až po sofistikované metódy vytvárania multidimenzionálnych štruktúr. Dáta prichádzajúce z primárnych systémov môžu byť znečistené rôznymi typmi chybných či nekompletných údajov. Súčasťou transformácií preto býva mechanizmus kontroly a čistenia dát.
Záverečnou fázou je nahrávanie zpracovaných dát do cieľového systému dátového skladu. Tu sú pre uloženie dát často využívané špecializované technológie, ktoré predpokladajú použitie rôznych mechanizmov pre ich rýchle a optimálne vkladanie.

Dátové sklady

Aplikácie pre prácu s dátami využívajú niekoľko druhov dátových skladov. Ich využívanie možno považovať za ďalšiu funkcionalitu BI aplikácií. Rozlišujú sa 4 druhy dátových skladov:

  • Dočasné úložisko dát (Data Staging Area – DSA)
  • Operatívne úložisko dát (Operational Data Store – ODS)
  • Dátový sklad (Data warehouse – DWH)
  • Dátové tržisko (Data Mart – DM)

Dočasné úložisko dát (Data Staging Area – DSA)

Dočasné úložisko dát slúži k dočasnému uloženiu dát, ktoré boli extrahované zo zdrojových systémov s cieľom podporiť a zrýchliť výber dát. Dáta, ktoré sú uložené v DSA sú detailné, nekonzistentné s dátami z ostatných systémov, neobsahujú históriu (len aktuálne dáta) a sú identické s pôvodnou dátovou štruktúrou.

Operatívne úložisko dát (Operational Data Store – ODS)

Sklad prevádzkových dát je úložisko, kde sú hromadne uložené zjednotené dáta. Toto uloženie môže byť tiež definované ako množina zjednotených databáz navrhnutých k podpore prevádzkového sledovania. Na rozdiel od databáz pre aplikácie OLTP, ktoré sú orientované transakčne s dôrazom na funkcionalitu, ODS obsahuje predmetovo orientované celopodnikové dáta. Dáta v ODS sú nestále, aktuálne a podrobné. Poskytujú zjednotený pohľad na dáta v prevádzkových systémoch a aktuálny pohľad na prevádzku. Dáta sú transformované a integrované do konzistentného zjednoteného celku z prevádzkových systémov. Dáta v ODS sú pravidelne, v reálnom čase a nepretržite obnovované, takže výsledný obraz zodpovedá poslednému aktuálnemu stavu.

Dátový sklad (Data warehouse – DWH)

Koncom 80-tych rokov William Inmon (považovaný za otca dátových skladov) definoval dátový sklad nasledovne: „Dátový sklad je subjektovo orientovaná, integrovaná, časovo rozlíšená a stála zbierka dát určená na podporu procesu manažerského rozhodovania.“

Dátový sklad možno označiť ako centrálny podporný systém, ktorý obsahuje údaje z rôznych interných a externých zdrojov, zhromažďuje ich, vytvára medzi nimi vzťahy, a tým pôsobí ako databanka pre ostatné systémy riadenia. DWH môže poskytnúť len také informácie, ktoré získal zo svojich zdrojov a závisí tak od kvality jednotlivých údajov a ich zdrojov, a nie od použitých prostriedkov. Vytvára sa individuálne na báze existujúcich informačných systémov a dôležitých informácií.

Údaje sa získavajú a ukladajú do transakčných (operatívnych) databáz, ktoré môžu byť v rôznych oddeleniach firiem, pripadne rozličných lokalitách. Tieto údaje sa v pravidelných intervaloch zozbierajú, predspracujú a zavedú do dátového skladu. Dáta v dátovom sklade musia byť jednotné a integrovateľné. To znamená, že údaje týkajúce sa konkrétneho predmetu sa do dátového skladu ukladajú len raz. Dátové sklady na rozdiel od ODS obsahujú historické snímky pre porovnanie v rámci rôznych časových období.

Dátová tržnica (Data Mart- DM)

Dátová tržnica, DM, Data mart je špecifický, subjektovo orientovaný sklad dát navrhnutý na základe špecifických požiadaviek menšej množiny užívateľov. Sú to teda určité presne špecifikované oddelené podmnožiny dátového skladu určené pre istú skupinu ľudí (menšie organizačné zložky firmy). Dátové tržnice sú často preferované podnikom ako prvý krok k vybudovaniu dátového skladu, a môžu byť použité ako dôkaz správnosti koncepcie dátového skladu. Dátová tržnica je špeciálna verzia dátového skladu, ktorá tiež obsahuje obraz operatívnych dát. Základný rozdiel je v tom, že pri vytváraní dátovej tržnice sa zameriava na špecifické, preddefinované potreby konkrétnych užívateľov a konfiguráciu dát. Dáta uložené v dátových tržniciach je možné používať predovšetkým ako podklad pre cielené analýzy. Výhodou usporiadania na viac samostatných dátových tržníc je jednoduchšia a rýchlejšia implementácia a z toho vyplývajúce rýchlejšie prínosy pre užívateľa. Medzi nevýhody patrí riziko možnej nekonzistentnosti medzi jednotlivými tržnicami. Táto schéma je tiež náročnejšia na údržbu.

Reporting

Reporting je ďalšou funkcionalitou Business Intelligence. Umožňuje vytvoriť akýkoľvek typ reportu v reálnom čase. Pri jeho tvorbe umožňuje využiť akýkoľvek zdroj dát (databázu) a pracuje s jednou metadátovou vrstvou. Reportovacie služby plnia funkciu podpory rozhodovania, slúžia ako návrh reportu a starajú sa o generovanie výstupu v elektronickej alebo papierovej podobe. Reporty môžu byť statické alebo interaktívne, pomocou rôznych ovládacích prvkov ich možno prispôsobovať. Reportovacie služby sa skladajú z týchto častí:

  • Report Server – webové, reportovacie služby.
  • Report Model Designer – vizuálny nástroj pre vytváranie modelov reportov
  • Report Designer
  • Report Manager – správa, prehliadanie reportov
  • Report Builder – vytváranie reportov

Analýzy

Analytické služby sú koncipované ako služby na pozadí. Umožňujú jednoducho skúmať informácie, týkajúce sa akýchkoľvek oblastí podnikania bez ohľadu na to, kde sú uložené súvisiace dáta. Poskytujú možnosť analyzovať a vytvárať zostavy nad OLAP a dimenzionálne orientovanými dátovými zdrojmi. Umožňujú taktiež obohatenie dát, hierarchizáciu a hľadanie závislostí. Je možné organizovať dáta do intuitívnych štruktúr pre podporu preddefinovaných aj jednorazových dotazov, ktoré dokážu identifikovať pravidlá, vzťahy a trendy.

EIS

Ďalší z rady nástrojov BI je Executive Information System – EIS. Podobne ako reporting umožňuje vytvárať analýzy a je podporou pre plánovanie a rozhodovanie. Tento nástroj je určený pre vrcholový manažment. Z hľadiska dát pracuje s dátovými skladmi, ktoré sú vytvárane pomocou ETL púmp z ERP databáz.

Dashboard

Dashboardy slúžia k rýchlej komunikácii komplexných informácií. Zobrazujú informácie z rôznych podnikových informačných systémov a prezentujú ich formou vizualizácií, ktoré súčasne zobrazujú viaceré informácie s použitím grafických prvkov ako sú mapy alebo grafy. Poznáme tri typy dasboardov – operatívne, taktické a strategické – ako podporné prostriedky k monitorovaniu, meraniu a riadeniu podnikovej štruktúry. Dashboard je možné využívať ako samostatnú aplikáciu, ako kľúčový prvok podnikového riešenia business intelligence, alebo ako platformu pre riadenie podnikovej výkonnosti. Pri využívaní dashboardov používatelia na všetkých úrovniach dostávajú informácie, ktoré potrebujú pre podporu svojich rozhodnutí pri zlepšovaní podnikovej výkonnosti. Ďalšou výhodou je, že umožňujú spájať dáta z rôznych systémov do jedného pohľadu.

BSC

BSC-Scorecarding pomáha zosúladiť konanie tímu s jeho taktiku a s celkovou stratégiou firmy. Monitoruje výkonnosť firmy voči stanoveným cieľom.

Integračné služby

Integračné služby majú za účel získavanie dát z externých aj interných heterogénnych zdrojov, ich trasformáciu, prečistenie a integráciu. Uplatňujú sa teda pri zbere dát a reorganizácii ich štruktúry. Taktiež sa starajú o ich aktualizáciu v dátových skladoch. Hlavnou vrstvou je Data Trasformation Pipeline (DTP), ktorá podporuje zdrojový a cieľový adaptér. Na nižších vrstvách sa vykonáva extrakcia a transformácia a patrí sem DTR API.

Datamining

Pri dataminingu ide o takzvané dolovanie dát z databáz. Proces vedie k objavovaniu vzorcov a súvislostí vo veľkých dátových súboroch. Hlavným cieľom tohto procesu je získať znalosti z existujúceho dátového súboru a premeniť ich na štruktúry zrozumiteľné pre človeka tak, aby boli vhodné pre ďalšie použitie. Využíva metódy štatistiky, matematiky, umelej inteligencie, nástroje OLAP a strojového učenia. Vytvárajú sa dva typy modelov: predikčné a segmentačné. Cieľom predikčných modelov je na základe historických údajov vytvárať predpovede do budúcnosti. Úlohou segmentačných modelov je roztriediť množstvo dát na zvládnuteľný počet homogénnych skupín.

Zdroje

  • Tento článok je čiastočný alebo úplný preklad článku &ognos na anglickej Wikipédii (číslo revízie nebolo určené).
  • Business Intelligence [online]. PNW. Dostupné online.
  • DVOŘÁKOVÁ, Jana. Business Intelligence - prehľad [online]. 4.10.2011. Dostupné online.
  • FEHÉR, Juraj. Multidimenzionálny databázový model a OLAP [online]. Bratislava : Fakulta matematiky, fyziky a informatiky UK, 2007. Dostupné online.
  • Technologická architektúra BI [online]. QBSW, a.s.. Dostupné online.
  • Open source BI môže rozšíriť funkcionalitu komerčného softvéru počas recesie [online]. ITMG. Dostupné online.
  • SLÁNSKÝ, David. Koncept řízení Business Intelligence pomocí parametrů [online]. Systems Integration, 2005. Dostupné online. (po česky)
  • POUR, Jan. Business intelligence – prostor trvalého rozvoje [online]. Katedra informačních technologií, VŠE Praha, 2010. Dostupné online. (po česky)
  • MINISTR, Jan a kol.. BI jako nástroj hodnocení sentimentu nestrukturovaných textů sociálních sítí [online]. Česká společnost pro systémovou integraci, 2011. Dostupné online. (po česky)
  • BELAJ, Pavel. OLAP a priestorové dáta [online]. Institut geoinformatiky, Hornicko-geologická fakulta, VŠB-TU Ostrava, 23.1.2012. Dostupné online.
  • ŠILEROVÁ, Edita. Informační systémy – nástroj pro dosažení změn [online]. . Dostupné online. (po česky)
  • AUBRECHT, Petr. MINDANAO - ETL proces řízený meta daty [online]. Centrum aplikované kybernetiky, Elektrotechnická fakulta ČVUT. Dostupné online. (po česky)
  • Sborník přednášek Informační technologie pro praxi 2011 [online]. Ostrava : 2011. Dostupné online. (po česky)

Externé odkazy

  • KOVÁCSOVÁ, Zuzana. Nástroje Business inteligence a ich možné využitie pre manažérske rozhodovanie [online]. Brno : Ekonomicko‑správní fakulta MU, 2007. Dostupné online.
  • BI - princíp multimediálnych databáz [online]. PNW. Dostupné online.
  • Business Intelligence [online]. Microsoft. Dostupné online.

Pozri aj

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.