5.6.1.
OLAP (On-line Analitical Processing) —
деректерді жедел талдау
Механизм OLAP механизмі қазіргі таңда деректерді талдауда
танымал әдіс болып саналады. OLAP— бұл жеке алынған
бағдарламалық өніс емес, бағдарламалау тілі де емес, тіпті нақты
технология да емес. Егер, OLAP оның барлық байқалуында қамтуға
әрекет жасайтын болсақ, онда бұл деректерге аналитикалық қол
жетімділікті жеңілдететін, бағдарламалық өнімдер негізінде жатқан
тұжырымдамалар, қағдаттар мен талаптар жиынтығы. Ең алдымен,
аналитиктерге неліктен деректерге қол жетімділікті арнайы түрде
оңайлату қажет болғанын анықтайық.
Шын мәнінде, талдаушылар — бұл корпоративтік ақпаратты
ерекше тұтынушылар. Олардың міндеті — жалпы деректер
ауқымындағы заңдылықты табу. Сондықтан да талдаушылар жеке
алынған фактіге (мысалы, нақты сатып алушымен жеке тауарды
сату) назар аудармайды. Дерекқордағы жалғыз фактілер мысалға,
иелігінде келісім бар есепші немесе сату бөлімінің басшысын
қызықтыруы мүмкін. Талдаушыға осындай бір жазба аз – оған ай
немесе жыл ішіндегі барлық келісім қажет болуы мүмкін. Сонымен
бірге аналитик оған қажетсіз сатып алушының ЖСН, оның нақты
мекенжайы мен телефон нөмірі секілді егжей-тегжейлікті алып
тастайды.
OLAP технологиясы деректер қоймасы түсінігіне негізделген.
Деректер қоймасының «негізін қалаушы» Билл Инмонмен
тұжырымдалған анықтаманы келтірейік. OLAP— бұл уақытқа
байланысты пәнбағдарлық және басқару шешімдерін қабылдау
үдерісн қолдау үшін өзгертілмейтін деректерді жинау.
Қоймадағы деректер жедел жүйелерден (OLTP) және сыртқы
көздерден – статистикалық есептер, Интернет, прайс-парақтар және
т.б. келіп түседі. (5.8-сурет). Жедел деректер, «тазартылады»,
173
5.8-сур. Ақпараттық-аналитикалы қ жүйе құрылымы
Біріктіреді және реляциялық қоймада сақталады. Сонымен бірге,
олар енді талдау үшін қол жетімді және оларды әртүрлі есептерді
құру құралдары арқылы қолдануға болады. Содан кейін деректер
(толықтай немесе ішінара) OLAP-талдауы үшін дайындалады. Олар
арнайы OLAP ДҚ жүктелуі немесе реляциялық қоймада
қалдырылуы мүмкін. Ақпараттық-аналитикалық жүйенің маңызды
элементі метадеректер болып табылады, яғни деректер құрылымы,
орналасуы және тасымалдануы. Метадеректер арқылы әртүрлі
қойма компоненттерінің тиімді іс-әрекеті қамтамасыз етіледі.
Мынадай сұрақ туындайды —егер қажетті деректер жедел
жүйелерде файлдар әлдеқашан болған жағдайда, көрінеу артық
ақпараттан тұратын деректер қоймасын не үшін құру керек? Тағы
да бірнеше жыл бұын басты себеп ретінде дерек қоймасындағы
пішімдердің
айырмашылығын,
олардың
шашыраңқылығын,
корпоративтік желінің әртүрлі орындарында шектеуді атады.
Шыныменде, бұрын барлық деректерді орталық серверде сақтау ірі
кәсіпорын үшін сирек құбылыс болды. Қазір біріктірілген
корпоративтік
ақпараттық
жүйелерді
қарқынды
енгізуге
байланысты жағдай өзгерді. Бірақ деректер қоймасын құру
қажеттілігінің түбегейлі үш себебі қалып отыр. Біріншіден, жедел
деректерге қатысты күрделі аналитикалық сұраныстар сервердің
ресурстарын «алып қояды» және ақпараттық жүйенің жұмысын,
деректер кестесін ұзаққа бұғаттай отырып тежейді. Екіншіден,
жедел деректер тікелей күрделі талдау үшін жарамсыз. Үшіндіден,
OLTP жүйесі, деректерді жедел өңдеу үшін арналған, сондықтан да
олар ақпараттарды ұзақ уақыт бойы сақтауға бейімделмеген, сол
174
мезетте OLAP үшін нысанды көп жылдық және көп аспектілік
талдау қызықты.
Сонымен, OLAP, қолайлы жылдам әрекет ететін қол жетімділік
құралдарын, іскерлік ақпараттарды қарау және талдауды қолдана
отырып, қарапайым, түсінікті құрылымда талдау үшін «шикізатты»
ұсынады. Дәстүрлі есептер, тіпті бірыңғай қоймаға негізінде
құрылған, орнықтылықтан айрылған. Оларды деректерді қалауында
ұсыну үшін «айналдыруға», «жазуға» немемесе «бүктеуге»
болмайды. OLAP қоймада жинақталған деректерді көп өлшемді
талдау үшін қолайлы құрал болып табылады.
OLAP негізінде қолданушының өзімен, көп өлшемді текше
(гипермәтінге) түрінде ұйымдастырылған деректерді көрнекі үлгісі
жатыр. Көп өлшемді координат жүйесінің осі талданатын бизнес-
үдерістің өлшеу (Dimensions)— атрибуттары қолданылады.
Мысалы, сату үшін бұл тауар түрі, аймағы, контрагенті болуы
мүмкін. Өлшем түрлерінің бірі ретінде уақыт қолданылады. Бизнес-
үдерістерін санмен сипаттайтын деректер өлшемдер (Measures) деп
аталады. Бұл сандық немесе ақша түріндегі сату көлемі, қоймадағы
тауарлық қалдықтар, шығындар және т.б. болуы мүмкін.
Қолданушы шынайы, интуициялық түсінікті деректер үлгісін алады.
Ақпаратты талдай келе, ол текшенгі әртүрлі бағыттар бойынша
«кесуі» мүмкін. Бұл бизнес-үдеріс туралы жиынтық және егжей-
тегжейлі мәлімет алуға және талдау кезінде қолданушының басына
келетін басқа да айла-шарғыларды жүзеге асыруға мүмкіндік береді.
5.9-суретте бейнеленген, үш өлшемді текше өлшемі ретінде сату
сомасы, ал өлшеу ретінде-уақыт, тауар мен қойма қолданылған.
Өлшеу белгілі топтастыру деңгейлерінде ұсынылған: тауарлар
түрлеріне қарай, ал операцияларды жасау уақытына қарай деректер-
айлар бойынша топтастырылған. Кейінірек біз топтастыру
деңгейлерін (иерархиялар) толығырақ қарастыратын боламыз.
Шын мәнінде, математикалық текше тұрғысынан, осындай
ауқым үнемі бола бермейді: нағыз текшеде барлық өлшемдер
бойынша элементтер саны бірдей болуыы қажет, ал OLAP текшеде
мұндай шектеулер жоқ. Әйткенмен, осы бөлшектерге қарамастан,
«OLAP текшесі» термині, өзінің ықшамдылығы мен бейнелігіне
қарай жалпыға ортақ қабылданды. OLAP текшесінің үш өлшемді
болуы мүлде міндетті емес. Ол бір және шешілетін мінгдеттер қарай
- көп өлшемді бола алады. Ерекше сыналған аналитиктерге дәл осы
мөлшер үшін 20 –ға жуық өлшем және салмақты OLAP-өнімдері
қажет болуы және есептелуі мүмкін. Анағұрлым қарапайы үстел
қосымшалары үшін 6-ға жуық өлшем қолданылады.
Алайда, текше өзі талдау үшін жарамсыз. Тіпті үш өлшемді
текшені компьютер экранында, қызықтыратын өлшемдер көрінуі
үшін көрсету күрделі. Үштен артық өлшеу көлемі бар текшелер
туралы не айтуға болады? Текшеде сақталатын деректерді көзбен
шамалау үшін, әдетте күрделі иерархиялық жолдар мен бағагндар
175
атауы бар үйреншікті екі өлшемді кестемен көрсетуді қолданады.
5.9-сурет.OLAP-кубының мысалы
Бұл операция бейнелі түрде текшені «резервтеу» деп аталады.
Талдаушы оны алып, текше өлшемін оны қызықтыратын
өлшемдерге «кеседі». Бұл тәсілмен талдаушы текшенің екі
өлшемдіқиығын алады және сонымен жұмыс істейді. Шамамен
солай орман кесушілер арамен кесілген жылдық сақиналарды
есептейді. Сәйкесінше, кестенің өлшеу саны бойынша«кесілмеген»
екі өлшем қалады.
OLAP анықтаушы қағидатын 1993жылы Э.Кодпен-реляциялық
ДҚ «ойлап табушымен» құрастырылды. Кейінірек, оның
анықтамасы, OLAP –қосымшасы бөлетін көп өлшемді
ақпараттарды жылдам талдау мүмкіндігін ұсынуы үшін, FASMI деп
аталатын тестер қайта жасалды. FASMI аббревиатурасының
мағынасын ашайық:
—
Fast (жылдам) — талдау ақпараттың барлық аспектілері
бойынша бірдей жылдам жүргізілуі қажет. Қолайлы жауап беру
уақыты — 5 с немесе одан кем;
—
Analysis (талдау) —әзірлеушімен алдын ала белгіленген
қосымшалар немесе қолданушымен ерікті түрде анықталған
сандық және статистикалық талдаудың негізгі түрлерін жүзеге
асыру қажет;
—
Shared (бөлінетін) — көптеген қолданушылар деректерге қол
жеткізуі, сонымен бірге құпия ақпарттарға қол жетімділікті
бақылау қажет;
—
Multidimensional
(көп
өлшемді)
—
негізгі
OLAP
сипаттамасы;
—
Information (ақпарат) — қосымша кез келген ақпаратқа, оның
көлемі мен сақтау орнына қарамастан жүгіну мүмкіндігі болуы
176
қажет.
OLAP-жүйелерімен жұмыс төмендегі сипатталған екі сызба
негізінде құрылуы қажет.
1.
Үстел қосымшасында кіріктірілген, OLAP-құралдары «жеңіл»
қолдану үшін жарамды. Осындай құралдар, әдетте, көптеген
шектеулерге ие: бөлшек санына, қол жетімді иерархияға және
т.б. Осыған ұқсас құралдарға, мысалы, MicrosoftExcel
текшелермен жұмыс істеуге мүмкіндік беретін PivotTable
үлгілері жатады. PivotTable MicrosoftOfficeс құрамына кіреді,
кіршіксіз уақыттар мен таяк уақытқа дейін оның құрамындағы
жалғыз OLAP-өнімі болды. Бұл жағдайда, деректер клиент-
үлгімен реляциялық ДБЖ тікелей шығарылады.
2.
«Қиын» жағдайларда екі сатылы «тұтынушы-сервер»
сызбасын қолданады. Сервер, ДБЖ ақпараттарды және
текшелерді құруға қажетті нәрселерді тікелей шығаруды
қамтамасыз етеді. Мамандандырлылған қосымша-тұтынушы
текшелерді қолайлы (ал ең бастысы-тиімді) көру және сол
аналитикалық заңдылықтарды анықтау үшін арналған.
Microsoft
өнімдер
сызғышындағы
серверлік
бөлімі
MicrosoftAnalysisServices
өнімдермен
берілген,
ол
MSSQLServer құрамына кіреді. Салыстырмалы түрде жақында
MSOffice құрамына MicrosoftDataAnalyzer атауымен OLAP-
тұтынушысы кірді.
Ресейлік OLAP технологиясын әзірлеумен бірнеше компания
айналысады. Танымал өнім —фирма жиегінің аналитикалық
InterSoftLab тұғырнамасы. «Галактика» Zoom жүйесі Галактика
үлгісі үлкен танымалдыққа ие. Осы бағдарламалық өнімдердің
халықаралық түрде мойындалғандығын және баға мен сапаның
тартымды үйлесуінің арқасында OLAP-өнімдердің батыс
нарығында өз тауашасына ие болғандығын атап өтейік.
ERP-жүйесінде «кіріктірілген OLAP-талдаушыларының» болуы
жақын
жылдарда
біріктірілген
корпоративтік
ақпараттық
жүйелердің маңзды бәсекелестік артықшылықтары болмақ.
Достарыңызбен бөлісу: |