№9 практикалық сабақ
Деректер қоймаларын ұйымдастыру және оларды кешенді көпөлшемді талдау технологиялары
Жұмыстың мақсаты: OLAP көпөлшемді деректерді талдау технологиясының терминдерімен және ұғымдарымен танысу. Microsoft Analysis Services data transformation services OLAP сервері арқылы деректер қоймаларын құру және толтыру.
OLAP көпөлшемді деректерді талдау технологиялары.
Қысқаша теориялық ақпарат
Бұл үшін қажетті ақпаратсыз, әдетте сандық ақпаратсыз кез-келген басқару шешімін қабылдау мүмкін емес. Ол үшін деректер қоймаларын (data warehouses) құру қажет, яғни статистикалық талдау үшін пайдаланушыларға алынған ақпаратты беру (және көбінесе аналитикалық есептер жасау) мақсатында деректерді жинау, електен өткізу және алдын ала өңдеу процесі.
Әдеттегі деректер қоймасы әдеттегі реляциялық мәліметтер базасынан өзгеше болады. Біріншіден, кәдімгі дерекқорлар пайдаланушыларға күнделікті жұмысты орындауға көмектесу үшін жасалған, ал деректер қоймалары шешім қабылдауға арналған. Мысалы, тауарды сату және шот — фактураны жазу транзакцияларды өңдеуге арналған дерекқорды пайдалану арқылы жүзеге асырылады, ал жеткізушілермен жұмысты жоспарлауға мүмкіндік беретін бірнеше жылдық сату динамикасын талдау деректер қоймасы арқылы жүзеге асырылады. Екіншіден, әдеттегі мәліметтер базасы пайдаланушылардың жұмыс процесінде үнемі өзгеріп отырады және деректер қоймасы салыстырмалы түрде тұрақты: ондағы деректер әдетте кестеге сәйкес жаңартылады (мысалы, апта сайын, күнделікті немесе сағат сайын — қажеттілікке байланысты). Ең дұрысы, толтыру процесі-бұл қоймадағы бұрынғы ақпаратты өзгертпестен белгілі бір уақыт аралығында жаңа деректерді қосу. Үшіншіден, әдеттегі мәліметтер базасы көбінесе қоймаға түсетін мәліметтер көзі болып табылады. Сонымен қатар, қойма статистикалық есептер сияқты сыртқы көздермен толықтырылуы мүмкін.
Шешімдерді қолдау жүйелері, әдетте, пайдаланушыға қабылдауға және талдауға ыңғайлы түрде бастапқы жиынтықтан алынған әртүрлі үлгілер үшін жиынтық деректерді беру құралдарына ие. Әдетте, мұндай агрегаттық функциялар осьтерінде параметрлер бар көп өлшемді (демек, реляциялық емес) деректер жиынтығын құрайды (көбінесе гиперкуб немесе метакуб деп аталады), ал ұяшықтар-оларға тәуелді агрегаттық деректер-және мұндай деректер реляциялық кестелерде сақталуы мүмкін,бірақ бұл жағдайда біз логикалық деректерді ұйымдастыру туралы айтамыз, оларды сақтауды физикалық іске асыру туралы емес). Әр ось бойымен деректерді иерархия түрінде ұйымдастыруға болады, бұл олардың егжей-тегжейінің әртүрлі деңгейлерін білдіреді. Осы деректер моделінің арқасында пайдаланушылар күрделі сұрауларды тұжырымдай алады, есептер шығарады, мәліметтер жиынтығын ала алады.
Деректерді кешенді көпөлшемді талдау технологиясы OLAP (lline Analytical Processing) деп аталды. OLAP-бұл деректерді сақтауды ұйымдастырудың негізгі компоненті. OLAP функционалдығын кеңсе қосымшаларындағы Деректерді талдаудың қарапайым құралдарынан бастап, серверлік өнімдерге негізделген таратылған аналитикалық жүйелерге дейін әртүрлі тәсілдермен жүзеге асыруға болады.
Көп өлшемді текшелер
OLAP принциптерін көрсету үшін қолданатын реляциялық Дерекқордың мысалы ретінде біз Microsoft SQL Server немесе Microsoft Access жеткізілім жиынтығына кіретін және азық-түлікті көтерме жеткізумен айналысатын компанияның сауда операциялары туралы мәліметтерді сақтайтын типтік дерекқор болып табылатын Northwind дерекқорын қолданамыз. Мұндай деректерге жеткізушілер, клиенттер, жеткізуді жүзеге асыратын компаниялар туралы мәліметтер, жеткізілетін тауарлар мен олардың санаттарының тізімі, тапсырыстар мен тапсырыс берілген тауарлар туралы мәліметтер, компания қызметкерлерінің тізімі жатады. Northwind дерекқорының толық сипаттамасын Microsoft SQL Server немесе Microsoft Access анықтамалық жүйелерінен табуға болады.
OLAP тұжырымдамасын қарастыру үшін біз Northwind дерекқорынан Invoices көрінісін және өнімдер мен Санаттар кестелерін қолданамыз, нәтижесінде тапсырыс берілген барлық тауарлар мен жазылған шоттар туралы толық ақпарат аламыз: Access 2000-да бұл сұраныс келесідей: