Ақпараттық-коммуникациялық технологиялар


Data Mining әдістері мен кезеңдері



Pdf көрінісі
бет33/72
Дата10.12.2023
өлшемі2,18 Mb.
#136232
1   ...   29   30   31   32   33   34   35   36   ...   72
 
6.4 Data Mining әдістері мен кезеңдері 
Деректерді интеллектуалды талдау әдісі (Data Mining) үш топқа 
бөлінеді:

іздеу тәуелділіктері (discovery),

болжау (predictive modelling),

ауытқулар талдауы. 
Іздеу тәуелділігі
автоматты түрде деректерді анықтау үшін деректер 
базасының қарап шығуында тұрады. Мұндағы мәселе деректер 
базасындаы өте маңызды тәуелділіктерді іріктеуде жатыр. 
Болжау
пайдаланушы жазу жүйесіне бос өрісті ұсынып, жеткіліксіз мәндерді 
сұрайды деп болжайды. Жүйе дерекқор мазмұнын өзі талдап, бұл 
мәндерге шындыққа ұқсас болжам жасай алады. 
Ауытқулар талдауы

тұрақты тәуелділіктен қатты ауытқитын күдікті деректерді іздеу процесі. 
Деректерді интеллектуалды талдау технологиясы математикалық 
статистика әдістері мен ықтималдылық теориясы сонымен қатар 
жасанды интеллект әдісіне қатысты есептерді шешуге көмектеседі. 
Көп таратулар келесі тапсырмаларды шешетін пайдалану әдістерін 
тапты: 

Жіктеу (классификация) - обьектіні (іс-шара, нысан) алдын-ала 
белгілі сиппаттамасына қарай класстардың біріне жіктеу. 


76 

Регрессия - кіру параметрлерін теру арқылы обьектінің шығу 
параметрлерінің мәнін болжау. 

Кластеризация - обьектіні кластерге (тәуелсіз топтар) топтастыру 
болып табылады. Бұл мәселенің шешімі деректерді жақсы түсінуге 
көмектеседі. 

Ассоциациялық іздеу ережесі - кез келген байланысты обьектілер 
арасындағы заңдылықтарды анықтау. Бұл мәселенің шешімі талданатын 
деректердің табиғатын түсінуге және оқиғалардың пайда болуын 
болжауға көмектеседі. 

Болжам дәйектілігі - ереже түрінде обьектілер немесе оқиғалар 
арасындағы тәуелділікті табу, яғни А оқиғасынан кейін В оқиғасы 
болады. 
Ауытқулардың талдауы - өзіндік емес щаблондарға кіретін деректер 
талдауы. Data Mining-тің басты әдістері ретінде келесілерді бөлу керек: 

Регрессия, дисперсия және корреляциялық талдау; 

Нейронды желі алгоритмдері (бастапқы параметрлері сигнал 
ретінде қарастырылады; талдау нәтижесі барлық жүйенің бастапқы 
параметрлерге дыбыс беруі); 

Шешім ағаштары - (иерархиялық құрылымдар, предикат); 

Сегменттеу алгоритмі (ұқсас оқиғаларды топтарға біріктіруде 
қолданады); 

Шектеулі асып кету алгоритмі қарапайым логикалық оқиғалардың 
жиілік комбинациясын есептейді; 

Эволюциялық әдістер (бастапқыда берілген алгоритмдер негізінде 
деректердің өзара тәуелділігін көрсететін іздеу және туынды 
алгоритмдерді тудыру). 
Data Mining әдістерінің тиімділігі бастапқы деректер санына тікелей 
байланысты. Неғұрлым үлкен көлемде берілген бастапқы статистика 
соғұрлым талдау кезінде тұрақты заңдылықтарды анықтайды. Екі 
технологияны шешім қабылдауда қолдайтын процесстің бір бөлігі 
ретінде қарастыруға болады. Алайда бұл технологиялар әр түрлі 
қозғалады: 
OLAP көп өлшемді деректерге тек қол жетімділікті қамтамасыз етуге 
көңіл бөледі, ал деректерді интеллектуалды талдау әдісі (Data Mining) 
көп қалыпда жалпыланған бір өлшемді кестелермен және реляционды 
деректермен жұмыс істейді. 
Қорытындылай айтқанда, OLAP және Data Mining технологиясында 
ақпараттық-талдау жүйесін құру - бағдарламалық-техникалық құрал-
дармен және үлкен жобаларды орындаудағы тәжірибені талап ететін 
ауыр процесстің бірі болып келеді. Алайда мұндай жүйелерді енгізу 
материалдық тұрғыдан пайданы көрсетеді. Осындай деңгейдегі 
ақпараттық жүйенің маңыздылығы айқын. Оларды кез келген салада 
пайдалану тұтастай құрылымдық бөлімшенің жұмыс тиімділігін 
жақсартуға мүмкіндік береді. 


77 


Достарыңызбен бөлісу:
1   ...   29   30   31   32   33   34   35   36   ...   72




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет