Денсаулық сақтау саласындағы Data Mining технологиялары
Пациенттердің ауру белгілері мен жазбалары функция ретінде пайдаланылуы мүмкін және мұндай ауқымды деректер көлемі денсаулық сақтау саласындағы білімді анықтау үшін пайдаланылуы мүмкін. Медицина саласындағы Data Mining үшін ұсынылған жалпыағымдық тұжырымдамасы 6 суретте көрсетілген . Мұнда нақты медициналық мәселелерден басталады, онда деректер жиыны алдын ала өңделуі және деректерді Data Mining талдаудың алдында деректерді болжалды талдаудың қол жетімді құралдарының бірін пайдалана отырып тазартылуы тиіс. Білімді бағалау ақыр соңында келеді, және медициналық саладағы тәжірибе қамтылады.
1.6 сурет. Медициналық Data Mining ағымдық тұжырымдама
1.3 Data Mining моделдеу және өңдеу тәсілдері
Модель құру- Деректерді зияткерлік талдаудың толық процесі (Data Mining) бірнеше кезеңнен тұрады: жобаның мақсаттарын және деректерді түсінуден бастап түпкілікті талдау негізінде процестің өзгерістерін іске асыруға дейінгі кезеңдер қамтылады.Үш негізгі есептеу қадамы- бұл моделді оқыту процесі, моделді бағалау және моделді пайдалану. Бөлу деректерді классификациялаумен нақты байланысты. Моделді оқыту бір алгоритм топ (немесе класс) атрибуты белгілі деректерге, деректерден алынған классификация немесе алгоритм құру үшін қолданылады.Содан кейін классификатор белгілі атрибуттары бар деректерді қамтитын тәуелсіз бағалау жиынтығының көмегімен тестіленеді. Моделдің классификациясы мақсатты атрибутқа арналған белгілі класспен келісілетін дәреже, содан кейін моделдің күтілетін дәлдігін анықтау үшін пайдаланылуы мүмкін. Егер модель жеткілікті нақты болса, оны мақсатты атрибут белгісіз деректерді жіктеу үшін пайдалануға болады.
Data Mining –ның үздік қолданыстағы технологиялары
Data Mining - бұл жаңа ақпарат алу үшін үлкен ақпарат банктерін талдау процесі. Интуитивті деректерді "зияткерлік талдау" жаңа деректерді алуға қатысты деп ойлауға болады, бірақ бұл олай емес; оның орнына деректерді зияткерлік талдау үлгілердің экстраполяциясына және жиналған деректерден жаңа білімдерге негізделген.
Деректер қорын басқару, статистика және машиналық оқыту саласындағы әдістер мен технологияларға сүйене отырып, деректерді зияткерлік талдау саласындағы мамандар өз мансабын ақпараттың үлкен көлемінен қалай өңдеу және қорытынды жасау керектігін жақсы түсінуге арналған.
Деректерді зияткерлік талдаудың ең негізгі әдістерінің бірі- деректер жиынтықтарындағы өрнектреді тану. Бұл, әдетте, тұрақты уақыт аралығы арқылы орын алатын деректер кейбір аберрация тану, немесе уақыт өте белгілі бір айнымалыны құю және ажырату.
Классификация-бұл әр түрлі санаттарға бірге әр түрлі атрибуттарды жинайтын, одан кейін одан әрі қорытынды алу немесе қандай да бір функцияны орындау үшін пайдалануға болатын деректерді зияткерлік талдаудың күрделі әдісі. Мысалы, егер сіз жеке клиенттердің қаржылық жағдайы мен сатып алу тарихы туралы деректерді бағаласаңыз, оларды "төмен", "орташа" немесе "жоғары" кредиттік тәуекелдер ретінде жіктеуге болады. Содан кейін осы клиенттер туралы көбірек білу үшін осы жіктемелерді пайдалануға болады.
Қауымдастық бақылау өрнектерімен байланысты, бірақ байланысты айнымалы үшін ерекше. Бұл жағдайда басқа оқиғамен немесе атрибутпен қатты күресетін белгілі бір оқиғалар немесе атрибуттарды ізделінеді; мысалы, сіздің клиенттеріңіз белгілі бір тауарды сатып алған кезде байқай аласыз, олар сондай-ақ жиі екінші байланысты тауарды сатып алады. Бұл әдетте интернет-дүкендерде "адамдар, сондай-ақ сатып алды" бөлімдерін толтыру үшін пайдаланылады.
Көптеген жағдайларда жалпы паттернаны қарапайым тану сіздің деректер жиынтығы туралы анық түсінік бере алмайды. Мысалы, егер сатып алушылар тек ерлер ғана дерлік, бірақ шілде айында бір оғаш апта ішінде әйел жынысты сатып алушылар арасында үлкен қалқымалы болса, сіз осы қалқымалы зерттеуге және сіз оны қайталауға немесе үдерісте өз аудиториясын жақсы түсіну үшін не қозғағыңыз келеді.
Кластерлеу жіктеуге өте ұқсас, бірақ олардың ұқсастығы негізінде деректер фрагменттерін топтауды қамтиды. Мысалы, сіз аудиторияның әр түрлі демографиялық сипаттамаларын әртүрлі пакеттерге топтастыра аласыз, олардың қанша табысы бар немесе олар дүкенде сатып алуды қалай жиі жасайды.
Жоспарлау және моделдеу нысаны ретінде қолданылатын регрессия басқа айнымалылардың болуын ескере отырып, белгілі бір айнымалының ықтималдығын анықтау үшін қолданылады. Мысалы, сіз оны белгілі бір бағаны болжау үшін пайдалана аласыз, мысалы, қолжетімділік, тұтынушылық сұраныс және бәсекелестік сияқты басқа факторларға негізделе отырып. Нақты, регрессияның негізгі назары осы деректер жиынтығында екі (немесе одан көп) айнымалы арасындағы нақты өзара байланысты анықтауға көмектесу үшін бағытталған.
Болжау - бұл болашақта көре алатын деректер түрлерін жобалау үшін пайдаланылатын, өйткені деректерді болжаудың ең құнды әдістерінің бірі. Көптеген жағдайларда болашақта не болатынын бірнеше нақты болжам жасау үшін тарихи үрдістерді тану және түсіну жеткілікті. Мысалы, сіз алдын ала болжауға тұтынушылар несие тарихын және өткен сатып алуды көре аласыз, олар болашақта кредиттік тәуекел болады.
Достарыңызбен бөлісу: |