Талдау және эксперименттер
Болжалды модель құру– негізгі айнымалылар, машиналық оқыту алгоритмдері, болжалды айнымалылар және таңдау критерийлері туралы бірнеше шешім қабылданатын процесс. Әр түрлі моделдік сипаттамалардың комбинациялық мүмкіндіктеріне байланысты әр түрлі мүмкін болатын болжамды модель сипаттамаларының толық тізімін бағалауға болады [8].
Болжалды модель құру кезінде Python жоғары деңгейлі әмбебап бағдарламалау тілінің процедурасы келесі процесті қамтамасыз етеді:
Деректер жинағын дайындау және Data Mining технологиясын таңдау.
Өңделмеген деректерді өңдеу.
Нормализация функциясын пайдаланып, деректерді қалыпқа келтіру.
Машиналық оқыту әдістерімен классификациялау (кросс-валидация, оптимизация параметрлерін пайдалану).
Болжамды модель құру.
Құрылған моделін және талдау нәтижесін шығару
Жүрке ауруының болжамдық моделін құруда алға қойылған мақсат пен тиімді нәтижелерге жету үшін Pythonбағдарламалау тілінде жүзеге асырылған.Талдау жүргізу үшін ақпарат көзі ретінде мен kaggle сайттан " Жүрек ауруы” деген деректер тізбегін пайдаландым [11]. Алынған деректер тізбегі 14 атрибут пен 303 айнымалылар кіреді (6 және 7 -сурет).
2.1 сурет. Деректер тізбегін жүктеу
Деректер тізбегін зерттеу
Мұнда мақсат осы зерттеу жұмсына пайдаланылған деректер тізбегі туралы көбірек білу және талдау жасауға керектінегізгі деректерді жинау үшін экспорт нысанын анықтау.
2.2 сурет. Деректер тізбегінің құрылымы
Төмендегі талдау нәтижесіне қарай отырып, мынадай қорытындыға келуге болады. Алынған деректер тізбегінде жүрек аурулары бар 165 адам және жүрек аурулары жоқ 138 адам бар,осы арқылы негізгі талдау жасалынатын негізгі мәселе айқындалды.
2.3 сурет. Жүрек ауры бар адамдардың салыстырмалы диаграммасы
Сондай-ақ қолданылған деректер тізбегіндегі әр атрибутқа жеке жеке талдау жасалынды.Нәтижесі төменде көрсетілгендей:
cp {кеуде ауруы}: 1, 2, 3 тең cp бар адамдар 0-ге тең CP бар адамдарға қарағанда жүрек ауруларына бейім.
restecg {тыныштықтың электрокардиографиялық нәтижелері}: 1 мәні бар адамдар (қалыпты емес жүрек соғуын білдіреді, жеңіл симптомдардан ауыр симптомдарға дейін өзгеруі мүмкін) жүрек ауруларына бейім.
exang {дене жаттығуларынан туындаған стенокардия}: 0 мәні бар адамдар 1 мәні бар адамдарға қарағанда жүрек аурулары көп болады.
Slope {st жаттығу сегментінің еңкіштігі}: 2-ге тең (төмендеу еңкіштігі: сау жүрек белгілері) еңкіштігі бар адамдар 0-ге тең (төмендеу еңкіштігі: физикалық жүктеме кезінде жүрек жиілігінің еңкіштігі) немесе 1-ге (тегіс еңкіштігі: ең төмен өзгеріс (қалыпты сау жүрек)).
ca {флуороскопиямен боялған ірі тамырлардың саны (0-3)}: қан қозғалысы көп болған сайын, соғұрлым жақсы, сондықтан 0 тең ca бар адамдар жүрек ауруларына бейім.
thal {thalium stress result}: 2-ге тең thal мәні бар адамдар (бекітілген ақау: бұрын ақау болды, бірақ енді бәрі дұрыс), жүрек ауруларына бейім.
trestbps : тыныштық қан қысымы (мм рт. ст. ауруханаға түскен кезде) 130-140-тан жоғары бәрі, әдетте, алаңдаушылық тудырады.
chol {мг / дл Сарысу холестерол}: 200-ден жоғары болса алаңдаушылық тудырады.
thalach {жүрек жиырылуының ең жоғары қол жеткізілген жиілігі}: ең жоғары 140-тан астам, жүрек ауруларына бейім адамдар.
oldpeak (ST) тыныштыққа қатысты физикалық жаттығулар туындаған депрессия, жаттығу кезінде жүрек стрессін қарайды, сау емес жүрек көп күш салады.
2.4 сурет . Әр атрибутқа таладу жасаудың нәтижесі
Достарыңызбен бөлісу: |