Машиналық оқыту алгоритмі Шешім Ағашының Алгоритмі Классификация - машиналық оқытудың екі кезеңді процессі, оқыту кезеңі және болжау кезеңі. Машиналық оқыту кезеңінде модель берілген деректердіңнегізіндеәзірленеді, алболжамдаукезеңіндемодельберілгендеректергежауапберудіболжауүшінқолданылады. Шешімағашы (Decision Tree)- түсіндіружәнеталдауүшінклассификацияныңеңқарапайымжәнетанымалалгоритмдерініңбірі [6].
Шешімағашыалгоритміжетекшілікететіноқытуалгоритмдерінің
тобынажатады. Оқытудыңбасқабақыланатыналгоритмдеріненайырмашылығы, шешімағашыалгоритмінрегрессияменклассификациямәселелеріншешудеқолдануғаболады. Шешімағашыалгоритмінқолданудыңмақсаты - алдын-алаалынғандеректерденалынғанқарапайымшешімережелерінзерттеуарқылымақсаттыайнымалыныңкласыннемесемәнінболжауғаболатынболжамдымодельқұру.
Шешімағаштарыныңтүрлері:
Шешімағаштарыныңтүрлерідеректерқорындабарайнымалыныңтүріне
негізделген. Олар:
Категориялықөзгермелішешімағашы: мақсаттыайнымалымәнібар
шешімқабылдауағашы, солсебептіолкатегориялықайнымалышешімдерағашыдепаталады.
Үздіксізөзгермелішешімдерағашы: шешімағашыүздіксізмақсатты
айнымалығаиеболады, солсебептіолүздіксізөзгермелішешімағашыдепаталады.
Naive Bayes алгоритмі Naive Bayes алгоритмі – классификациялауғаарналғанесептерді
шығарудың қарапайым машиналық алгоритмі. Ол деректер жиынтығынан жаңа бақылау категориясын (подпопуляциялар) анықтауға көмектеседі. Санаттар есебі туралы деректер жиынтығы негізінде анықталады, олардың құрамына бұрыннан белгілі болған бақылаулар (немесе даналар) кіреді [9].
Naive Bayes алгоритмнің жұмыс жасауы бірнеше қадамнан тұрады. 1
қадамда әр түрлі кластарға қатысты барлық объектілер үшін жиілік кестесін жасайды. 2-қадамда кластарға қатысыты мүмкіндіктер кестесін сызады. 3-қадамда барлық кластар үшін шартты ықтималдылықты есептейді. 4-қадамда есептептің нәтижесін шығарады.
k-nearest neighbors (KNN) k-nearest neighbors (KNN) алгоритмі - классификациялау және
регрессия мәселелерін шешуде қолданылатын қарапайым, оңай басқарылатын машиналық оқыту алгоритмі.
k-nearest neighbors (KNN) алгоритмнің артылқшылығы:
Алгоритмді іске асыру оңай және ыңғайлы.
Модель құру, бірнеше параметрлерді теңшеу немесе қосымша болжам жасау қажет емес.
Алгоритмәмбебапболыптабылады, оныклассфикациялау, регрессияжәнедеректерді іздеу үшінпайдалануғаболады.
k-nearest neighbors (KNN) алгоритмнің кемшілігі:
KNN- нің негізгі кемшілігі: деректер көлемінің артуына қарайжұмыс жасау жылдамдығы айтарлықтайбаяулайды, болжамды моделді тез жасау керке болған ортада бұл алгоритмді пайдалану тиімсіз. Сонымен қатар, классификациялау мен регрессияның нақтынәтижелерін беру жылдамдығы жағынан басқа алгоритмдермен салыстырғанда жұмыс өнімділігі төмен.