ауа-райы бұлтты болған кезде ойнау ықтималдығын есептеу үшін оларды негізгі формуламызға қайтара аламыз.
P(Yes | Overcast) = 0.44 * 0.64 / 0.29 = 0.98
Ойнамау ықтималдығы :
Сол сияқты, бұлтты ауа-райында ешқандай спортпен айналыспау ықтималдығын есептей аламыз.
Алдымен, алдыңғы ықтималдықтарды есептейік.
P(Overcast) = 4/14 = 0.29
P(No)= 5/14 = 0.36
Келесі қадам артқы ықтималдықты есептеу болып табылады, ол:
P(Overcast | No) = 0/5 = 0
Бұл ықтималдықтарды негізгі формулаға қою арқылы біз мынаны аламыз:
P(No | Overcast) = 0 * 0.36 / 0.29 = 0
Класстың ықтималдығы жоғары екенін көреміз Playing,
сондықтан ауа-райы болса, Overcastойыншылар спортпен айналысады.
K-En Nearest Neighbor(KNN) машиналық оқыту алгоритмі
K-En Nearest Neighbor - бақыланатын оқыту әдісіне негізделген машиналық оқытудың қарапайым алгоритмдерінің бірі.
K-NN алгоритмі жаңа жағдай/деректер мен қолжетімді істер арасындағы ұқсастықты болжайды және жаңа істі қолжетімді санаттарға ең ұқсас санатқа қояды.
K-NN алгоритмі барлық қолда бар деректерді сақтайды және ұқсастық негізінде жаңа деректер нүктесін жіктейді. Бұл жаңа деректер пайда болған кезде оны K-NN алгоритмі арқылы ұңғымалар жиынтығы санатына оңай жіктеуге болады дегенді білдіреді.
K-NN алгоритмін регрессия үшін де, классификациялау үшін де қолдануға болады, бірақ ол негізінен Классификация есептері үшін қолданылады.
K-NN параметрлік емес алгоритм болып табылады , яғни ол негізгі деректерге ешқандай жорамал жасамайды.
Ол сондай-ақ жалқау оқушы алгоритмі деп аталады, өйткені ол оқу жинағынан бірден үйренбейді, оның орнына деректер жиынын сақтайды және жіктеу кезінде деректер жиынында әрекетті орындайды.
Жаттығу кезеңіндегі KNN алгоритмі жай ғана деректер жинағын сақтайды және ол жаңа деректерді алған кезде, ол деректерді жаңа деректерге ұқсас санатқа жіктейді.
K-NN қалай жұмыс істейді?
K-NN жұмысын төмендегі алгоритм негізінде түсіндіруге болады:
1-қадам: Көршілердің K санын таңдаңыз
2-қадам: Көршілердің K санының евклидтік қашықтығын есептеңіз
3-қадам: Евклидтік қашықтыққа сәйкес ең жақын көршілерді алыңыз.
4-қадам: Осы k көршілердің арасында әр санаттағы деректер нүктелерінің санын есептеңіз.
5-қадам: Көршінің саны ең көп болатын санатқа жаңа деректер нүктелерін тағайындаңыз.
6-қадам: Біздің модель дайын.