K ең жақын көршілер. Ағаш үлгілері. Статистикалық Машиналық оқыту



бет6/9
Дата18.11.2022
өлшемі1,63 Mb.
#51167
1   2   3   4   5   6   7   8   9
Қарапайым мысал
R - де ағаш тәрізді сәндеуге арналған екі негізгі бағдарламалық пакет бар — lei-rpart және tree. Rpart пакетінің көмегімен модель payment_inc_ratio және borrower_score айнымалыларын қолдана отырып, кемелер туралы 3000 жазбаның үлгісіне бейімделеді


library(rpart)
loan_tree <- rpart(outcome ~ borrower_score + payment_inc_ratio, data=loan_data, control = rpart.control(cp=.005))
plot(loan_tree, uniform=TRUE, margin=.05)
text(loan_tree)

Алынған ағаш 6.3-суретте көрсетілген. 6.3. Бұл жіктеу ережелері иерархиялық ағашты айналып өтіп, тамырдан бастап, жапырақ тигенше орнатылады.





6.3.-сурет. Несие деректеріне сәйкес келетін қарапайым
ағаш үлгісінің ережелері

Әдетте, ағаш төңкеріліп көрсетіледі, осылайша тамыр жоғарғы жағында, ал жапырақтары төменгі жағында болады. Мысалы, егер біз қарыз алушының borrower_score ұпайы 0,6-ға тең және төлемдер мен payment inc_ratio кірісінің коэффициенті 8,0-ге тең несие алсақ, онда біз сол жақтағы параққа келеміз және несие өтеледі деп болжаймыз.


Ағаштың құрылымдық басып шығарылған нұсқасын жасау да қиын емес:
loan_tree
n= 3000
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 3000 1467 paid off (0.5110000 0.4890000)
2) borrower_score>=0.525 1283 474 paid off (0.6305534 0.3694466)
4) payment_inc_ratio< 8.772305 845 249 paid off (0.7053254 0.2946746) *
5) payment_inc_ratio>=8.772305 438 213 default (0.4863014 0.5136986)
10) borrower_score>=0.625 149 60 paid off (0.5973154 0.4026846) *
11) borrower_score< 0.625 289 124 default (0.4290657 0.5709343) *
3) borrower_score< 0.525 1717 724 default (0.4216657 0.5783343)
6) payment_inc_ratio< 9.73236 1082 517 default (0.4778189 0.5221811)
12) borrower_score>=0.375 784 384 paid off (0.5102041 0.4897959) *
13) borrower_score< 0.375 298 117 default (0.3926174 0.6073826) *
7) payment_inc_ratio>=9.73236 635 207 default (0.3259843 0.6740157) *

Ағаштың тереңдігі шегініспен көрсетілген. Әрбір түйін берілген сегменттегі басым нәтижемен анықталған алдын ала жіктеуге сәйкес келеді. "Теру" - бұл сегменттегі алдын-ала жіктеу нәтижесінде пайда болатын қате жіктеу нәтижелерінің саны. Мысалы, 2-түйінде 1467 жазбаның жалпы санынан 474 қате жіктеу нәтижелері болды. Жақшадағы мәндер сәйкесінше өтелген және қайтарылмайтын кемелер туралы жазбалардың үлесін білдіреді. Мысалы, қайтарылмауды болжайтын 13-түйінде жазбалардың 60% — дан астамы қайтарылмайтын несиелер болып табылады.






Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет