K ең жақын көршілер. Ағаш үлгілері. Статистикалық Машиналық оқыту



бет1/9
Дата18.11.2022
өлшемі1,63 Mb.
#51167
  1   2   3   4   5   6   7   8   9
Байланысты:
12-дәріс (1)


K - Ең жақын көршілер. Ағаш үлгілері.
Статистикалық Машиналық оқыту
Статистикадағы соңғы жетістіктер болжамды модельдеу — регрессия және жіктеу саласындағы неғұрлым қуатты автоматтандырылған әдістерді әзірлеуге арналды. Бұл әдістер статистикалық машиналық оқытудың неғұрлым жалпы әдіснамасының ажырамас бөлігі болып табылады және классикалық статистикалық әдістерден ерекшеленеді, өйткені олар деректермен басқарылады және деректерді сызықтық немесе басқа жалпы функциямен сипаттауға ұмтылмайды. Мысалы, ең жақын sose - dei әдісі өте қарапайым: ол жазбаны жазбалардың қаншалықты ұқсас екендігіне қарай жіктейді. Шешім ағаштарына қатысты ансамбльдік оқытуға сүйенудің ең сәтті және кеңінен қолданылатын әдістері. Ансамбльдік оқытудың негізгі идеясы-болжамды қалыптастыру үшін бір модельге қарағанда көптеген модельдерді қолдану. Шешім ағаштары-болжамды айнымалылар мен нәтиже айнымалылары арасындағы байланыстар туралы ережелерді үйренуге арналған икемді және автоматты әдіс. Ансамбльдік оқытудың шешім ағаштарымен үйлесуі болжамды модельдеудің жоғары нәтижелі стандартты әдістеріне әкеледі екен.
K- жақын көршілер
Жақын көршілердің K әдісі (KNN, ағылш. k-nearest neighbors) өте қарапайым идея 1. Жіктелетін немесе болжанатын әрбір жазба үшін: 1. Табу K ұқсас белгілері бар жазбалар (яғни, дикторларға дейінгі мәндер ұқсас). 2. Жіктеу үшін: осы ұқсас жазбалардың арасынан мажоритарлық сыныпты анықтап, осы сыныпты жаңа жазбаға тағайындаңыз. 3. Болжау үшін (KNN регрессиясы деп те аталады): осы ұқсас жазбалардың арасынан орташа мәнді тауып, жаңа жазбаның орташа мәнін болжаңыз.
Негізгі терминдер:

  • Көрші (көрші) -болжалды мәндері басқа жазбаға ұқсас жазба.

  • Қашықтықтың метрикалық көрсеткіштері (қашықтық метрикасы)-бір жазбаның екіншісінен қаншалықты алыс екенін бір санмен қорытындылайтын метрикалық көрсеткіштер.

  • Стандарттау (стандарттау)- орташа мәнді алып тастап, стандартты ауытқуға бөліңіз.

Синоним: қалыпқа келтіруz-бағалау (z-score) стандарттаудан кейін алынған мән.
Синоним: стандартты бағалау.

  • K - Жақын көршілердің алгоритмін есептеу кезінде ескерілетін көршілердің саны

KNN-болжаудың / жіктеудің қарапайым әдістерінің бірі: сәйкес келетін модель (регрессиядағыдай) жоқ. Бұл KNN пайдалану Автоматты процедура дегенді білдірмейді. Болжау нәтижелері белгілердің қалай талданғанына, ұқсастықтың қалай өлшенгеніне және K шамасы қандай болатынына байланысты. сонымен қатар, барлық болжаушылар сандық түрде болуы керек. Біз осы әдістің жұмысын жіктеу мысалымен суреттейміз.



Достарыңызбен бөлісу:
  1   2   3   4   5   6   7   8   9




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет