K ең жақын көршілер. Ағаш үлгілері. Статистикалық Машиналық оқыту



бет9/9
Дата18.11.2022
өлшемі1,63 Mb.
#51167
1   2   3   4   5   6   7   8   9
Байланысты:
12-дәріс (1)

Үздіксіз шаманы болжау
Ағашқа негізделген үздіксіз шаманы болжау (яғни регрессия) бірдей логика мен процедураны ұстанады, тек әр Ішкі сегменттегі орташа квадраттық ауытқулармен (квадраттық қателіктермен) өлшенетін гетерогенділік және болжамды өнімділік орташа квадраттық қатенің квадрат түбірімен бағаланады (RMSE)


Ағаштар қалай қолданылады

Ұйымдардағы MO - deley әзірлеушілерінің ең үлкен кедергілерінің бірі-олар қолданатын әдістерге жататын "қара жәшік" құбылысы, бұл ұйымның басқа элементтерінің қарсылығына негіз береді. Осыған байланысты ағаш үлгісінің екі тартымды аспектісі бар.


Ағаш модельдері қандай айнымалылардың маңызды екендігі және олардың бір - бірімен байланысы туралы түсінік алу үшін деректерді тексерудің көрнекі құралын ұсынады. Ағаштар дикторға дейінгі айнымалылар арасында сызықтық емес байланыстарды түсіре алады.
Ағаш модельдері деректерді терең талдау жобасын жүзеге асыру немесе "сату" үшін қарапайым адамдарға тиімді түрде берілуі мүмкін ережелер жиынтығын ұсынады. Алайда, болжамға келетін болсақ, бірнеше ағаштардың нәтижелерін пайдалану бір ағашты пайдаланудан гөрі тиімдірек болады. Атап айтқанда, кездейсоқ орман мен бустер ағаштарының алгоритмдері әрқашан дерлік болжамды дәлдік пен тиімділіктен асып түседі (бөлімді қараңыз. "Бэггинг және кездейсоқ орман" және "Бустинг" осы тарауда), бірақ жоғарыда аталған жалғыз ағаш үшін мыжылған артықшылықтар жоғалады.


Ағаш модельдеріне арналған негізгі идеялар:

  • Шешім ағаштары жіктеу немесе болжау ережелерінің жиынтығын тудырады.

  • Ережелер деректердің дәйекті сегменттерге бөлінуіне сәйкес келеді.

  • Әрбір сегмент немесе бөлу дикторға дейінгі айнымалының белгілі бір мәнімен байланысты және деректерді осы предикатордың мәні бөлу нүктесіндегі мәннен жоғары немесе төмен болатын жазбаларға бөледі.

  • Әр кезеңде ағаш алгоритмі әр Ішкі сегменттегі нәтиженің гетерогенділігін азайтатын бөлу нүктесін таңдайды.

  • Әрі қарай бөлу мүмкін болмаған кезде, ағаш толығымен өсірілген болып саналады және әрбір терминал түйінінде немесе жапырақта бір класс бар; осы Ережелер (бөлу) жолымен жүретін жаңа жағдайларға осы класс тағайындалады.

  • Толық өсірілген ағаш деректерге қайта сәйкес келеді және шудың орнына сигнал алатындай етіп кесілуі керек.

  • Кездейсоқ ормандар мен бұталы ағаштар сияқты бірнеше ағаш алгоритмдері жақсы болжамды өнімділік береді, бірақ жалғыз ағаштардың ережелерге негізделген коммуникативтік қабілетін жоғалтады


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет