1. Электр сигналдарының спектрлік анализінің негіздері


Метрикалық және сызықтық классификаторлар. ROC қисығы



бет21/22
Дата06.12.2022
өлшемі430,55 Kb.
#55283
1   ...   14   15   16   17   18   19   20   21   22
Метрикалық және сызықтық классификаторлар. ROC қисығы

Метрикалық классификатор (ұқсастық негізіндегі жіктеуіш) – объектілер арасындағы ұқсастық ұпайларын есептеуге негізделген жіктеу алгоритмі. Ең қарапайым метрикалық жіктеуіш - ең жақын көршілер әдісі, онда жіктелетін нысан өзіне ұқсас нысандардың көпшілігін қамтитын сыныпқа жатады. Метрикалық классификаторлар ықшамдық гипотезасына негізделген, ол ұқсас объектілер әртүрлі объектілерге қарағанда бір сыныпта жиірек болады деп болжайды. Бұл сыныптар арасындағы шекара өте қарапайым пішінге ие, ал сыныптар объект кеңістігінде ықшам локализацияланған аймақтарды құрайды дегенді білдіреді. Математикалық талдауда шектелген тұйық жиындар ықшам деп аталатынын ескеріңіз. Ықшамдық гипотезасының бұл тұжырымдамаға ешқандай қатысы жоқ және ол сөздің «күнделікті» мағынасында түсініледі.
Сызықтық классификатор – кіріс деректері бойынша сызықтық оператор негізінде шешім қабылданған кезде жіктеу мәселелерін шешу тәсілі. Сызықтық жіктеуіштердің көмегімен шешілетін есептер класы сәйкесінше сызықтық бөліну қасиетіне ие. Сызықтық классификатор – кіріс деректері бойынша сызықтық оператор негізінде шешім қабылданған кезде жіктеу мәселелерін шешу тәсілі. Сызықтық жіктеуіштердің көмегімен шешілетін есептер класы сәйкесінше сызықтық бөліну қасиетіне ие.
Сызықтық классификатор үшін параметрлерді анықтаудың екі тәсілі бар - генеративті немесе дискриминативті модельдер.
Генеративті модель шартты таратуды пайдаланады
Дискриминанттық талдау (LDA) − Гаусс қалыпты үлестірімін қабылдайды.
ROC-қисығы (ағылшынша қабылдағыштың жұмыс сипаттамасы, қабылдағыштың жұмыс сипаттамасы) – екілік классификацияның сапасын бағалауға мүмкіндік беретін, атрибуттың тасымалдаушыларының жалпы санынан объектілер үлесі арасындағы қатынасты көрсететін график.


3. Үлкен деректердің сипаттамалары мен дереккөздері. Мәліметтердің негізгі
төрт түрі. Деректерді талдау. Big Data шешетін тапсырмалар
Үлкен деректер термині деректердің үлкен және экспоненциалды түрде өсіп келе жатқан жиынын сипаттау үшін қолданылады. Мұндай көлемдегі деректерді өңдеу үшін машиналық оқыту өте қажет.
Үлкен деректер беретін артықшылықтар:

  • Әртүрлі көздерден алынған мәліметтерді жинау.

  • Нақты уақыттағы талдау арқылы бизнес-процестерді жетілдіріңіз.

  • Деректердің үлкен көлемін сақтау.

  • Түсініктер. Үлкен деректер құрылымдық және жартылай құрылымдық деректер арқылы жасырын ақпаратты тереңірек түсінеді.

  • Үлкен деректер тәуекелді азайтуға және тәуекелді дұрыс талдау арқылы ақылды шешімдер қабылдауға көмектеседі.

Мәліметтерді үлкен деп санауға болады, егер оның үш негізгі сипаттамасы:
Көлемі. Анықтама өзі үшін сөйлейді: деректер көп болуы керек. Ақпарат ағындары тіпті терабайттармен емес, петабайттармен және экзабайттармен өлшенеді.
Жылдамдық. Үлкен деректер әртүрлі көздерден үздіксіз келеді және бұл процесс өте тез жүреді.
Әртүрлілік. Үлкен деректер - бұл әртүрлі типтегі ақпарат: мәтіндік және графикалық құжаттар, аудио және бейне файлдар, журналдар. Ол толығымен ретсіз немесе жартылай реттелген болуы мүмкін.
Үлкен деректермен байланысты тапсырмалардың үш түрі бар:
Сақтау және басқару. Жүздеген терабайт немесе петабайт деректерді дәстүрлі реляциялық дерекқорлармен сақтау және басқару оңай емес.
Құрылымы жоқ ақпарат. Үлкен деректер деректерінің көпшілігі құрылымдалмаған, яғни мәтінді, бейнені, суреттерді және т.б. қалай ұйымдастыруға болады.
Үлкен деректерді талдау.


1   ...   14   15   16   17   18   19   20   21   22




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет