Тірек векторлар әдісі (Support Vector machine)
"Тірек векторлар машинасы" (SVM) - бұл машиналық оқытуды басқарылатын алгоритмі, оны классификациялау үшін де, регрессиялық есептер үшін де қолдануға болады. Алайда, ол негізінен классификация міндеттерінде қолданылады. SVM алгоритмінде деректердің әрбір элементін n-өлшемді кеңістіктегіндегі нүкте ретінде құрылады (мұнда n-бар объектілердің саны), сонымен бірге әрбір объектінің мәні нақты координатаның мәні болып табылады. Содан кейінекі класты өте жақсы саралайтын гиперплоскость таба отырып, классификациалау орындалады (төменде суретте келтірілген).
1.8 сурет. SVM алгоритмі
Python scikit-learn-бұл машинамен оқыту алгоритмдерін жүзеге асыру үшін кеңінен қолданылатын кітапхана. SVM сондай-ақ scikit-learn кітапханасында қол жетімді және оны пайдалану үшін сол құрылымды қолданамыз.(импорт кітапханасы, нысандарды жасау, моделді келтіру және болжам жасау).
Кездейсоқ Ормандардың классификациясы (Random Forest Classifier)
Кездейсоқ орман (Random Forest Classifier), оның атауынан шыққан сияқты, ансамбль ретінде әрекет ететін жекелеген ағаштардың көп санынан тұрады. Кездейсоқ ормандағы әрбір жеке ағаш класты болжайды, және ең көп дауыс саны бар сынып үлгінің болжамына айналады (төмендегі суретте көрсетілген).
1.9 сурет. Random Forest алгоритмі
Random Forest нәтижелі жұмыс жасау үшін керекті алғышарттар:
Бағдарламаның функциялары осы алгоритмнің функциясын пайдалана отырып жасалған моделдер кездейсоқ болжамдардан гөрі жақсы жұмыс істеуі үшін нақты сигнал болуы тиіс.
Кейбір ағаштар жасаған болжамдар (демек, қателер) бір-бірімен төмен корреляция болуы тиіс.
Логистикалық регрессия (Logistic Regression)
Логистикалық регрессия- бұл машиналық оқыту алгоритмі, ол классификациялау есептері үшін пайдаланылады, бұл болжамдық талдау алгоритмі және ықтималдық ұғымына негізделген.
2 сурет. Logistic Regression алгоритмі
Логистикалық регрессияны сызықтық регрессиялық модель деп атауға болады, бірақ логистикалық регрессия шығынның неғұрлым күрделі функциясын пайдаланады, бұл шығындар функциясын "сигма тәрізді функция" немесе желілік функцияның орнына "логистикалық функция" деп анықтауға болады.
Логистикалық регрессия гипотезасы 0 мен 1 арасындағы шығындар функциясын шектеу үрдісі бар. Сондықтан сызықтық функциялар оны ұсына алмайды, өйткені ол 1-ден артық немесе 0-ден кем болуы мүмкін, бұл логистикалық регрессия гипотезасына сәйкес мүмкін емес.
Достарыңызбен бөлісу: |