10-Дәріс. Жасанды интеллектінің негізгі ұғымдары мен даму тенденциялары

жүктеу/скачать 400,24 Kb.

Pdf көрінісі

бет	2/2
Дата	26.04.2023
өлшемі	400,24 Kb.
	#86966

1 2

Байланысты:
10-Дәріс.

Машиналық оқыту
Машиналық оқыту (Machine Learning) — жасанды интеллекттің кең
ауқымды бөлімшесі, алгоритмдерді құру әдістерін зерттейді, оқуға қабілетті
[8]. Оқытудың екі түрі бар. Прецеденттер бойынша оқыту немесе индуктивті
оқыту жеке эмпирикалық деректер бойынша жалпы заңдылықтарды
анықтауға негізделген. Дедуктивтік оқыту сарапшылардың білімін
формалдауды және оларды білім базасы түрінде компьютерге көшіруді
көздейді. Сондықтан Машиналық оқыту және прецеденттер бойынша оқыту
терминдерін синонимдер деп есептеуге болады.
Машиналық оқыту математикалық статистиканың, оңтайландыру
әдістері мен классикалық математикалық пәндердің түйіскен жерінде
орналасқан, бірақ есептеу тиімділігі мен қайта оқыту проблемаларымен
байланысты өзіндік ерекшелігі бар. Индуктивті оқытудың көптеген әдістері
классикалық статистикалық тәсілдерге балама ретінде әзірленген. Көптеген
әдістер ақпаратты алумен және деректерді интеллектуалды талдаумен тығыз
байланысты (Data Mining).
Машиналық оқытудың теориялық бөлімдері жеке бағытқа, есептеу
оқыту теориясына (Computational Learning Theory, COLT) біріктірілген.
Машиналық оқыту-математикалық ғана емес, практикалық, инженерлік
пән. Таза теория, әдетте, практикада қолданылатын әдістер мен
алгоритмдерге бірден әкелмейді. Оларды жақсы жұмыс істеуге мәжбүр ету
үшін теорияда жасалған болжамдардың нақты есептер шарттарына сәйкес
еместігін өтейтін қосымша эвристиканы ойлап табуға тура келеді.
Машиналық оқытудағы бірде-бір зерттеу әдістің практикалық жұмысқа
қабілеттілігін растайтын модельдік немесе нақты деректерде экспериментсіз
өтпейді.

Көптеген прецеденттер (объектілер, жағдайлар) берілген, олардың
әрқайсысы бойынша кейбір деректер жинақталған (өлшенген). Прецедент
туралы деректер оның сипаттамасы деп аталады. Прецеденттердің барлық
сипаттамаларының жиынтығы оқыту үлгісі деп аталады. Осы жеке деректер
бойынша осы нақты іріктемеге ғана тән жалпы тәуелділікті, заңдылықтарды,
өзара байланысты анықтау талап етіледі, бірақ жалпы барлық
прецеденттерге, соның ішінде әлі байқалмаған прецеденттерге. Сондай — ақ
эмпирикалық деректер бойынша тәуелділікті қалпына келтіру туралы
айтады-бұл термин Вапник пен Червоненкис жұмыстарында енгізілді [9].
Прецеденттерді сипаттаудың ең көп таралған жолы белгі болып
табылады. Барлық прецеденттерде өлшенетін көрсеткіштердің N жиынтығы
тіркеледі. Прецеденттер уақытша қатармен немесе сигналдармен,
суреттермен, бейнетіректермен, мәтіндермен, ұқсастықтың қосарланған
қатынастарымен немесе өзара іс-қимыл қарқындылығымен сипатталған және
т. б. неғұрлым күрделі жағдайлар болуы мүмкін.
Прецеденттер бойынша оқыту міндеттерін шешу үшін бірінші кезекте
қалпына келтірілетін тәуелділік моделі тіркеледі. Содан кейін сапа
функционалы енгізіледі, оның мәні модель байқалатын деректерді
қаншалықты жақсы сипаттайтынын көрсетеді. Оқыту алгоритмі (learning
algorithm) берілген оқыту үлгісінде сапа функционалы оңтайлы мәнге ие
модель параметрлерінің жиынтығын іздейді. Деректерді таңдау бойынша
модельді реттеу процесі (fitting) көп жағдайда Сандық оңтайландыру
әдістерін қолдануға әкеледі.
Терминология туралы ескерту. Шетелдік басылымдарда алгоритм
термині тек жоғарыда көрсетілген мағынада қолданылады, яғни есептеу
үлгісі бойынша, оқу үлгісіне сәйкес модельді баптайды. Оқыту алгоритмінің
нәтижесі белгісіз (қалпына келтірілген) тәуелділікті жақындататын функция
болып табылады. Жіктеу есептерінде жақын функция әдетте классификатор,
тұжырымдама немесе гипотеза деп аталады; регрессия функциясы бойынша
регрессияны қалпына келтіру проблемаларында; кейде жай функция. Орыс
тіліндегі әдебиеттерде алгоритм деп те аталатын функция, ол сонымен бірге
компьютерді тиімді түрде іске асыруға мүмкіндік беруі керек.
Мұғаліммен оқыту (supervised learning) — ең көп таралған жағдай.
Əрбір
прецедент
"объект,
жауап"жұбын
білдіреді.
Жауаптардың
объектілердің сипаттамаларына функционалдық тәуелділігін табу және кіріс
кезінде объектінің сипаттамасын қабылдайтын және шығу кезінде жауап
беретін алгоритм құру талап етіледі. Сапа функционалы әдетте іріктеудің
барлық объектілері бойынша Алгоритммен берілген жауаптардың орташа
қатесі ретінде анықталады.
Жіктеу міндеті (classification), әрине, көптеген рұқсат етілген
жауаптармен ерекшеленеді. Олар класс белгілері деп аталады (class label).
Класс-бұл белгі мәні бар барлық объектілер.
Регрессия есебі (regression) жарамды жауап-бұл нақты Сан немесе
сандық вектор.

Ранжирлеу міндеті (learning to rank) жауаптарды бірден көптеген
объектілерден алу керек, содан кейін оларды жауаптардың мәндеріне қарай
сұрыптау керек. Жіктелу немесе регрессия міндеттеріне әкелуі мүмкін.
Мәтіндерді ақпараттық іздеу мен талдауда жиі қолданылады.
Болжамдау міндеті (forecasting) объектілер болашаққа болжам жасау
қажет болған кезде үзілетін уақытша қатарлардың кесінділері болып
табылатындығымен ерекшеленеді. Болжамдау есептерін шешу үшін
регрессия немесе жіктеу әдістерін жиі бейімдеуге болады, екінші жағдайда
шешім қабылдау міндеттері туралы сөз болып отыр.
Мұғалімсіз оқыту (unsupervised learning). Бұл жағдайда жауаптар
берілмейді және объектілер арасында тәуелділікті іздеу қажет.
Кластерлеу міндеті (clustering) объектілерді кластерлерге топтастыру,
объектілердің Қос ұқсастығы туралы деректерді пайдалана отырып. Сапа
функционалдары әртүрлі, мысалы, пластераралық және пластерішілік
қашықтықтардың қатынасы ретінде анықталуы мүмкін.
Ассоциативті ережелерді іздеу міндеті (association rules learning).
Бастапқы деректер белгі сипаттамасы түрінде ұсынылады. Мұндай белгілер
жиынтығын табу қажет, және осы белгілердің мәндері, әсіресе жиі (кездейсоқ
жиі емес) объектілердің белгілерінде кездеседі.
Шығарындыларды сүзу міндеті (outliers detection) — оқыту үлгісінде
типтік емес объектілердің шағын санын табу. Кейбір қолданбаларда оларды
іздеу-бұл алаяқтық (мысалы, алаяқтық). Басқа қолданбаларда бұл нысандар
деректер қателерінің немесе модельдің дәлсіздігінің салдары болып
табылады, яғни үлгіні баптауға кедергі келтіретін Шу, және іріктеуден
алынып тасталуы тиіс, сондай-ақ робастық әдістер мен сыныптас жіктеуді
қараңыз.
Сенімді аймақты құру міндеті (quantile estimation) — іріктеудің
берілген үлесі бар жеткілікті тегіс шекарасы бар ең аз көлем аймағы.
Өлшемдік қысқарту міндеті (dimensionality reduction) кейбір түрлендіру
функциялары арқылы бастапқы белгілері бойынша таңдау объектілері
туралы ешқандай маңызды ақпаратты жоғалтпастан жаңа белгілердің ең аз
санына өту болып табылады. Сызықтық түрлендірулер класында ең танымал
мысал-басты компонент әдісі.
Қалған мәндерді толтыру міндеті (missing values) — матрицадағы
жетіспейтін мәндерді объектілер–олардың болжамды мәндерімен ауыстыру.
Ішінара оқыту (semi-supervised learning) мұғаліммен және мұғалімсіз
оқыту арасында аралық орын алады. Əрбір прецедент "объект, жауап" жұбын
білдіреді, бірақ жауаптар тек прецеденттердің бөлігіне ғана белгілі.
Қолданбалы тапсырманың мысалы-кейбір айдарларға жатқызылған жағдайда
мәтіндердің көп санын автоматты түрде айдауылдау.
Трансдуктивтік оқыту (transductive learning). Прецеденттердің соңғы
оқыту үлгісі берілді. Осы жеке деректер бойынша басқа жеке деректерді —
тестілік іріктеуді болжау талап етіледі. Стандартты қойылымға қарағанда,
мұнда жалпы заңдылықты анықтау қажет емес,өйткені жаңа тест
прецеденттері болмайды. Екінші жағынан, барлық тестілік іріктеуді тұтастай

талдау есебінен болжамдардың сапасын жақсарту мүмкіндігі пайда болады,
мысалы, оны кластерлеу арқылы. Көптеген қосымшаларда трансдуктивтік
оқыту ішінара оқытудан айырмашылығы жоқ.
Бекітумен оқыту (reinforcement learning). Объектілердің рөлін "жағдай,
қабылданған шешім" жұбы ойнайды, жауаптары қабылданған шешімдердің
дұрыстығын (ортаның реакциясын) сипаттайтын сапа функционалының мәні
болып табылады. Болжамдау міндеттеріндегі сияқты, мұнда уақыт факторы
маңызды рөл атқарады. Қолданбалы есептер мысалдары: инвестициялық
стратегияларды қалыптастыру, Технологиялық үдерістерді автоматты
басқару, роботтарды өзін-өзі оқыту және т. б..
Динамикалық оқыту (online learning) мұғаліммен де, мұғалімсіз де
оқытылуы мүмкін. Ерекшелігі-прецеденттер ағынға түседі. Əрбір прецедент
бойынша дереу шешім қабылдау және бір мезгілде жаңа прецеденттерді
ескере отырып, тәуелділік моделін жете үйрену талап етіледі. Болжамдау
міндеттеріндегі сияқты, мұнда уақыт факторы маңызды рөл атқарады.
Белсенді оқыту (active learning) білім алушының белгілі болатын келесі
прецедентті өз бетінше тағайындау мүмкіндігіне ие болуымен ерекшеленеді.
Эксперименттерді жоспарлауды да қараңыз.
Мета оқу (meta-learning немесе learning-to-learn) прецеденттер
оқытудың бұрын шешілген міндеттері болып табылатындығымен
ерекшеленеді. Онда қолданылатын эвристиканың қайсысы неғұрлым тиімді
жұмыс істейтінін анықтау қажет. Соңғы мақсат — уақыт өте келе оқыту
алгоритмін үнемі автоматты түрде жетілдіруді қамтамасыз ету.
Көп пайдалы оқыту (multi-task learning). Оқытудың өзара байланысты
немесе ұқсас міндеттерінің жиынтығы бір мезгілде, ішкі көрінісі ұқсас
оқытудың әртүрлі алгоритмдерінің көмегімен шешіледі. Міндеттердің өзара
ұқсастығы туралы ақпарат оқыту алгоритмін неғұрлым тиімді жетілдіруге
және негізгі міндетті шешудің сапасын арттыруға мүмкіндік береді.
Индуктивті тасымалдау (inductive transfer). Прецеденттер бойынша
жекелеген жеке оқыту міндеттерін шешу тәжірибесі келесі жеке оқыту
міндеттерін шешуге көшіріледі. Осы тәжірибені қалыптастыру және сақтау
үшін білім берудің реляциялық немесе иерархиялық құрылымы
қолданылады.
Кейде метаоқуға алгоритмдік композицияларды құру, атап айтқанда,
бустинг қате жатады; алайда композицияларда бірнеше Алгоритмдер бір
есепті шешеді, ал метаоқу әртүрлі міндеттердің көп шешілуін болжайды.
Қолданбалы салаларда пайда болатын кейбір есептер бірден бірнеше
стандартты есептер түрлерінің сипаттарына ие, сондықтан оларды бір түрге
бір түрге жатқызу қиын.
Инвестициялық портфельді қалыптастыру (portfolio selection) - бұл
ақпараттық белгілерді іріктеу өте маңызды нығайтумен динамикалық оқыту.
Белгілердің рөлі қаржы құралдары. Белгілердің (портфельдің) оңтайлы
жиынтығының құрамы уақыт өте келе өзгеруі мүмкін. Сапа функционалы
осы портфельді басқару стратегиясына инвестициялаудан түсетін ұзақ
мерзімді пайда болып табылады.

Коллаборативті сүзгілеу — (collaborative filtering) - бұл ұқсас
пайдаланушылардың бұрынғы қалаулары мен қалаулары негізінде
пайдаланушылардың қалауын болжау. Классификация, кластерлеу және
өткізіп алған деректердің орнын толтыру элементтері қолданылады.
Клиенттік орталарды дербестендіру және талдау.
Оқыту міндеттеріне деген көзқарас-бұл тұжырымдама, парадигма,
базалық болжамдар, гипотезалар, эвристик жиынтығына әкелетін оқыту
үдерісіне көзқарас, соның негізінде модель, сапа функционалы және оны
оңтайландыру әдістері құрылады.
"Амалдар бойынша" әдістерін бөлу шартты түрде. Əр түрлі тәсілдер бір
модельге, бірақ оны оқытудың әртүрлі әдістеріне әкелуі мүмкін. Кейбір
жағдайларда бұл әдістер өте қатты ерекшеленеді, басқаларында - өте аз және
шамалы модификациялар жолымен бір-біріне "бірқалыпты өзгереді".
Статистикада жіктеме мәселелерін шешу дискриминанттық талдау деп
аталады.
Байесов классификациясы оңтайлы байесов классификаторын
қолдануға және оқыту үлгісі бойынша сыныптарды бөлу тығыздығын
бағалауға негізделген. Тығыздықты бағалаудың әртүрлі әдістері байесов
сыныптауышының алуан түрлілігін тудырады. Олардың ішінде әдістердің үш
тобын бөлуге болады:
Тығыздықты параметрлік бағалау
- шаршы дискриминант;
- Фишердің сызықтық дискриминанты.
Тығыздықты параметрлік емес бағалау
- парзендік терезе әдісі;
Өлшемдік тығыздықтың қоспасы ретінде тығыздықты бағалау.
- үлестіру қоспасын бөлу, EM-алгоритм;
- радиалды базистік функциялар әдісі.
Ол параметрлік және параметрлік емес болуы мүмкін. Ол белгілердің
статистикалық тәуелсіздігі туралы болжамға негізделген. Осы әдіс арқасында
өте қарапайым.
Басқа теориялық-ықтималдық және статистикалық тәсілдер:
- жасырын Марков тізбегі;
- байесов желісі.
Классификацияның метрикалық алгоритмдері объектілерді табиғи
түрде олардың белгілері емес, объектілер арасындағы қосарланған
қашықтықтың матрицасы етіп қою мүмкін болатын есептерде қолданылады.
Олардың ұқсастығы бойынша объектілерді жіктеу ықшамдық гипотезасына
негізделген, ол "жақсы тапсырмада" ұқсас объектілер әр түрлі санаттарға
қарағанда бір сыныпта жиі жататынын айтады. Жіктеудің ең танымал
метрикалық алгоритмдері:
- жақын көршілер әдісі;
- парзендік терезе әдісі;
- ықтимал функциялар әдісі;
- радиалды базистік функциялар әдісі;

- эталондық объектілерді іріктеу.
Классификация әдістерінің үлкен тобы объектілер кеңістігіндегі бөлуші
бетті анық құруға негізделген. Олардың ішінен жиі желілік жіктеуіштер
қолданылады:
- Фишердің сызықтық дискриминанты;
- бір қабатты персептрон;
- логистикалық регрессия;
- негізгі векторлар машинасы = негізгі векторлар әдісі = SVM.
Машиналық оқытудың мақсаты адам қызметінің түрлі салаларында
күрделі кәсіби міндеттерді шешуді ішінара немесе толық автоматтандыру
болып табылады.
Машина оқыту кең спектрлі қосымшалар бар:
- сөйлеуді тану;
- қимылдарды тану;
- қолжазба енгізуін тану;
- бейнелерді тану;
- техникалық диагностика;
- медициналық диагностика;
- уақытша қатарларды болжау;
- биоинформатика;
- алаяқтықты анықтау;
- спамды анықтау;
- құжаттарды санаттау;
- биржалық техникалық талдау;
- қаржылық қадағалау;
- кредиттік скоринг;
- клиенттердің күтуін болжау;
- хемоинформатика;
- ақпараттық іздестіруде ранжирлеуге оқыту.
Машиналық оқытуды қолдану саласы үнемі кеңеюде. Жаппай
ақпараттандыру ғылымда, өндірісте, бизнесте, көлікте, денсаулық сақтауда
үлкен көлемнің жинақталуына алып келеді. Бұл ретте пайда болатын болжау,
басқару және шешімдер қабылдау міндеттері жиі прецеденттер бойынша
оқуға түседі. Бұрын мұндай деректер болмаған жағдайда, бұл міндеттер
мүлдем қойылмаған немесе мүлдем басқа әдістермен шешілген.

жүктеу/скачать 400,24 Kb.

Достарыңызбен бөлісу:

1 2