118
Қазақ тілінің тілдік корпусын «Қазақ тілінің
функционалды
грамматикасы», «Компьютерлік лингвистика», «Морфология», «Мәтін
лингвистикасы» салалары бойынша оқытылатын лекциялар мен семинар
сабақтарында пайдалануға болады.
Яғни қандай да бір көркем шығарма немесе басқа да жанр түрлерінен
алынған
мәтінді
корпустық
лингвистика
парадигматикалық
және
синтагматикалық қатынастар тұрғысынан алып, синтагмада,
яғни тізбектеле
жатқан сөйлемдерді алдымен парадигматикалық қатарға түсіріп, бөлшектеп,
сол жекелеген сөйлем бөлшектерін қайтадан синтагмалық жүйеде тізбектей
лингвистикалық белгілер қоя отырып сипаттайды. Мұндай лексика-
грамматикалық,
семантикалық, стилистикалық сипаттамалар, белгілі бір
сөзформаға морфологиялық, семантикалық, синтаксистік мағлұматтар
компьютерде автоматты түрде орындалады. Осы тұрғыдан алғанда біздің
айтып отырған мәтіннің әрбір бөлшегіне берілген лингвистикалық ақпарат,
жай тілдік сипаттама ғана емес, автоматтандырылған компьютерлік
лингвистиканың аясында қарастырылады.
Яғни бірінші кезеңде сөзформаның мүмкін варианттары автоматты түрде
түгелдей қамтылса, екінші кезеңде омоним сөзформалар анықталып, олардың
тұсына сұрақ белгілері қойылып отырады. Үшінші кезеңде анықталған
омонимдер, яғни бірдей сөзформалардың (ол сөз не сөздің формасы, яғни
грамматикалық формалар болуы мүмкін)
лексикалық не грамматикалық
мағыналары мәтіндерден іздестіріліп, қай сөз табы екендігі анықталады.
Мұндай жұыс түрлерінің барлығы компьютерде арнайы бағдарламалар
негізінде жүзеге асырылады.
Тілдік корпус жасалғаннан кейін, зерттеуші белгілі бір тілдік құбылысты
компьютер жадынан интернет желісі арқылы іздеуіне болады. Іздеу белгілі бір
өлшемде іске асырылады. Мәселен, ізделетін нақты сөзформа көрсетіледі;
лексема, яғни түбір сөз беріледі; морфологиялық белгілері қойылады; басқа
сөзформалар/лексемалармен тіркесуі; сөйлемдегі қолданыс ерекшелігі (орын
тәртібі); мәтіннің шыққан уақыты мен
жанры тағы басқа ақпараттар
көрсетіледі.
Компьютерлік бағдарламаға енгізілетін көркем әдеби шығармалар
мәтіндеріне морфологиялық талдау жасау барысында біршама мәселелер алдан
шықты. Оларды жалпылай айтсақ: біріншіден, қазақ тіл білімінде жекелеген
лексикалық бірліктерді сөз таптарына жатқызуда қайшы пікірлердің кездесуі,
екіншіден, кейбір грамматикалық формалардың тұрпат межесі мен мазмұн
межесінің түпкілікті айқын еместігі, үшіншіден, қазақ тілінің өзіндік
ерекшелігінен туындайтын контекст мәселесі, төртіншіден, авторлық
қолданыс
ерекшеліктері,
бесіншіден,
мәтіндер
корпусын
жасауда
әзірленген
компьютерлік бағдарлама мүмкіндіктері. Бұл аталған жайттарды мысалдар
арқылы көрсетейік:
Таң алдында бiр ғана сағат мызғығаны болмаса, Абай