Алматы 2016 жалпы білім берудегі қазақ тілінің жиілік сөздігі


СӨЗДІКТІҢ ДЕРЕККӨЗІ – МƏТІНДІК БАЗАСЫ (МƏТІН КОРПУСЫ)



Pdf көрінісі
бет11/41
Дата02.12.2022
өлшемі308,09 Kb.
#54474
1   ...   7   8   9   10   11   12   13   14   ...   41
5. СӨЗДІКТІҢ ДЕРЕККӨЗІ – МƏТІНДІК БАЗАСЫ (МƏТІН КОРПУСЫ)
Кез келген жиілік сөздік сөзтізбесінің көлемі мен құрылымы, ондағы сөздердің 
жиілігі мəтін базасына тікелей қатысты болады. Сондықтан сөздіктің барлық 
параметрлері өз мақсатына жауап бере алатындай болуы үшін оның мəтін базасы 
сол мақсатқа сəйкес жинақталуы тиіс. 
Мəселен, экономика не заң саласындағы мамандарға тіл үйрету үшін қажетті 
лексикалық қорды анықтау мақсатында жиілік сөздік жасалатын болса, онда 
сөздер жиілігі экономистер мен заңгерлердің күнделікті ресми жəне бейресми 
тілдік қарым-қатынасында қолданылуы ықтимал жəне мазмұны олардың кəсіби 
қызығушылығынан қатты ауытқып кетпейтін мəтіндер базасы негізінде анықталуы 
керек. Бұл – жиілік сөздік мəтіндеріне қойылатын талаптың біріншісі: мəтіннің 
м а з м ұ н д ы қ жағының жиілік сөздік мақсатына с ə й к е с т і г і . Осы талапқа 
сəйкес жиілік сөздіктің мəтіндік базасына мектеп қабырғасында, мəдени орын-
дарда, тұрмыстық қатынаста, оқушының қарым-қатынасқа түсуі əбден ықтимал 
ғылыми, ғылыми-көпшілік ортадағы дискурстардан мəтіндер жинақталды. 
Сол сияқты көркем жəне публицистикалық мəтіндер де алынды. Олардың дені 
балаларға арналған дереккөздер мен авторлардан жинақталды. 
Екінші талап – мəтіндердің т е ң г е р і м д і л і г і мен ж а н - ж а қ т ы л ы ғ ы . 
Корпустық лингвистикада «баланстылық» терминін қазақшалап «теңгерімділік», 
ал «репрезентативтілікті» – жан-жақтылық деп атау жиі қолданылады
10
. Бұл 
жерде теңгерімділігі дегеніміз жиілік сөздік базасына алынған мəтіндердің 
қазақ тілінің қоғамдық өмір саласындағы көріністерін, нақты айтқанда, жалпы 
білім берудегі дискурстарды мейлінше тең көлемде толық қамту. Ол үшін қазақ 
əдеби тілінің 5 функционалды стилі бойынша мейлінше көлемді мəтіндер алын-
ды. Ал жан-жақтылықты қамтамасыз ету үшін құрастырушылар əрбір стильдегі 
түрлі жанр, тип, тақырыптар бойынша мəтіндерді əрі əртүрлі авторлардан ара-
лас жинақтады. Бір автордан бір тақырыпқа қатысты мəтіндердің басымдығына 
жол бермеу керектігі де ескерілді. Себебі мəтін бір тақырыпқа арналған болса
онда сол тақырыпқа қатысты тірек сөз міндетті түрде бірнеше рет, тіпті аса үлкен 
жиілікпен кездесуі əбден мүмкін. Сондықтан мəтіндердің жан-жақтылығын еске-
ру тілдің объективті сипаты туралы дəйекті ақпарат алу үшін аса маңызды. 
9
Құрышжанов Ə., Уəли Н. «Абай жолының» жиілік сөздігі // Қазақ əдебиеті, 29 февраль, 1980.
10
Құрышжанов Ə., Уəли Н. «Абай жолының» жиілік сөздігі // Қазақ əдебиеті, 29 февраль, 1980.


17
Үшінші талап – мəтін базасының неғұрлым а у қ ы м д ы болуы. Аталмыш 
талапқа сай қазіргі кезде жиілік сөздіктерді тілдің ұлттық корпустарына сүйеніп 
əзірлеу тəжірибесі əбден орнықты. Мəселен, орыс тілінің соңғы ауқымды жиілік 
сөздігі Орыс тілінің ұлттық корпусының базасында 1950-2007 жж. аралығында 
əзірленген 92 млн сөзқолданыстық мəтін көлемін қамти отырып жасалды. Мұндай 
сөздіктегі жиілік мəндері, тілдегі белсенді лексикалық қордың шегарасы ерекше 
дəлдікпен анықталады, оның үстіне жиілік сөздік құрастырушыларына корпус-
тағы метабелгіленімнің арқасында түрлі стиль, жанр, мəтін типі, мəтіннің шығу 
уақытына, авторына қатысты да дербес жиіліктерді анықтау, сөзтізбе бірліктерін 
леммалау ісі еш қиынға соқпайды, яғни мұндай ауқымды базадағы жиілік сөздіктің 
ақпараттылығы жоғары, əрі тұтынушының алуан түрлі сұранысына жауап бере 
алу қасиеті де күшті болады. Сондықтан қазақ тіл білімінде корпустық лингви-
стиканы дамытып, тілдің ұлттық корпусын жасауды алға тартып отырмыз. Тілдің 
корпусы жиілік сөздіктер жасау ісін жеңілдетіп қана қоймай, оның нақтылығы 
мен дəлдігінің деңгейін көтерері сөзсіз, корпус бұдан басқа да көптеген келелі 
мəселені шешудің инновациялық-ақпараттық құралы болмақ
11
. Бүгінгі күні 
А.Байтұрсынұлы атындағы Тіл білімі институты 7 млн-дық мəтін базасы бо-
йынша жасалған қазақ тілінің ұлттық корпусының бастапқа қанатқақты жобасын 
интернетке қосып отыр. Бұл шағын корпустың сапасы мен ауқымы əлі де үлкен 
толықтыруларды қажет етеді. Оны «Қазақ тілінің ұлттық корпусы» атты қазақ, 


Достарыңызбен бөлісу:
1   ...   7   8   9   10   11   12   13   14   ...   41




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет