Алматы 2016 жалпы білім берудегі қазақ тілінің жиілік сөздігі


ҚАЗАҚ ТІЛІНІҢ ҰЛТТЫҚ КОРПУСЫ – БОЛАШАҚ ЖИІЛІК



Pdf көрінісі
бет40/41
Дата02.12.2022
өлшемі308,09 Kb.
#54474
1   ...   33   34   35   36   37   38   39   40   41
Байланысты:
0-Жалпы-білім-берудегі-қазақ-тілінің-жиілік-сөздігі

9. ҚАЗАҚ ТІЛІНІҢ ҰЛТТЫҚ КОРПУСЫ – БОЛАШАҚ ЖИІЛІК
 СӨЗДІКТЕРДІҢ БАЗАСЫ 
Сөздердің жиілігі тілдің өмір сүріп отырған қазіргі немесе тарихи кезеңіне 
қарай алына алады. Сонымен бірге сөздердің жиілігіне қатысты статистикалық 
ақпарат мейлінше дəйекті болу үшін жиілік алынатын мəтіндер базасы неғұрлым 
ауқымды əрі теңгерімді, сонымен бірге тілдің қоғамдық өмірдегі барлық саласына 
қатысты болуы тиіс. Мəтіндер базасының осындай жоғары талаптарына жауап 
бере алатын тілтанымдық өнім – тіл-тілдің ұлттық корпустары. Қазіргі əлемдік 
лингвистикада осы жағынан алға шыққан Ұлыбритания (British National Corpus), 
Финляндия (Финляндияның тілдік банкі), Ресей (Орыс тілінің ұлттық корпусы) 
т.б. елдер бүгінгі күні кез келген тілтанымдық өнімді корпустарының базасында 
жасауды дəстүрге айналдырып отыр. Мəселен, орыс тілінің соңғы жиілік сөздігі 
ұлттық корпус базасындағы 92 млн сөзқолданыстан тұратын мəтін негізінде жа-
салды. Корпус жиілік сөздік үшін тек мəтін базасын ғана ұсынып қоймай, сонымен 
бірге базаға алынған мəтіндерге қатысты алуан түрлі таптастырылым ақпарат бере 
алады, омонимдік, омографтық қолданыстарды автоматты түрде ажыратуға, яғни 
олардың əрқайсысының жиілігін жеке көрсетуге, тілдің өмір сүру кезеңдеріндегі 
актив лексикалық қордың құрамындағы сапалық, сандық өзгерістер мен транс-
формацияларды анықтауға мүмкіндік береді. 


55
Себебі корпус – тек электрондық нұсқаға көшірілген мəтін базасы емес, ол
терең аннотацияланған, тұтынушының сан түрлі сұранысына қарай тиісті ақпа-
ратты беруге икемделген іздеу жүйесі бар «ақылды» база. Тереңірек анықтағанда, 
ұлттық корпус дегеніміз – мемлекеттік тіл ретіндегі қазақ тілінің лингвистикалық 
базасы болатын инновациялық ақпараттық-анықтамалық жүйе, оның мəтіндері 
арнайы белгіленім арқылы өңделіп, іздеу тетіктерімен қамтамасыз етілген, 
статистикалық əрі ғылыми дəл ақпаратты барынша қысқа уақытта алуға мүмкіндік 
беретін онлайн жүйесінде кез келген пайдаланушыға қолжетімді мегажоба.
Қазақ тілінің ұлттық корпусы – барлық стиль, жанр жəне əртүрлі типтегі 
мəтіндер көлемін түгел қамтитын мемлекеттік тілді сипаттау мен қолдаудың за-
манауи тетіктерінің бірі, сондықтан Ұлттық корпусты жасау ұлттық мəдениеттің, 
жалпымемлекеттік-ұлттық бірегейліктің нығаюына, дамуына септігін тигізеді. 
Ол кез келген тұтынушыға қазақ тілінің бүкіл байлығын игеруге көмектеседі 
жəне қазақ тілінің графикалық бөлінісі салдарын жояды: кирил, латын жəне араб 
əліпбиімен бөлінген қазақ мəтіндерін бір жерге бір əліпби жүйемен жинақтайды; 
қазақ тілінің тарихын жаңғырту мен стандартталуына эмпирикалық база құрайды; 
көне жəне заманауи мəтіндер жиынтығы ретінде тілдегі үздіксіз құбылыстарды 
тіркеуге мүмкіндік береді, сол себепті қазақ тілін кодтау, стандарттау жəне 
жаңғыртудың мықты дереккөзі болады; мəліметтерінің дəйектілігі аса жоғары 
түрлі типтегі қағаз жəне электрондық нұсқадағы заманауи қазақ сөздіктерін 
жасауға, қазақ тілінің сөздік қоры, терминдері мен сөздері туралы дəйекті ақпарат 
алуға, соның ішінде жаңа жиілік сөздіктер əзірлеуге зор мүмкіндік береді (орыс 
тілінің үлкен академиялық сөздігінде – 150 000, Оксфорд сөздігінде – 600 000, 
үлкен «Қазақ сөздігінде» 106 000 сөз бар). Демек, Қазақ тілінің ұлттық корпусы – 
қазіргі жəне болашақ сөздіктердің сөздік қорын жинақтау мен ұлғайтудың мықты 
құралы. 
Сонымен бірге Ұлттық корпус тіл оқыту, оқулық, оқу құралдарын, түрлі тип-
те жаттығу, онлайн-мультимедиялық сервистер əзірлеуде кең қолданыс таба-
ды, өйткені оқыту мəтіні үшін аса маңызды т.б. сөздердің жиілігі мен контексі, 
қолданыс табатын мəтін типі мен жанры туралы жан-жақты ақпаратты тек Ұлттық 
корпус қана бере алады.
Осы сөздікті құрастырушылар – Ахмет Байтұрсынұлы атындағы Тіл білімі 
институтының тілтанушылары, болашақ қазақ сөздіктерін, соның ішінде замана-
уи жиілік сөздіктер жасау үшін алдымен Қазақ тілінің ұлттық корпусын əзірлеу 
ісін қолға алуға дайын.


Достарыңызбен бөлісу:
1   ...   33   34   35   36   37   38   39   40   41




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет