55
Себебі корпус – тек электрондық нұсқаға көшірілген мəтін базасы емес, ол
терең аннотацияланған, тұтынушының сан түрлі сұранысына қарай тиісті ақпа-
ратты беруге икемделген іздеу жүйесі бар «ақылды» база. Тереңірек анықтағанда,
ұлттық корпус дегеніміз – мемлекеттік тіл ретіндегі қазақ тілінің лингвистикалық
базасы болатын инновациялық ақпараттық-анықтамалық жүйе, оның мəтіндері
арнайы белгіленім арқылы өңделіп, іздеу тетіктерімен қамтамасыз етілген,
статистикалық əрі ғылыми дəл ақпаратты барынша қысқа уақытта алуға мүмкіндік
беретін онлайн жүйесінде кез келген пайдаланушыға қолжетімді мегажоба.
Қазақ тілінің ұлттық корпусы – барлық стиль, жанр жəне əртүрлі типтегі
мəтіндер көлемін түгел қамтитын мемлекеттік тілді сипаттау мен қолдаудың за-
манауи тетіктерінің бірі, сондықтан Ұлттық корпусты жасау ұлттық мəдениеттің,
жалпымемлекеттік-ұлттық бірегейліктің нығаюына, дамуына септігін тигізеді.
Ол кез келген тұтынушыға қазақ тілінің бүкіл байлығын игеруге көмектеседі
жəне қазақ тілінің графикалық бөлінісі салдарын жояды: кирил, латын жəне араб
əліпбиімен бөлінген қазақ мəтіндерін бір жерге бір əліпби жүйемен жинақтайды;
қазақ тілінің тарихын жаңғырту мен стандартталуына эмпирикалық база құрайды;
көне жəне заманауи мəтіндер жиынтығы ретінде тілдегі үздіксіз құбылыстарды
тіркеуге мүмкіндік береді, сол себепті қазақ тілін кодтау, стандарттау жəне
жаңғыртудың мықты дереккөзі болады; мəліметтерінің дəйектілігі аса жоғары
түрлі типтегі қағаз жəне электрондық нұсқадағы заманауи қазақ сөздіктерін
жасауға, қазақ тілінің сөздік қоры, терминдері мен сөздері туралы дəйекті ақпарат
алуға, соның ішінде жаңа жиілік сөздіктер əзірлеуге зор мүмкіндік береді (орыс
тілінің үлкен академиялық сөздігінде – 150 000, Оксфорд сөздігінде – 600 000,
үлкен «Қазақ сөздігінде» 106 000 сөз бар). Демек, Қазақ тілінің ұлттық корпусы –
қазіргі жəне болашақ сөздіктердің сөздік қорын жинақтау мен ұлғайтудың мықты
құралы.
Сонымен бірге Ұлттық корпус тіл оқыту, оқулық, оқу құралдарын, түрлі тип-
те жаттығу, онлайн-мультимедиялық сервистер əзірлеуде кең қолданыс таба-
ды, өйткені оқыту мəтіні үшін аса маңызды т.б. сөздердің жиілігі мен контексі,
қолданыс табатын мəтін типі мен жанры туралы жан-жақты ақпаратты тек Ұлттық
корпус қана бере алады.
Осы сөздікті құрастырушылар – Ахмет Байтұрсынұлы атындағы Тіл білімі
институтының тілтанушылары, болашақ қазақ сөздіктерін, соның ішінде замана-
уи жиілік сөздіктер жасау үшін алдымен Қазақ тілінің ұлттық корпусын əзірлеу
ісін қолға алуға дайын.
Достарыңызбен бөлісу: