Арнайы құрылған белгімен жасақталған көрнектілік, шамаластық жəне репрезентативтілік – барлығы бірге – ұлттық тіл корпусының негізгі қасиеттерін құрайды. Ұлттық корпус – қандай да бір елдің тілінде бар барлық жазбаша жəне ауызша дискурстарды (жарнамадан бастап көркем əдебиет мəтініне дейін) толық, теңбе-тең жəне шамалас көрсететін, тілдің нақты қолданылуы мен өзгеруі жайлы мəліметтердің (оның ішінде статистикалық) түбегейлі жаңа дереккөзі болып қызмет ететін көлемі жағынан ең үлкен корпус
Біріншіден, Ұлттық тіл корпусы – бұл тіл мамандары мен лексикографтардың көптеген ұрпақтарының еңбегімен жасалған сөздіктер мен грамматикаларды қоса алғандағы мүмкіндіктерінен асып түсетін тіл туралы тамаша, бірегей, жаңаша анықтама. Өзінің мағынасы бойынша тілді жəне оның дамуын тану үшін корпусты А.Е. Кибриктің айтуынша микроскоп, телескоп, рентген аппараты, томография жəне т.т. ойлап табумен салғастыруға болады. Ұлттық корпустар пайда болғанға дейін тіл туралы деректер лексикография, грамматика жəне лексикология мамандарының көп жылғы табанды еңбектерінің арқасында жиналды. Корпус сұраныс бойынша болар-болмас секундтардың ішінде тіл туралы жан-жақты толық ақпарат береді. Сөйтіп корпус эмпирикалық базаны кеңейтеді жəне лингвистикалық зерттеулерге айрықша түсіндірме күш беріп, тың жаңа міндеттер қоюға, тілдің өмір сүруінің неғұрлым дəлірек бейнесін айқындауға, құбылыстардың іс жүзінде тілде қолданылу дəрежесін анықтап дəлелдеуге мүмкіндік береді. Екіншіден, Ұлттық корпус мəнмəтіндердің жəне қандай да бір сөздің, оның лексикасемантикалық/графикалық/орфографиялық вариантының, грамматикалық формасының жəне грамматикалық мағынасының, сөз тіркесі, сөйлем түрлерінің бірнеше ғасырлар бойы немесе жекелеген жанрларда, нақты авторлардың мəтіндерінде т.б. қолданылу тарихын қадағалауға жағдай жасайды. Тек корпустың көмегімен ғана тілдің лексикасы мен грамматикасын ғылыми тұрғыдан зерттеуді қамтамасыз етуге, сонымен қатар түрлі кезеңдерде (бір ғасырдан екі ғасырға дейінгі) тілде болып жататын тілдік өзгерістердің нəзік, бірақ үздіксіз үдерістерін тіркеуге болады.
Үшіншіден, Ұлттық корпусты тура жəне кері жиілік сөздіктерді жасауда қолдануға болады, олардың бірліктері тілдің əртүрлі даму кезеңдеріндегі мəтіндерде немесе əртүрлі дискурстар мен қосалқы тілдердің қазіргі мəтіндерінде қолданылатын лексикалық бірліктер, грамматикалық формалар, сөзжасам модельдері, синтаксистік модельдер жəне т.б. болуы мүмкін. Төртіншіден, тілдің грамматикалық құрылысын ғылыми сипаттау, сонымен бірге беделді академиялық сөздіктер осы тілдік бірліктердің нақты қолданысын объективті түрде көрсететін тілдердің корпусы негізінде құрастырылуы тиіс.
Бесіншіден, дəл осы тіл корпусы тілді қалыптандыру мен стандарттаудың дереккөзі ретінде қызмет ете алады, себебі корпуста жазбаша жəне дыбысталатын тіл тіркеледі.
Корпустың мүмкіндіктерін көрсету үшін тағы да Орыс тілінің ұлттық корпусына жүгсек, бүгінгі таңда Орыс тілінің ұлттық корпусында мынадай шағын корпустар бар: терең аннотацияланған корпус (глубоко аннотированный корпус), мұнда əрбір сөйлемге толық морфологиялық жəне синтаксистік құрылым (тəуелдік ағашы) құрылған; мəтіндердің параллель орысша-ағылшынша корпусы (параллельный русскоанглийский корпус текстов), мұнда белгілі бір орыс немесе ағылшын сөзінің не сөз тіркесінің балық аудармаларын табуға болады; диалектілік мəтіндер корпусы (корпус диалектных текстов), мұнда Ресейдің əртүрлі аймақтарының грамматикалық ерекшелігі сақталған диалектілік сөздері жазылған; поэтикалық мəтіндер корпусы (корпус поэтических текстов), мұнда тек қана лексикалық жəне грамматикалық белгілер бойынша ғана емес, өлеңге тəн арнайы белгілер (сонет, эпиграмма, белгілі бір ырғақпен түрі бар амфибрахиймен жазылған өлеңдер жəне т.б.) бойынша да іздеу мүмкіндігі бар; орыс тілінің оқыту корпусы (обучающий корпус русского языка), мұның белгісі орыс тілінің мектеп бағдарламасына бейімделген; ауызша сөйлеу корпусы (корпус устной речи), көпшілік жəне жеке ауызша сөйлеудің магнитофондық жазбалары, сондай-ақ 1930-2000 жылдардағы кинофильмдердің транскриптерлері бар.
Қазақстан Республикасының Мəдениет жəне ақпарат министрлігі Тіл комитететінің сайтында «Қазақ тілінің корпусы» деген сілтеме бар, онда корпустың мақсат-міндеттері былайша анықталған: «Қазақ тілі корпусын жасау қазақ тілінің лексикасы мен грамматикасын ғылыми зерттеуді қамтамасыз етуге, сондай-ақ қазақ тілінде жарық көрген ақпарат түрлерін жинау мен оларды өңдеу, жүйелеу мен белгілі параметрлер бойынша талдау бағдарламасын енгізуге арналған. Қазақ тілінің корпусын жасау Қазақстан Республикасының мемлекеттік тілі саналатын қазақ тілінің қазіргі сипатын талдаудың уникалды жүйесін қалыптастырудың негізі бола алады. Корпустың мақсат-міндеттері: сөздіктер, грамматикалық анықтағыш, оқулықтар мен оқу құралдарын жасау үшін сенімді ақпарат көзі бола алады; тілі білімі саласындағы ғылыми болжамдарды мейлінше мол мұралар негізінде тексеруге мүмкіндік береді; қазіргі қазақ əдеби тілінің қолданысына қатысты кейбір мəселелерді анықтауда анықтағыш құрал қызметін атқара алады, яғни сөзбен жұмыс жасайтын барлық тұлғалар үшін (тіл білімі мамандары, əдебиетшілер, тілшілер, жазушылар, аудармашылар, қазақ тілі оқытушылары жəне т.б.) таптырмас көмекші құрал бола алады.
Қазақ тілі корпусы сан алуан жанрлар, стиль мен аймақтық жəне əлеуметтік нұсқалар арқылы қазақ тілі дамуының белгілі бір дəуірлік сипатын танытады» [http://til.gov.kz/wps].
Достарыңызбен бөлісу: |