Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет67/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   63   64   65   66   67   68   69   70   ...   326
коллективам  и фондам,  предоставившим  для  архива  Корпуса  электронные  версии 
находящихся в их распоряжении текстов» [6] (баспа аттарын келтірмеуді жөн санадық).  
ҚР БҒМ ҒК А. Байтұрсынұлы атындағы Тіл білімі институтында  қазақ тілінің корпусын 
құрастыру мәселесі  «Мәдени құндылықтар ретіндегі қазақ тіліндегі мәтіндер корпусы және 
сөздіктердің  «Тіл  –  қазына»  атты  Ұлттық  компьютерлік  қоры»  атты  тақырыпқа  қатысты 
зерттеу жұмыстарынан бастама алған болатын. Аталған зерттеу жұмысының негізгі мақсаты 
–  қазақ  тілінің  мәдени  құндылығы  болып  саналатын  толық  мәтіндеріне,  қажеттілікке  сай, 
грамматикалық    белгі-кодтар  енгізіп,  оның  дербес  түрдегі  «Тіл  –  қазына»  атты  мәтіндер 
корпустарының компьютерлік базасын құру. Алғашында (2009-2011 ж.ж.) толық мәтіндердің 
компьютерлік қорының нысандары ретінде М. Әуезовтің, Ә. Кекілбаевтың, М. Мақатаевтың, 
М. Мағауинның толық шығармаларынан тек таңдама мәтіндер ғана алынды. Ал басқа қазақ 
классиктерінің, ғылыми мәтіндердің, публицистикалық  шығармалардың мәтіндер қорпусын 
жасау  Қолданбалы  лингвистика  бөлімдегі  шағын  ғана  топтың  қолынан  келер  нәрсе  емес, 
әрине.  Егер  Институтымыздың  қолға  алған  «Қазақ  тілінің  аннотацияланған  Ұлттық 
корпусын»  жасаушы  ғалымдар  саны    жеткілікті  болғанда    мынадай  корпустар  түрлерін  де 
жасауымызға болар еді:  
1)  Қазақ  тілінің  қазіргі  кездегі  (немесе  кезеңдік)  бұқаралық  ақпарат  құралдары  (газет, 
журнал бетіндегі) мәтіндерінің жеке корпусы;  
2) Қазақша сөйлеу тілі жазбасының (мәтінінің) жеке корпусы (орыс тілінің «Корпус живой 
русской речи» тәріздес);  
3)  Қазақ  тілінің  мультимедиалық  корпусы  (корпустың  негізін  мәтіндердің  видео-  және 
аудиожазбалары құрайды);  
4) Қазақ тілімен параллель тілдердің жеке корпусы (түркітілдес және үндіеуропа тілдері), 
мысалы,  қазақ-қырғыз,  қырғыз-қазақ,  қазақ-өзбек,  өзбек-қазақ  және  т.б.,  сол  сияқты,  қазақ-
орыс, орыс-қазақ, қазақ-украин, украин-қазақ және т.б. қатар тілдер корпусы;  
5)  Қазақ  тілінің  диалектілік  мәтіндерінің  жеке  корпусы  (орыс  тілінің  «Корпус  русских 
диалектных текстов» тәріздес);  
6)  Қазақ  тілінің  поэтикалық  мәтіндерінің  жеке  корпусы  (орыс  тілінің  «Корпус  русских 
поэтических текстов» тәріздес);  
7)  Қазақ  тілінің  білім  беру  корпусы  (орыс  тілінің  «Обучающий  корпус  русского  языка» 
тәріздес). 
Бір айта кететін жайт  –  «Орыс тілінің Ұлттық корпусы» бойынша ақпарат іздеу жүйесін 
құру  әрекетіне  «Яндекс»  компаниясы  қолдау  көрсеткені  мәлім.  Сол  сияқты  «Қазақ  тілінің 
Ұлттық  корпусынан»  ақпарат  іздестіруге  және  оның  интернеттегі  сайтының  дизайнына  да 
қолдау көрсететін компаниялар табылып жатса нұр үстіне нұр болар еді.  


73 
 
Қорыта  келе  айтарымыз:  Ұлттық  тіл  мәтіндерінің  компьютерлік  корпусын  құру  жобасы 
бір  ғана  ғылыми  ұйымның  шешетін  мәселесі  емес  және  ол  зерттеу  жұмысы  3-5  жылда 
аяқтала  қояды  деуге  де  болмайды.  Себебі  бұл  аса  күрделі  және  оның  нәтижелері  әлемдік 
дәрежедегі  аса  маңызды  ғылыми  жұмыс  болып  саналады.  Зерттеу  жұмысының  мақсатына 
сай  орындалатын  міндеттері  де  сала-салаға,  кезең-кезеңге  бөлініп,  тек  қана  ғалымдар 
қауымдастығын  құру  арқылы  ғана  ауқымды  нәтижеге  ие  боларымыз  сөзсіз.  Мемлекеттік 
тілдің  өз  деңгейінде  қызмет  етуін  шындап  мақсат  етсек,  тілімізді  компьютердіру  ісімен 
айналысатын жеке институт құрсақ та артықтық етпес еді.  
Бір  сөзбен  айтқанда,  қазақ  тілінің  тілдік  корпустарын  жасау  –  көп  болып  жұмылып 
атқаратын  ұлттық  құндылығымыз.  Сондықтан  Қазақстанның  әр  жерінде  бір-бірінен  дербес 
атқарылып жатқан корпус жасау ісін орталықтандыру керек немесе  БҒМ Б. Жұмағұловтың 
сөзімен айтсақ, «Филологтар қауымдастығын құру» аса қажет демекпіз. Бұл ретте: 
-  оған  Қазақстанның  әр  жерінде  ғылыми-педагогикалық  қызмет  атқарып  жүрген 
ғалымдардан арнайы лингвистикалық топ құру керек. Өйткені тілдік бірліктерді модельдеу 
–  өте  күрделі  мәселе.  Сондай-ақ  тілдік  корпустар  құрастырудың  өзі  ең  алдымен 
лингвистикалық белгіленім талдамасын жасауға тіреледі; 
-  осы  кезге  дейін  жасалып  жатқан  корпус  жасау  тәжірибесіндегі  нәтижелерді  бір 
орталыққа жинақтау керек;  
-  кітап,  газет-журнал  шығаратын  баспалармен  шартқа  отырып,  олардан  мәтіндердің 
электронды нұсқаларын алу қажет.  
Сонымен  қазақ  тілінің  Ұлттық  корпусын  жасау  үшін  А.  Байтұрсынұлы  атындағы  Тіл 
білімі  институтында  арнайы  орталық  құрудың  қажеттігі  мен  оның  алғышарттарын  атап 
көрсеттік.  Ал  мұндай  ауқымды  іске  мемлекет  тарапынан  қолдау  көрсетілсе,  біртұтас  қазақ 
тілінің Ұлттық корпусын құрастыру ісі  алға  басатыны сөзсіз. Мұндай Ұлттық  құндылықты 
жасап шығару бүгінгі қазақ тіл білімінің ғана емес, қоғамның болашаққа қояр талаптарының 
бірі деп білеміз. 
 


Достарыңызбен бөлісу:
1   ...   63   64   65   66   67   68   69   70   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет