Ордабекова Хафиза Арысбайқызы



Pdf көрінісі
бет74/133
Дата27.09.2023
өлшемі1,75 Mb.
#110758
1   ...   70   71   72   73   74   75   76   77   ...   133
Байланысты:
Тіл біліміне кіріспе Ордабекова Х. Оқу құралы

Компьютерлік лингвистика. 
Компьютерлік лингвистика ғылыми бағыт
ретінде ХХ ғасырдың 60-жылдары қалыптасты. Стэндфорд және Нью-Йорк
университеттерінде (АҚШ) алғаш рет тілдерді ЭЕМ-де оқытудың
алғышарттары жасалған. 1990 жылдардың екінші жартысында
компьютерлер мен телекоммуникациялық құралдардың жаңа түрлерінің
пайда болуымен лингвистикалық ақпараттық кеңістікті кеңейту мақсатында 
мультимедиялық технологияға негізделген бағдарламалар жасалды. Кең
көлемді ақпараттық ресурстарды тілді оқыту үдерісінде қолдану, қажет 
ақпараттарды өңдеу және сақтау – қазіргі тілдік білім беру үдерісіндегі 
өзекті мәселелердің бірі.
Компьютерлік лингвистиканың зерттеу нысаны ‒ компьютерлік 
құралдарды лингвистикада қолдану, жасанды тілдерді өңдеудің жүйесін 
қалыптастыру, қажет ақпаратты іздеу жұмыстары, машиналық аударма 
мәселесі, мәтінді компьютерлік безендіру, сөйлеу формасындағы ақпаратты 
автоматты түрде өңдеу, оны іздеу және сақтау сынды бағдарламалармен 
қамтамасыздандыру. Компьютерлік лингвистиканың маңызды мәселелерінің
бірі ‒ автоматты түрде оқылатын лингвистикалық ақпаратты анықтау.
Қазіргі қазақ тіл білімінде компьютерлік лингвистиканың негізгі бағыты
мемлекеттік тілді қоғамның барлық саласында ғылым тілі ретінде қолдануға 
бағытталған «компьютерлендіру» ісіне арналған. Осыған байланысты қазақ 
тілші-ғалымдары тарапынан қазақ лексикографиясы саласы бойынша 
компьютерлік қор жасау, қазақ мәтіндері корпустарының компьютерлік
базасын құрастыру ісі қолға алынды. Бұл үшін мәтін мазмұнын компьютер 
арқылы түсінуге мүмкіндік тудыратын модель жасау үшін мәтіндегі тілдік 
бірліктердің (морфема, сөз, сөз тіркесі, сөйлем) мағыналарын формалды түрде 
анықтауға қатысты зерттеулер жүргізілуде. 
Қолданбалы лингвистиканың статистикалық және компьютерлік 
бағыттары А.Байтұрсынұлы атындағы Тіл білімі институты «Қолданбалы 
лингвистика» бөлімінің қызметкерлері тарапынан қолданыла бастады. Оған 
дәлел ретінде 1993 жылы М.Әуезовтің 20 томдық толық шығармалар жинағын 
компьютер жадына түсіріп, зерттеуші қауымға жиілік сөздіктер ұсынғандығын 
айтуға болады. Ал 1978 жылы түркітану ғылымы үшін ортағасырлық «Кодекс-
куманикус» ескерткішінің мәтіні тұңғыш рет ЭЕМ жадына енгізіліп, 
«Куманша-қазақша жиілік сөздігі» түзілді. Сондай-ақ, 1979 жылы М.Әуезовтің 
«Абай жолы» романының жиілік сөздігі де қазақ тілші-ғалымдарының 
статистикалық лингвистика саласына қосқан еңбек ретінде танылады.
Компьютерлік қор жасаудың негізгі мақсаты – зерттеуші маманның 
қажетті 
лингвистикалық 
ақпаратты 
іздеу 
жұмысын 
жеңілдету.
Саяси-мәдени, экономикалық-әлеуметтік қатынастар негізінде тілдік жүйеге 


116 
термин сөздер мен неологизмдердің еніп отыратыны белгілі, сол себепті 
автоматтандырылған сөздік базасын құрастыру кезек күттірмес мәселелердің 
бірінен саналады. Осы бағытта А.Жұбановтың «Қазақ сөзінің «Тіл – қазына» 
деректер базасы және оның теориялық негіздері» атты ғылыми монографиясы 
жарық көрді.
«Тіл – қазына» атты деректер қорының мүмкіндіктері: 
- қажетті деген сөзге немесе сөзформаға қатысты карточкалық 
мәнмәтіндерді лезде тауып алып, олармен компьютердің экраны арқылы 
немесе қағаз бетіне басып шығарып та танысу мүмкіндігі; 
- әрбір әріпке байланысты реестрлік сөздік түзілгендіктен, қажет деген 
сөздер мен оларға қатысты карточкалық мәнмәтіндерді лезде іздеп тауып алу 
мүмкіндігі; 
- қажетті деген сөзге немесе сөзформаға (олардың бастапқы, ортаңғы, 
соңғы бөліктеріне) байланысты карточкалық мәнмәтіндерді авторына, 
шығармасына, баспа аттары мен шыққан жылдарына қатысты іздеп табу 
мүмкіндігі; 
- «Тіл – қазына» компьютерлік базадағы карточкалық мәнмәтіндерді
өңдеуге, өшіруге немесе жаңадан қосуға болатын мүмкіндіктің ескерілуі(1,9).


Достарыңызбен бөлісу:
1   ...   70   71   72   73   74   75   76   77   ...   133




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет