Корпустық лингвистика пәні және оның зерттеу объектісі.
Корпустық лингвистика пәнінің мақсаты мен міндеттері, зерттеу нысаны. Кең көлемді ақпараттық ресурстарды оқыту үрдісінде қолдану, ақпараттарды өңдеп, ұсына алу, оны дамытып отыру – қазіргі білім беру үрдісіндегі өзекті мәселелердің бірі. Компьютерлік технологияны қолдана отырып оқыту қазіргі қоғамда жаңа білімді меңгеруде құрылыс материалы болып табылатын ақпаратты зерттеу тәсілдерін меңгеру ретінде қарастырылып келеді. Тілдерді оқыту үрдісіне компьютерлерді ендірудің теориялық мәселелері компьютерлік лингводидактиканың зерттеу пәні болып табылады. Қазіргі кезде оны анықтаудың екі қыры бар: алгоритмдік және когнитивті-интеллектуалдық. Олардың негізінде жасалған оқытудың компьютерлік құралдары келесі параметрлермен ерекшеленеді: тілдерді меңгерту үрдісінде компьютердің функционалды мүмкіндіктерін жүзеге асыру деңгейі; компьютерді қолданушы мен компьютердің өзара қарым-қатынасының интерактивтілік деңгейі; танымдық әрекеттің түрлі модельдеріне бейімделу .Тілдерді оқыту үрдісіне компьютерлік технологияны ендірудің қазіргі қалпын зерттеу барысында қолданбалы тіл білімінде жаңа бағыттың – компьютерлік лингвистиканың пайда болып, дамуына әкелді. Осы ғылымның пайда болуына қазіргі ақпараттандырудың жаһандану үрдісі, ғылыми және техникалық прогрестің белгілі бір қажеттіліктерінің, сонымен бірге жасанды интеллекет жүйесін, жасанды тілдер үлгілерін құру қажеттілігінің алғышарттары зор ықпал етті. Алайда бұл міндеттердің барлығын лингвистика теориясынсыз шешу мүмкін емес, өйткені тарихи жүйе ретінде қалыптасқан табиғи тілдер адамдардың өзара қарым-қатынасына қызмет етсе, жасанды тіл де адам-машина, машина-машина, машина-адам қарым-қатынасы үшін жасалған, олардың екеуінің негізі бір, ортақ қызмет атқарады, жұмсалу үлгісі мен құрылымы да бірдей. Лингвистика ғылымынсыз жасанды тілді жетілдіру, сонымен бірге адамның компьютермен табиғи тілде қарым-қатынас жүйесін жасау, күрделі адам-машина кешені қызметінің тиімділігін арттыру мүмкін емес. Өз кезегінде машиналық әдіспен өңдеу, жинау, сақтау, іздеу, жіктеу, табиғи тілдерді талдауға көшу кезінде классикалық лингвистика өзінің алдағы дамуына үлкен қарқын алды. Компьютерлік лингвистиканың зерттеу мақсаты – ЭЕМ-да қарым-қатынас жасау үшін жасанды тілдердің құрылуымен байланысты компьютерлік технологияның лингвистикалық мәселелелерін шешу, бағдарламаларды лингвистикалық құралдармен қамту, мәліметтер жиынтығын құру, түрлі сөздіктер мен глоссарийлер құрастыру, мәтіндерді өңдеу алгоритмі, тілдік семантикалық кодын ескере отырып, түрлі тілдік үрдістерді үлгілеу. Корпустық лингвистика ерекше ғылыми бағыт ретінде ХХ ғасырдың 60-жылдары пайда болды. Стэндфорд және Нью-Йорк университеттерінде (АҚШ) алғаш рет тілдерді ЭЕМ-да оқытудың алғышарттары жасалған. Дәл осы жылдары «табиғи тілдерді өңдеу» атты қолданбалы бағыт пайда болды. Корпустық лингвистикамәселесі тар мағынасында «жасанды интеллект» ғылыми-техникалық пәні аясында дамыды. «Табиғи тілдерді өңдеу» сөз тіркесі компьютердің тілдік мәліметтерді өңдеу үшін қолданылатын барлық салаларын қамтиды. Шет елде 70-жылдары ЭЕМ-ді тілді оқыту үшін ендіру мәселесі Батыс Еуропаны, Жапонияны және Латын Америкасы елдерінің қызығушылығын тудырды. Ресей және ТМД елдерінде есептеу техникасын ана тілді және шет тіліді оқыту үшін қолдану өткен ғасырдың 70-80-жылдары қолға алынды. К.Р. Пиотровская жазып кеткендей, алғашқы жылдары оқытудың қағаздағы құралдарының электронды бейнесі ғана беріліп келді, компьютерді қолдану оқытушының имитациясына бейімделген еді. 80-жылдардың ортасында тілдерді үйретуде компьютерлік қолдау мәселесімен айналысатын ғылыми бағыт – Computer Assisted Language Learning қалыптасты. Оның аясында халықаралық ақылдасулар мен Корпустық лингвистикамәселелері бойынша конференциялар ұйымдастырылды. 80-90-жылдар соңына қарай компьютердің техникалық мүмкіндіктері компьютермен оқыту бағдарламаларының негізгі ерекешілктері – матриал көлемінің шағындығы, грамматиканың бір немесе бірнеше бөлімдеріне сәйкесуі, бір сызықтылығы. 90-жылдардың екінші жартысында компьютерлер мен телекоммуникациялық құралдардың жаңа түрлерінің пайда болуымен лингвистикалық ақпараттық орта кеңістігін кеңейту мақсатында мультимедиялық технологияға негізделген бағдарламалар жасалды. Мультимедиялық технологияның түрлі формадағы (мәтін, дыбыс, видео, анимация) үлкен көлемдегі оқу ақпараттарын біртұтастыққа біріктіру мүмкіндіктері қысқа мерзімдерде бірінші толқын локалды бағдарламаларынан қазіргі аралас оқыту кешеніне өтуге мүмкіндік береді. Компьтерлік лингвистиканың маңызды мәселелерінің бірі – автоматты оқылатын лингвистикалық жүйені анықтау. Өкінішке орай, ғылыми және арнайы әдебиеттерде бұл ұғымның анқытамасы жоқ. Алайда «оқытушы лингвистикалық автомат» деген ұғым бар, осы терминнің авторы Р.Г.Пиотровскийдің пікірінше, оған автоматты мәтін өңдеудің жан-жақты жүйесі, тілді оқыту барысында қолданылатын және оны қолдайтын (компьютер, аудио- және видеоқұралдар) мәтін редакторы мен басқа бағдарлама құралдары кіреді. Оқытатын лингвистикалық автоматты қолданудың екі қыры бар: 1) бихевиористтік – бұрыннан бар дәстүрлі оқыту бағдарламаларын жасау барысында жүзеге асады. Оларда алдын ала берілген құрылымдар бар, оқытушылардың өздері авторлық бағдарлама негізінде нақты грамматиканың бөлімін оқытуда немесе үйренущшілердің лексикалық білімін тексеруде қойылымдық сипаттағы жаттығулар көмегімен, сонымен бірге компьютерлік тестпен жасай алады. 2) когнитивті-интеллектуалдық – тілдерді оқытуды компьтермен қамту, мәтінді автоматты түрде өңдеуге арналған жан-жақты бағдарлама жасауды қарастырады. Бұл жерде лингвостатистика әдісін, семантикалық жүйені, семантика-синтаксистік фреймдерді, автоматты оқу сөздіктерін, грамматикалық кестелерді қолданылады.