Корпустық лингвистика – лингвистиканың бір саласы.
«Корпустық лингвистика» негізінен, тіл қызметін модельдеуге қатысты пайдаланылатын компьютерлік бағдарламалар мен тілдік деректерді өңдеу, сол үшін қажетті компьютерлік технологияны жинақтау және компьютердің араласуына қатысты басқа да тіл зерттеу жұмыстарымен байланысты қолданылады. Кең мағынада алғанда, тіл білімі аясына қатысты теориялық және практикалық мәселелердің шешімін табуға байланысты компьютердің араласу жағдайларының бәрін бірдей Корпустық лингвистикасаласына жатқызуға болады. 1946-1947 жылдары ЭЕМ арқылы машиналық аударма жасау идеясы Принстонның ғылыми-зерттеу институтында арнайы мәселе ретінде талқыланады. Ең алғаш бұл идея дешифровка ісінің америкалық маманы Уоррен Уивердің меморандумында бірізді шешімге келтірілді. Ал 1949 жылдың 15 шілдесінде атақты ғалым өз меморандумында көтерілген мәселелерді тіл және есептеу техникасы мен дешифровка салаларындағы екі жүзден астам мамандарға жария етті. Машиналық аударманың өзінше бөлек ғылыми бағыт ретіндегі даму кезеңі Уивердің меморандумынан бастама алады. Бұл бағытты, шартты түрде, негізгі үш кезеңге бөліп қарастыруға болады. Олар: 1-кезең: 1949 жылдан бастап 60-жылдардың ортасына дейін; 2-кезең: 60-жылдардың ортасынан 70-жылдардың аяғына дейін; 3-кезең: 80-жылдардан қазіргі кезеңге дейін. Мұндай үш кезеңге бөлуге негіз болған ғылым мен техниканың дамуындағы қол жеткен нәтижелер екені белгілі. Міне, со6лардың ішінен лингвистикалық, математикалық, техникалық машиналық аударма жүйесін жабдықтау мәселелері айрықша орын алады. Кең көлемді ақпараттық ресурстарды оқыту үрдісінде қолдану, ақпараттарды өңдеп, ұсына алу, оны дамытып отыру – қазіргі білім беру үрдісіндегі өзекті мәселелердің бірі. Компьютерлік технологияны қолдана отырып оқыту қазіргі қоғамда жаңа білімді меңгеруде құрылыс материалы болып табылатын ақпаратты зерттеу тәсілдерін меңгеру ретінде қарастырылып келеді. Компьютерлік лингвистиканың зерттеу мақсаты – ЭЕМ-да қарым-қатынас жасау үшін жасанды тілдердің құрылуымен байланысты компьютерлік технологияның лингвистикалық мәселелелерін шешу, бағдарламаларды лингвистикалық құралдармен қамту, мәліметтер жиынтығын құру, түрлі сөздіктер мен глоссарийлер құрастыру, мәтіндерді өңдеу алгоритмі, тілдік семантикалық кодын ескере отырып, түрлі тілдік үрдістерді үлгілеу. Корпустық лингвистикаерекше ғылыми бағыт ретінде ХХ ғасырдың 60-жылдары пайда болды. Стэндфорд және Нью-Йорк университеттерінде (АҚШ) алғаш рет тілдерді ЭЕМ-да оқытудың алғышарттары жасалған. Дәл осы жылдары «табиғи тілдерді өңдеу» атты қолданбалы бағыт пайда болды. Корпустық лингвистикамәселесі тар мағынасында «жасанды интеллект» ғылыми-техникалық пәні аясында дамыды. Компьтерлік лингвистиканың маңызды мәселелерінің бірі – автоматты оқылатын лингвистикалық жүйені анықтау.