Н. Ю. Зуева (жауапты хатшы), О. Б. Алтынбекова, Г. Б. Мәдиева



Pdf көрінісі
бет29/46
Дата15.03.2017
өлшемі3,99 Mb.
#9386
1   ...   25   26   27   28   29   30   31   32   ...   46

Әдебиеттер 
 
1  Ергөбек Қ. Баянғұмыр. –  Алматы: Жазушы, 1991. – 110 б. 
2  Исабеков Д. Таңдамалы. –  2 томдық. – Алматы: Жазушы, 1993. – Б. 45-48. 
3  Қирабаев С. Кеңес дәуіріндегі қазақ әдебиеті. – Алматы: Білім, 1998. – 210 б. 
4  Исабеков Д. Жазумен өткен қырық жыл // Егемен Қазақстан, 21 ақпан. – 2001. – №39. 
 
 References 
 
1 Ergөbek Қ. Bayanғұmyr. –  Almaty: Zhazushy, 1991. – 110 b. 
2  Isabekov D. Taңdamaly. –  2 tomdyқ. – Almaty: Zhazushy, 1993. – B. 45-48. 
3  Қirabaev S. Keңes dәuіrіndegі қazaқ әdebietі. – Almaty: Bіlіm, 1998. – 210 b. 
4  Isabekov D. Zhazumen өtken қyryқ zhyl // Egemen Қazaқstan, 21 aқpan. – 2001. – №39. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Жазушы Дулат Исабеков шығармалары 

Вестник КазНУ. Серия филологическая. № 3(149). 2014
 
ТІЛДІ ОҚЫТУ ӘДІСТЕМЕСІ 
МЕТОДИКА ПРЕПОДАВАНИЯ ЯЗЫКА 
 
 
 
 
 
 
 
 
 
 
УДК  81:372.881 
 
*К. Т. Кенжеева, Р. С. Туребекова 
 
ст. преподаватели Казахского  национального  университета  им. аль-Фараби, 
г. Алматы, Казахстан 
*е-mail: 
kulsharuan@mail.ru

tore.raushan@mail.ru
 
 
К вопросу о речевых  ошибках 
 
В статье предлагаются методические приемы  повышения речевой культуры студентов, совершенствова-
ния  языковой  коммуникации.  Более  глубокое,  осмысленное  понимание    языковых  норм  будущими    спец-
иалистами  поможет им в развитии речи  не только правильной, но и выразительной, точной, уместной. При 
рассмотрении  основных  аспектов  речевой  деятельности  анализируются  наиболее  часто  встречающиеся 
ошибки  в  речи  студентов казахских  отделений,  выясняются причины  их  возникновения.  Для  решения  этой 
задачи слова даются  с различных точек зрения: значения (однозначные, многозначные). Экспрессивно-сти-
листической  точки  зрения  (стилистически  нейтральные,  официальные,  книжные,  разговорные  и  про-
сторечные). Устаревания и новизны (архаизмы, историзмы, неологизмы). Происхождения (исконно русские 
слова,  старославянизмы,  заимствованные  слова).  Сферы  употребления  (общеупотребительная  лексика,  тер-
мины,  диалектизмы,  жаргонизмы).  Предложенные  практические  задания    помогут  студентам  разобраться  в 
отличительных  особенностях  слов:  значении,  стилистической    окраске,  употребительности,  сочетаемости  с 
другими словами.  
Ключевые слова: речевые ошибки, редактирование, языковые нормы, повышение речевой культуры. 
 
К. Т. Кенжеева, Р. С. Туребекова 
Кейбір сөз қателері  туралы 
 
Мақалада  тілдік қарым-қатынасты жетілдіру барысында студенттердің сөз мәдениетін көтеру мақсатын-
да бірқатар әдістемелік құралдар ұсынылады. Болашақ мамандардың тілдік нормаларды тереңірек, байыпты 
түсінуі олардың сөз мәдениетін дамытуда тек дұрыс қана емес, нақты, тиянақты, орынды болуға көп септігін 
тигізеді. Сөз қызметінің негізгі аспектілерін қарастырғанда қазақ бөлімінде оқитын студенттердің сөздерін-
дегі жиі кездесетін қателер мен олардың пайда болу себептері басшылыққа алынады. Осы мәселелерді шешу 
барысында  сөздер  әртүрлі  көзқарастар  тұрғысынан  беріледі:  мағыналық  жағынан    (тура  мағыналы,  көп 
мағыналы).  Экспрессивтік-стилистикалық  көзқарас  тұрғысынан  (стилистикалық  бейтараптық,  ресми,  кі-
таби, ауызекі және қарапайым сөз). Көнерген және жаңашыл (көнерген сөздер, тарихи көнерген сөздер, нео-
логизмдер).  Тектер  (ежелгі  орыс  сөздері,  көне  славянизмдер,  кірме  сөздер).  Қолданылу  аясы  (жалпықо-
ғамдық  лексика,  терминдер,  диалектизмдер,  жаргондар).  Берілген  жаттығулар    студенттердің  сөздердің 
айырым белгілерін ажырата білуге үйретеді: мағыналық жағынан, стилистикалық бояулары, қолданылу аясы, 
басқа сөздермен байланыстылығы. 
Түйін сөздер: сөз қателері, редакциялау, тілдік нормалар, сөз мәдениетін көтеру. 
 
K. Kenzheeva, R.S. Turebekova 
On the speech errors 
 
The article offers methodological techniques for improving speech culture of students, improving their language 
communication. Deeper understanding of meaningful linguistic norms will help future specialists to make their 
speech not only correct, but also expressive, accurate, relevant. When considering the main aspects of speech activity 
the most common errors in the speech of students of Kazakh faculty are analyzed to investigate the reason of their 
occurrence. To solve this problem, the words are interpreted from different perspectives: meaning (monosemantic, 
polysemantic), expressive stylistic point of view (stylistically neutral, formal, literary, conversational and colloquial), 

163 
 
 
 
 
ISSN 1563-0223                        Bulletin KazNU. Filology series. № 2(148). 2014
obsolescence and novelty (archaisms, historicisms, neologisms), their origin (native Russian words Old Slavonic 
words, adoptions), field of use (general vocabulary, terminology, dialects, slang). Practical assignments that are 
offered will help students to understand the distinctive features of words: meaning, stylistic nuance, field of use, 
combinatory power. 
Key words: speech errors, editing, linguistic norms, improving of speech culture. 
_____________________________________ 
 
Эта тема приобретает все большую актуаль-
ность  в  наши  дни.  В  современной  обыденной 
речи  мы  очень  часто  наталкиваемся  на  косно-
язычие: «Теперь нам нужно будет определиться 
вот  о  чем…» «мы  пока  тут  обсудили…»  и 
прочее. Вместо слова, адекватного мысли, зву-
чит уже привычно неправильная речь. 
Речевая  культура – один  из  компонентов 
общей  культуры  человека,  она  прививается, 
воспитывается  и  требует  постоянного  совер-
шенствования.  В  сознании  человека  всегда 
имеется  представление  о  «речевом  идеале», 
образце,  в  соответствии  с  которым  должна 
строиться  правильная  нормированная  речь.  И 
если  следовать  языковым  нормам,  то  наша 
речь  будет  не  только  правильна,  но  и  вырази-
тельна, точна и уместна.  
Данная  статья – это  попытка  рассмотреть 
основные  аспекты  речевой  деятельности,  про-
анализировать  наиболее  часто  встречающиеся 
в речи ошибки и неточности. Конечная цель – 
повышение  речевой культуры студентов за не-
большой период одного семестра.  
Кроме  изучения  основных  вопросов  курса 
дисциплины нами уделяется внимание не толь-
ко исправлению речевых ошибок, но объясне-
нию причин их появления  (можно на занятиях 
СРСП  или  на  элективных  курсах).  Часто  ис-
пользуются  тексты  для  редактирования  сту-
дентами, в которых специально допущены лек-
сические,  морфологические  и  синтаксические 
ошибки,  Такие  задания  предлагаются  для  вы-
полнения  студентам  нефилологических  спе-
циальностей.  Можно  предложить  студентам 
выписывать ошибки, найденные ими в газетах, 
объявлениях, рекламных щитах. 
Особое  значение  имеет  работа  над  пра-
вильностью  речи,  ее  соответствии  языковым 
нормам.  Но одной, так скажем, правильности 
речи  недостаточно.  Наблюдения  показывают, 
что  встречаются  в  речи  молодежи,  повто-
ряются из поколения в поколение однотипные 
нарушения.  Студенты  казахских  отделений, 
изучающих  профессионально  ориентирован-
ный  русский  язык,  имеют  большие  затрудне-
ния  при  самостоятельном  выборе,  например, 
вариантной  (и  вариативной)  нормы.  Равно-
правных  и  неравноправных  вариантов  норм. 
Слабо  чувствуют  оттенки  семантической  раз-
ницы на лексическом и морфологическом уров-
нях.  Тем  более  на  синтаксическом  или  стиле-
вом уровнях. Часто сомневаются при ответе на 
вопрос:  знают  ли  они  пары  слов  и  чем  они 
отличаются:  ирис  и  ирис,  сейчас  и  ныне
учители и учителя, глаза и очи, ветры и ветра
Следовательно,  нужно больше работать в этом 
направлении.  
Рассмотрим  роль  слова  в  жизни  человека. 
Слово отражает все изменения, происходящие 
в  обществе.  Оно  не  только  называет  предмет 
или  явление,  но  и  выполняет  эмоционально-
экспрессивную  функцию.  И,  выбирая  слова, 
мы  обращаем  внимание  на  их  значение,  сти-
листическую  окраску,  употребительность,  соче-
таемость с другими словами. Что же происхо-
дит,  когда  возникает  непонимание  значения 
слова.  Например,  при  употреблении  слова  в 
несвойственном  ему  значении:  спор  все  боль-
ше распалялся (разгорался). При употреблении 
знаменательных  и  служебных  слов  без  учета 
их семантики,  могут  возникнуть ошибки: бла-
годаря  (из-за) развалу(а). Выбор слов-понятий 
(конкретная  и  отвлеченная  лексика).  Пример: 
предлагаем  полное  излечение  наркоманов 
(наркомании)  и  других  заболеваний.  Непра-
вильное  использование  паронимов:  грецкий 
язык,  греческий  орех.  Это  очень  похожие 
слова, однокоренные. Но значение имеют раз-
ное:  первое – название  сорта  ореха,  второе – 
прилагательное.  Чтобы  восстановить  смысл 
высказываний  в  примере,  нужно  поменять 
паронимы  местами.  Поэтому  умелое  употреб-
ление  паронимов  способствует  передаче  тон-
ких  смысловых  оттенков,  помогает  точнее 
выразить мысль. 
Остановимся  на  лексической  сочетае-
мости:  страшная  красавица.  Умышленное  объе-
динение  слов:  живой  труп,  звонкая  тишина
Перед  нами  один  из  видов  тропов – оксю-
морон.  Часто  на  помощь  приходит  словарь  
сочетаемости слов. 
Основными  причинами  речевых  ошибок 
являются:  неправильное  употребление  сино-
нимов, употребление омонимов, употребление 
многозначных  слов.  Синонимы  обогащают 
язык, делают образной нашу речь при наличии 
разной функционально-стилистической окраски. 
Синонимы  бывают  общеупотребительные,  про-
К вопросу о речевых  ошибках 

164 
 
Вестник КазНУ. Серия филологическая. № 3(149). 2014
 
сторечные,  нейтральные,  разговорные.  При-
мер:  воздвигать  (строить)  скотный  двор.  При 
использовании  синонимов  студенты    часто  не 
учитывают  способность  каждого  из  них  в 
большей  или  меньшей  степени  избирательно 
сочетаться  с  другими  словами.  Различаясь 
оттенками  лексического  значения,  синонимы 
могут  выражать  разную  степень  проявления 
признака, действия. Но, даже обозначая одно и 
то  же,  заменяясь  в  одних  случаях,  в  других 
синонимы  заменяться,  не  могут.  Употребле-
ние  одного  из  вариантов  без  учета  его  се-
мантики,  стилистической  окраски  приводит  к 
речевой  ошибке.  Благодаря  контексту  омо-
нимы, как правило, понимаются верно: тройка 
(костюм  и  оценка).  При  употреблении  мно-
гозначных слов (как и при употреблении омо-
нимов)  очень  важен  контекст.  Мальчик  рас-
пелся  непонятно:  или  он  начал  петь,  увлекся
или,  пропев  некоторое  время,  начал  петь 
легко, непринужденно?  
Что  означает  многословие? Плеоназм,  на-
пример:  все  получили  памятные  сувениры 
(лишнее  слово – памятные).  Разновидность 
плеоназмов – это выражения: очень огромный,  
очень  малюсенький,  очень  прекрасный  и  т.  п. 
Прилагательные, обозначающие признак в его 
предельно  сильном  или  предельно  слабом 
проявлении,  не  нуждаются  в  уточнении  сте-
пени  признака.  Использование  лишних  слов. 
Лишние  не потому, что свойственное им лек-
сическое значение выражено другими словами, 
а  потому,  что  они  просто  не  нужны  в  данном 
тексте.  Тавтология – повторение  однокорен-
ных  слов:  сложилась  сложная  ситуация.  
Слова-паразиты.  Пример:  недавно  встретился 
мне  знакомый,  ну,  как  его,…этот  самый… 
Лексическая  неполнота  высказывания:  мне, 
пожалуйста,  двойную.  К  каким  ошибкам  при-
водят неудачно созданные  неологизмы? Ямоч-
ный ремонт, то есть ремонт ям на дорогах. 
Перейдем  к    неправильному    использова-
нию  устаревших  слов,  слов  иноязычного  про-
исхождения,  диалектизмов,  разговорных  и 
просторечных  слов,  профессиональных  слов. 
Архаизмы: ныне день открытых дверей. Исто-
ризмы:  Да,  вот  ты  и  буржуй!  Иноязычные 
слова: действия легитимные (законные, разре-
шенные).  Диалектизмы:  я  купила  рушник 
(полотенце). Разговорные слова: куртка у меня 
худая  (дырявая).  Профессионализмы  и  жарго-
низмы: водитель и водила. 
Часто  студенты  забывают  или  не  знают  о 
переносном смысле фразеологизмов: ждать у 
моря  погоды  (очень  долго  ждать,  понимают  в 
прямом  смысле);  он  сидит  сложив  (сложа) 
руки;  играть  значение  и  иметь  роль  (играть 
роль, иметь значение).  
Приведем  ниже  задания,  которые  выра-
жают  различную  семантику  слов,  их  лекси-
ческую,  стилистическую  и  логическую  соче-
таемость.  Довольно  четко  видно  отличие  слов  
с  нейтральной,  разговорной,  эмоциональной 
возвышенной окраской. Выполнение подобной 
работы,  на  наш  взгляд,  поможет  студентам 
видеть эти самые, часто допускаемые ошибки,  
и  работать  серьезнее.  Правильные    варианты 
ответов  выделены курсивом.  
1. Подчеркните  только те слова и словосо-
четания,  которым  свойственна  официально-
деловая окрашенность: 
Воздать  должное,  нетрудоспособность
извлекать  квадратный  корень,  принять  к  ис-
полнению,  страховой  полис,  быстро,  надле-
жащийпредписывать, чудесный случай, про-
водить исследованиеходатайствоватьобви-
нительный  приговор,  поставить  на  вид,  со-
циология,  установленный  порядок,  единовре-
менное пособие, посоветовать, прямые обязан-
ности,  прогулка,  соглашение,  несоблюдение
дипломная работа, просрочкаответчик.  
2.Данные  сочетания  запишите  в  два  стол-
бика:  в  левом - стилистически  нейтральные,  в 
правом - стилистически  отмеченные  (то  есть, 
разговорно-бытовые): 
Крутой  спуск,  крутой  нрав;  домашнее  хо-
зяйство, домашний ребенок; махнуть платком
махнуть  за  город;  съехать  по  склону,  съехать 
на  двойки;  боевая  слава,  боевая  девочка;  дер-
жаться за город, держаться за кресловлезть 
на дерево, влезть в глупую историю. 
3.Объясните  значение  выделенных  выра-
жений: 
У нас с тобой, Артем, ни кола, ни двора. На 
соседней  большой  станции  рабочие  заварили 
кашу.  Этим  контрабандистам  Гришутка  стал 
поперек горла. Исчез, как в воду канул. Искал 
до  седьмого  пота. "Свалился  как  снег  на 
голову", - смеясь,  сказала  Рита.  К  ночи  он 
совсем  выбился  из  сил.  Дело  выеденного  яйца 
не  стоит.  Я  в  этих  делах  стреляная  птица. 
Скажи, Цветаев, за что ты на меня зуб имеешь? 
4. Попробуйте восстановить полную форму 
следующих  разговорных  фраз.  Образец:  Не 
видели  с  детской  коляской? - Не  видели  жен-
щину с детской коляской?: 
1. У вас есть от кашля? (таблетки). 
2. С зелеными балконами - это ваш? (дом). 
3.  Мне  два  за  тридцать  и  один  бублик? 
(хлеб). 
К. Т. Кенжеева, Р. С. Туребекова 

165 
 
 
 
 
ISSN 1563-0223                        Bulletin KazNU. Filology series. № 2(148). 2014
4. За мной в очках и женщина с ребенком. 
(мужчина). 
5.  В  серой  шубе  не  проходила  здесь? 
(женщина). 
6.  В  синем  халате  всегда  с  ним  кокетни-
чает. (медсестра или женщина). 
5.  Исправьте  ошибки,  назовите  виды  оши-
бок (плеоназм, тавтология и др.): 
В Индии живут индейки, а в Корее корейки. 
В  комнате,  возле  печки,  стояла  девушка, 
она была жарко натоплена. 
Вынужден  был  совершить  вынужденную 
посадку. 
Воздвигнуть скотный двор. 
Книга пополняет кругозор    
Любой проступок заслуживает уважения.  
Мы вкалывали не покладая рук. 
Он  записал  песни  коренных  аборигенов 
севера  
Отец умер, когда ему было 9 лет. 
Отшумела  белая  метелица,  оставив  обиль-
ные осадки.  
Он целую тарелку съел. 
Сегодня у нас гости гостят из Испании.   
Сложилась сложная ситуация  
Соседний кот важно пришел на кухню. 
Столяр  сделал  эту  этажерку  из  дуба  с 
четырьмя ножками.  
Студенты  слушали  лекцию  по  сварке  про-
фессора Иванова. 
Хорош  зимний  лес:  синеватые  тени  сосен 
лежат на снежном покрове.  
Я одела шубу. 
5.  Замените  слова  нейтральными  синони-
мами: 
Адаптация,  банальный,  бесценный,  брег, 
вылезать,  выя,  древо,  драпать,  долговязый,  дуб-
ликат, злато, око, лик, обет, вкушать, мыслить, 
молвить притащить.  
6.  Найдите  случаи  нарушения  традицион-
ной сочетаемости. 
Достичь  (успеха,  выполнения,  повышения, 
порядка,  послушания,  победы).  Провести  (со-
вещание,  перестройку,  контроль,  организа-
цию,  завершение,  помощь,  оценку).  Проявить 
(медлительность,  заботу,  желание,  дисцип-
лину,  энергичность,  грубость,  порядок,  равно-
душие). 
 Таким  образом,  речевая  ошибка – это 
ошибка  не  в  построении,  не  в  структуре 
языковой единицы, а в ее использовании, чаще 
всего в употреблении слова. По преимуществу 
это нарушение лексических норм.  
Развитие  у  студентов  умения  чувство-
вать  и    отбирать  правильные  речевые  сред-
ства  с  учетом  ситуации  и  обстановки  речи, 
умение  избегать  двузначности,  тавтоло- 
гии,  тяжеловесных  конструкций,  несомнен- 
но,  приведет  к  мастерству,  к  культурной  
речи. 
 
Литература 
 
1  Введенская  Л.А.,  Павлова  Л.Г.,  Кашаева  Е.Ю.  Русский  язык  и  культура  речи. – М.:  учебное  пособие  для  вузов. –  
Ростов-на Дону: Феникс, 2001. 
2 Голуб И.Б. Русский язык и культура речи. – М.: Логос, 2001. 
 
References 
 
 1 Vvedenskaya L.A., Pavlova L.G., Kashaeva E.Yu. Russkiy yazyk i kul'tura rechi. – M.: uchebnoe posobie dlya vuzov. –  
Rostov-na Donu: Feniks, 2001. 
2 Golub I.B. Russkiy yazyk i kul'tura rechi. – M.: Logos, 2001. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
К вопросу о речевых  ошибках 

Вестник КазНУ. Серия филологическая. № 3(149). 2014
 
ЖАС ҒАЛЫМДАР 
МОЛОДЫЕ АВТОРЫ 
 
 
 
 
 
 
 
 
 
 
UDC 81'374 
 
D. Myrzakhat 
 
Magistrant of a I course of Kazakh National University of the name al-Farabi, 
Almaty, Kazakhstan 
Scientific leader 
 D. f. n. professor A. H. Azamatova 
e-mail: 
dana_2408@mail.ru
 
 
Electronic corpora as a basis of modern English dictionaries 
 
 
The article is devoted to analysis of the various aspects of correlation between two linguistic disciplines: corpus 
linguistics and lexicography. It describes the current state of electronic corpora, provides a brief overview of the 
development stages of English lexicography. The article details the process of compiling major English corpora and 
defines their main functions. Particular attention is paid to determine the value of electronic corpora when creating 
dictionaries, the positive and negative impact of corpora on the development of lexicography. 
Key words:  electronic corpus, lexicography, corpus linguistics, text, dictionary. 
 
Электронды корпус заманауи ағылшын сөздіктерінің негізі ретінде 
     
Мақаланың негізгі мақсаты 
 корпустық лингвистика мен лексикография салаларының арақатынасының 
барлық  аспектілерін  талқылау.  Бұл  мақалада  электронды  корпус  және  ағылшын  лексикографиясы  сала-
ларына  сипаттама  беріліп,  олардың  тарихы  мен  даму  кезеңдеріне  қысқаша  шолу  жасалынады.  Ағылшын 
тілінің ірі корпустарының құрастырылу үдерісі қарастырылып, корпустың негізгі қызметтері айқындалады. 
Сондай-ақ  электронды  корпустардың  сөздік  жасауға  қандай  пайдасы  бар  екендігі  анықталады.  Корпустың 
лексикография  саласына  тигізетін  әсерінің  артықшылықтары  мен  кемшіліктері  мысалдар  арқылы  нақты 
дәлелденеді. 
Түйін сөздер: электрондық корпус, лексикография, корпустық лингвистика, мәтін, сөздік. 
   
Д. Ы. Мырзахат 
Электронный корпус как основа словарей современного английского языка 
     
 
Данная  статья  посвящена  анализу  различных  аспектов  соотношения  двух  лингвистических  дисциплин: 
корпусной лингвистики и лексикографии. В ней описывается современное состояние электронных корпусов, 
дается краткий  обзор этапов развития лексикографии английского языка. В статье подробно рассматривается 
процесс  создания  крупных  английских  корпусов  и  выделяются  их  основные  функции.  Особое  внимание 
уделяется определению значения электронных корпусов при создании словарей, положительное и негативное 
влияние корпусов на развитие лексикографии. 
Ключевые слова: электронный корпус, лексикография, корпусная лингвистика, текст, словарь. 
__________________________________ 
       
Corpus linguistics plays an important role in 
compiling, writing and revising dictionaries, as 
within a few seconds the linguist can get examples 
of words or phrases from millions of spoken and 
written texts. And since corpora continue to grow 
and are constantly being expanded with new texts, 
lexicographers have an instant access to up-to-
date information. 
The practice of dictionary-making began in 
1600s when Robert Cawdrey involved words that 
were considered difficult as they were borrowed 
from another language into his version of the 
dictionary [1, 49]. The words which came from 
Latin-English dictionaries and other available 

167 
 
 
 
 
ISSN 1563-0223                        Bulletin KazNU. Filology series. № 3(149). 2014
texts of the time were given brief definitions, 
synonym and a fixed form. It was Samuel Johnson 
who distinctly introduced the methods or steps 
that were taken to create his dictionary in the 
1700s and some of the methods were then fol-
lowed by the committee entrusted to create “A 
New Dictionary” or currently known as the 
Oxford English Dictionary in the 1800s. 
A corpus is a collection of samples of aut-
hentic spoken and written text which are used for 
analysis of words, meanings, grammar and usage 
[2, 74]. In Saussurian terminology, the text is akin 
to that of parole, while the corpus provides the 
evidence of langue. The term corpus linguistics is 
used when a corpus is specifically used to study a 
language. Lindquist distinguishes the term with 
other branches of linguistics such as sociolin-
guistics (the study of language and society), or 
psycholinguistics (the study of language and the 
mind) in that corpus linguistics is a specific 
method used in language study, the “how to” 
rather than the “what”. In other words, corpus 
linguistics is an approach rather than a specific 
field of language study [3, 38].  
In 1950s, there was a growing dissatisfaction 
of how language could not reason out the many 
‘ungrammatical’ patterns found in English. There 
was a strong call for empirical, real language data 
[4, 46]. It was then that corpus was invented. The 
first corpus was made out of a survey of English 
usage conducted by two universities, University 
of London and the Brown University Corpus in 
Providence. In the 1960s, both compiled its mil-
lion word corpus of written text from 500 reading 
passages, which was named Brown Corpus. This 
American corpus was a landmark in corpus 
linguistics since it was the first corpus to employ a 
computer in its making. In 1982, the British 
version of the corpus, named the LOB corpus was 
compiled by Hofland and Johansson. LOB is an 
abbreviation from The Lancaster-Oslo-and Ber-
gen, and as its name suggests it is a collaborative 
attempt between the three universities: the 
University of Lancaster, the University of Oslo, 
and the University of Norwegian Computing 
Centre of the Humanities.  
However, both the Brown corpus and LOB 
corpus were deemed to be inadequate to sample 
English vocabulary. This gave birth to John Sin-
clair’s English Lexical Studies which specifically 
aimed to investigate vocabulary using an electro-
nic text of spoken and written language. The study 
gave prominence to collocation - words that 
naturally co-occur together. Aimed to represent 
varieties of English where it is used as a first or 
second language, Sidney Greenbaum compiled 
one-million-word corpora called The International 
Corpus of English in 1988. The unique feature of 
this corpus is that it samples more spoken 
language (60%) than its written counterpart 
(40%).  
In the early 1990s, major universities and 
companies together compiled British National 
Corpus (BNC) containing 100 million words from 
1980 up to 1993. The compilers were Oxford 
University Press, Longman, Chambers, the British 
Library, Oxford University and Lancaster 
University. The aim of the corpus is to provide a 
balanced corpus that represents British English. 
The corpus includes 10% spoken language and 
90% written language, which comprises of 25% 
fiction and 75% non-fiction. One big distinction 
between BNC and Brown is that the former took 
samples from a longer piece of text between 
40,000 and 50,000 words. This gives BNC an 
added advantage of being representative since text 
contains a different use of words at the beginning, 
in the middle, and at the end. Due to its sheer size, 
representativeness, and care, most British pub-
lishers prefer to make use of this corpus as their 
source of lexicographic information.  
Typically, any corpora will need to go through 
a three-step process in its making. Before going 
through these three steps, however the writer 
needs to determine the basic outlines of a corpus 
such as the size of the corpus, the genre of the 
corpus, whether it will specifically look into 
written, spoken language, or both. Sinclair points 
out that the principles underlying corpus creation 
should be as large as possible including samples 
from a broad range of material in order to 
accomplish one way of representativeness to be 
anticipated with the technology of the time. The 
corpus should also be classified into different 
genres and even size. Once this basic outlines is 
determined, the three-step process may begin. It 
starts with collecting the data, spoken and written. 
It entails gathering a large mass of speech, written 
texts, obtaining permission, and doing a careful 
and organized record-keeping. The next step is 
computerization which entails converting raw 
spoken or written text into a digital format in a 
computer. Recording of speech may be painsta-
king since it needs to be transcribed manually. 
Another concern with spoken text is the issue of 
naturalness of the speech; it needs to be recorded 
in a natural, casual way that resembles how 
people speak every day in real life, not in a stilted 
way. Though written records seem to be less 
painstaking, it also has its problem, mainly the 
Electronic corpora as a basis of modern English dictionaries 

168 
 
Вестник КазНУ. Серия филологическая. № 3(149). 2014
 
copyright issue. Still some texts that come from 
books, magazines, and other written sources need 
to be retyped since scanning device software that 
detect and scan words automatically usually 
contain errors, so many that it’s best to avoid 
using them altogether. The last step is annotating, 
which involves assigning information such as 
parts of speech, etymology, for each data. It 
should be noted that the three mentioned steps 
need not to be seen as a separate process; they are 
all closely connected. For example, after gathering 
recording of speech, it may be best to transcribe it 
there and then.  
Corpus may have given a lot of contributions 
in language study, but its impact to lexicography 
did not start until 1989. Together with the advance 
of computer software, both have since contributed 
significantly to the development of lexicography. 
Since everything is automated and recorded in a 
digital format, lexicographers can now save their 
time and the tremendous amount of work needed 
in compiling a dictionary. Typically, a dictionary 
usually has information on the part of speech, 
usage, meaning, pronunciation, etymology of a 
word. Before the advent of corpora, all this infor-
mation had to be gathered manually; lexicograp-
hers needed to do the hard labor of collecting slips 
of paper containing text that they intend to include 
in the dictionary. For this reason, it took roughly 
50 years to complete Oxford English Dictionary
which was later known as New English Dictionary 
[5,124]. With corpora, dictionary makers can now 
use a large sample of authentic spoken and written 
text as a source to illustrate how each word in 
their list is used in real life. The citation used in 
dictionary comes from real-life discourse. Real 
contexts also provide accurate, well-defined 
lexical meanings in the definition of a word in 
dictionary, which is a huge improvement over the 
previous dictionary practice where words were 
defined using an unscientific manner. One huge 
improvement in dictionary making is the rich 
information available for words that have many 
invariant meanings such as take, go, and time, 
which tend to be overlooked in the previous 
dictionary practice [6,86].  
Another huge advantage of using corpora in 
lexicography is that information on word fre-
quency can also be obtained. This way, lexico-
graphers can assign whether a word is among the 
first 500 most common words, the next 500 and so 
on. Meyer notes that the most frequent words are 
functional words such as the, an, a, and, and  of 
which carry little lexical meaning and the least 
frequent words are content words such as proper 
nouns. Gries mentions two kinds of frequency 
information that lexicographers can obtain from a 
corpus: frequencies of occurrence of linguistic 
elements in the so-called frequency list, and 
frequencies of co-occurrence of these linguistic 
elements in concordances. Lindquist defines 
concordance as “a list of all the contexts in which 
a word occurs in a particular text”. Using a Key 
Word in Context concordance, words can be 
retrieved within their surrounding text, and be 
presented vertically on the screen. Since the infor-
mation is presented in contexts, lexicographers 
can easily assign the collocations of each word in 
their dictionary.  
Since corpus is discourse-based, it means that 
the word appears in haphazard, arbitrary col-
lection of occurrences. Dictionary makers need to 
check for some contradictions with ‘real’ mea-
ning. It is thus dangerous to solely depend on 
corpus. One way to check the word in context is 
to expand the text by retrieving its original source.  
The huge amount of data in the corpus also 
allows lexicographers to look for new words that 
occur for the first time in spoken or written text.  
However, the corpus has to be large enough to 
glean information on vocabulary items. A small 
corpus such as LOB corpus which stores roughly 
one million word items could not give lexico-
graphers enough information on the range of 
vocabulary items. A monitor corpus is also 
needed, in which large data of language is pooled 
from time to time, rather than fixed only in one 
particular time period. This way, the corpus is 
frequently updated with new words and meanings 
in today’s growing language.      
The first dictionary to be founded wholly on 
corpus is Collins COBUILD series of English 
Language Dictionary compiled in 1987, guided 
by John Sinclair. The dictionary has its citation 
taken from real life discourse, and each word is 
defined from these authentic texts, instead of 
relying on previous dictionary. This entails using 
a very large corpus so that it may be able to 
include all lemmas including their word senses. 
However, this presents problem in that there tends 
to be an exclusion of rare words such as 
apothegm.  Besides being the first corpus-based 
dictionary, COBUILD is innovative in that the 
definitions are related  to a classroom teacher 
explaining the words. For example in describing 
the word junk, it says: “You can use junk to refer 
to old and second-hand goods that people buy and 
collect”.  
In the practice of dictionary-making, one 
crucial distinction has to be made between corpus-
D. Myrzakhat 

169 
 
 
 
 
ISSN 1563-0223                        Bulletin KazNU. Filology series. № 3(149). 2014
based dictionary and corpus-driven dictionary. 
Dictionaries such as Collins COBUILD series of 
English Language dictionaries are said to be 
corpus-driven if the corpus itself is used to vali-
date information presented in the dictionary. Ho-
wever, if the corpus is used to extract the infor-
mation used in the dictionary, it is called corpus-
driven. Teubert suggests that dictionary should 
follow corpus-driven approach so that it may com-
plement standard linguistics and not just extend it. 
The role of the computer has a clerical role in 
lexicography which reducing the labor of sorting 
and filing and examining very large amounts of 
English in a short time [7, 39]. From simple tools, 
it has evolved to a substantial progress together 
with crucial, profound and basic linguistic gene-
ralizations. By these kinds of developed tools, 
they have revealed many topics for inquiry which 
have not been well explored by traditional lin-
guistic methods. 
In the modern era, the word has been reserved 
for collections of texts that are stored and 
accessed electronically. Electronic corpora are 
usually larger than the paper-based collections 
which are basically small, previously used to 
study the aspect of language [8,120]. This is due 
to the capacity of computers that can store and 
process large amount of information compared to 
the previous time. 
Together with the technological advance in 
computer, corpus provided a significant contri-
bution to the development of dictionary making. 
Corpus linguistics made such a huge impact in 
dictionary-making:  it significantly reduces the 
time and the heavy work it needs to compile a 
dictionary since everything is automated and 
computerized; each dictionary now resembles 
how language is used in real world; frequency of 
each word in the list can be assigned; much more 
information can be given to words with a lot of 
variant meanings such as go, and take; it makes it 
easy to include collocation because words appear 
in its surrounding text; it can quickly take ‘new’ 
everyday words into the system. 

Достарыңызбен бөлісу:
1   ...   25   26   27   28   29   30   31   32   ...   46




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет