Әдебиеттер
1 Ергөбек Қ. Баянғұмыр. – Алматы: Жазушы, 1991. – 110 б.
2 Исабеков Д. Таңдамалы. – 2 томдық. – Алматы: Жазушы, 1993. – Б. 45-48.
3 Қирабаев С. Кеңес дәуіріндегі қазақ әдебиеті. – Алматы: Білім, 1998. – 210 б.
4 Исабеков Д. Жазумен өткен қырық жыл // Егемен Қазақстан, 21 ақпан. – 2001. – №39.
References
1 Ergөbek Қ. Bayanғұmyr. – Almaty: Zhazushy, 1991. – 110 b.
2 Isabekov D. Taңdamaly. – 2 tomdyқ. – Almaty: Zhazushy, 1993. – B. 45-48.
3 Қirabaev S. Keңes dәuіrіndegі қazaқ әdebietі. – Almaty: Bіlіm, 1998. – 210 b.
4 Isabekov D. Zhazumen өtken қyryқ zhyl // Egemen Қazaқstan, 21 aқpan. – 2001. – №39.
Жазушы Дулат Исабеков шығармалары
Вестник КазНУ. Серия филологическая. № 3(149). 2014
ТІЛДІ ОҚЫТУ ӘДІСТЕМЕСІ
МЕТОДИКА ПРЕПОДАВАНИЯ ЯЗЫКА
УДК 81:372.881
*К. Т. Кенжеева, Р. С. Туребекова
ст. преподаватели Казахского национального университета им. аль-Фараби,
г. Алматы, Казахстан
*е-mail:
kulsharuan@mail.ru
;
tore.raushan@mail.ru
К вопросу о речевых ошибках
В статье предлагаются методические приемы повышения речевой культуры студентов, совершенствова-
ния языковой коммуникации. Более глубокое, осмысленное понимание языковых норм будущими спец-
иалистами поможет им в развитии речи не только правильной, но и выразительной, точной, уместной. При
рассмотрении основных аспектов речевой деятельности анализируются наиболее часто встречающиеся
ошибки в речи студентов казахских отделений, выясняются причины их возникновения. Для решения этой
задачи слова даются с различных точек зрения: значения (однозначные, многозначные). Экспрессивно-сти-
листической точки зрения (стилистически нейтральные, официальные, книжные, разговорные и про-
сторечные). Устаревания и новизны (архаизмы, историзмы, неологизмы). Происхождения (исконно русские
слова, старославянизмы, заимствованные слова). Сферы употребления (общеупотребительная лексика, тер-
мины, диалектизмы, жаргонизмы). Предложенные практические задания помогут студентам разобраться в
отличительных особенностях слов: значении, стилистической окраске, употребительности, сочетаемости с
другими словами.
Ключевые слова: речевые ошибки, редактирование, языковые нормы, повышение речевой культуры.
К. Т. Кенжеева, Р. С. Туребекова
Кейбір сөз қателері туралы
Мақалада тілдік қарым-қатынасты жетілдіру барысында студенттердің сөз мәдениетін көтеру мақсатын-
да бірқатар әдістемелік құралдар ұсынылады. Болашақ мамандардың тілдік нормаларды тереңірек, байыпты
түсінуі олардың сөз мәдениетін дамытуда тек дұрыс қана емес, нақты, тиянақты, орынды болуға көп септігін
тигізеді. Сөз қызметінің негізгі аспектілерін қарастырғанда қазақ бөлімінде оқитын студенттердің сөздерін-
дегі жиі кездесетін қателер мен олардың пайда болу себептері басшылыққа алынады. Осы мәселелерді шешу
барысында сөздер әртүрлі көзқарастар тұрғысынан беріледі: мағыналық жағынан (тура мағыналы, көп
мағыналы). Экспрессивтік-стилистикалық көзқарас тұрғысынан (стилистикалық бейтараптық, ресми, кі-
таби, ауызекі және қарапайым сөз). Көнерген және жаңашыл (көнерген сөздер, тарихи көнерген сөздер, нео-
логизмдер). Тектер (ежелгі орыс сөздері, көне славянизмдер, кірме сөздер). Қолданылу аясы (жалпықо-
ғамдық лексика, терминдер, диалектизмдер, жаргондар). Берілген жаттығулар студенттердің сөздердің
айырым белгілерін ажырата білуге үйретеді: мағыналық жағынан, стилистикалық бояулары, қолданылу аясы,
басқа сөздермен байланыстылығы.
Түйін сөздер: сөз қателері, редакциялау, тілдік нормалар, сөз мәдениетін көтеру.
K. Kenzheeva, R.S. Turebekova
On the speech errors
The article offers methodological techniques for improving speech culture of students, improving their language
communication. Deeper understanding of meaningful linguistic norms will help future specialists to make their
speech not only correct, but also expressive, accurate, relevant. When considering the main aspects of speech activity
the most common errors in the speech of students of Kazakh faculty are analyzed to investigate the reason of their
occurrence. To solve this problem, the words are interpreted from different perspectives: meaning (monosemantic,
polysemantic), expressive stylistic point of view (stylistically neutral, formal, literary, conversational and colloquial),
163
ISSN 1563-0223 Bulletin KazNU. Filology series. № 2(148). 2014
obsolescence and novelty (archaisms, historicisms, neologisms), their origin (native Russian words Old Slavonic
words, adoptions), field of use (general vocabulary, terminology, dialects, slang). Practical assignments that are
offered will help students to understand the distinctive features of words: meaning, stylistic nuance, field of use,
combinatory power.
Key words: speech errors, editing, linguistic norms, improving of speech culture.
_____________________________________
Эта тема приобретает все большую актуаль-
ность в наши дни. В современной обыденной
речи мы очень часто наталкиваемся на косно-
язычие: «Теперь нам нужно будет определиться
вот о чем…» «мы пока тут обсудили…» и
прочее. Вместо слова, адекватного мысли, зву-
чит уже привычно неправильная речь.
Речевая культура – один из компонентов
общей культуры человека, она прививается,
воспитывается и требует постоянного совер-
шенствования. В сознании человека всегда
имеется представление о «речевом идеале»,
образце, в соответствии с которым должна
строиться правильная нормированная речь. И
если следовать языковым нормам, то наша
речь будет не только правильна, но и вырази-
тельна, точна и уместна.
Данная статья – это попытка рассмотреть
основные аспекты речевой деятельности, про-
анализировать наиболее часто встречающиеся
в речи ошибки и неточности. Конечная цель –
повышение речевой культуры студентов за не-
большой период одного семестра.
Кроме изучения основных вопросов курса
дисциплины нами уделяется внимание не толь-
ко исправлению речевых ошибок, но объясне-
нию причин их появления (можно на занятиях
СРСП или на элективных курсах). Часто ис-
пользуются тексты для редактирования сту-
дентами, в которых специально допущены лек-
сические, морфологические и синтаксические
ошибки, Такие задания предлагаются для вы-
полнения студентам нефилологических спе-
циальностей. Можно предложить студентам
выписывать ошибки, найденные ими в газетах,
объявлениях, рекламных щитах.
Особое значение имеет работа над пра-
вильностью речи, ее соответствии языковым
нормам. Но одной, так скажем, правильности
речи недостаточно. Наблюдения показывают,
что встречаются в речи молодежи, повто-
ряются из поколения в поколение однотипные
нарушения. Студенты казахских отделений,
изучающих профессионально ориентирован-
ный русский язык, имеют большие затрудне-
ния при самостоятельном выборе, например,
вариантной (и вариативной) нормы. Равно-
правных и неравноправных вариантов норм.
Слабо чувствуют оттенки семантической раз-
ницы на лексическом и морфологическом уров-
нях. Тем более на синтаксическом или стиле-
вом уровнях. Часто сомневаются при ответе на
вопрос: знают ли они пары слов и чем они
отличаются: ирис и ир ис, сейчас и ныне,
учители и учителя, глаза и очи, ветры и ветра.
Следовательно, нужно больше работать в этом
направлении.
Рассмотрим роль слова в жизни человека.
Слово отражает все изменения, происходящие
в обществе. Оно не только называет предмет
или явление, но и выполняет эмоционально-
экспрессивную функцию. И, выбирая слова,
мы обращаем внимание на их значение, сти-
листическую окраску, употребительность, соче-
таемость с другими словами. Что же происхо-
дит, когда возникает непонимание значения
слова. Например, при употреблении слова в
несвойственном ему значении: спор все боль-
ше распалялся (разгорался). При употреблении
знаменательных и служебных слов без учета
их семантики, могут возникнуть ошибки: бла-
годаря (из-за) развалу(а). Выбор слов-понятий
(конкретная и отвлеченная лексика). Пример:
предлагаем полное излечение наркоманов
(наркомании) и других заболеваний. Непра-
вильное использование паронимов: грецкий
язык, греческий орех. Это очень похожие
слова, однокоренные. Но значение имеют раз-
ное: первое – название сорта ореха, второе –
прилагательное. Чтобы восстановить смысл
высказываний в примере, нужно поменять
паронимы местами. Поэтому умелое употреб-
ление паронимов способствует передаче тон-
ких смысловых оттенков, помогает точнее
выразить мысль.
Остановимся на лексической сочетае-
мости: страшная красавица. Умышленное объе-
динение слов: живой труп, звонкая тишина.
Перед нами один из видов тропов – оксю-
морон. Часто на помощь приходит словарь
сочетаемости слов.
Основными причинами речевых ошибок
являются: неправильное употребление сино-
нимов, употребление омонимов, употребление
многозначных слов. Синонимы обогащают
язык, делают образной нашу речь при наличии
разной функционально-стилистической окраски.
Синонимы бывают общеупотребительные, про-
К вопросу о речевых ошибках
164
Вестник КазНУ. Серия филологическая. № 3(149). 2014
сторечные, нейтральные, разговорные. При-
мер: воздвигать (строить) скотный двор. При
использовании синонимов студенты часто не
учитывают способность каждого из них в
большей или меньшей степени избирательно
сочетаться с другими словами. Различаясь
оттенками лексического значения, синонимы
могут выражать разную степень проявления
признака, действия. Но, даже обозначая одно и
то же, заменяясь в одних случаях, в других
синонимы заменяться, не могут. Употребле-
ние одного из вариантов без учета его се-
мантики, стилистической окраски приводит к
речевой ошибке. Благодаря контексту омо-
нимы, как правило, понимаются верно: тройка
(костюм и оценка). При употреблении мно-
гозначных слов (как и при употреблении омо-
нимов) очень важен контекст. Мальчик рас-
пелся непонятно: или он начал петь, увлекся;
или, пропев некоторое время, начал петь
легко, непринужденно?
Что означает многословие? Плеоназм, на-
пример: все получили памятные сувениры
(лишнее слово – памятные). Разновидность
плеоназмов – это выражения: очень огромный,
очень малюсенький, очень прекрасный и т. п.
Прилагательные, обозначающие признак в его
предельно сильном или предельно слабом
проявлении, не нуждаются в уточнении сте-
пени признака. Использование лишних слов.
Лишние не потому, что свойственное им лек-
сическое значение выражено другими словами,
а потому, что они просто не нужны в данном
тексте. Тавтология – повторение однокорен-
ных слов: сложилась сложная ситуация.
Слова-паразиты. Пример: недавно встретился
мне знакомый, ну, как его,…этот самый…
Лексическая неполнота высказывания: мне,
пожалуйста, двойную. К каким ошибкам при-
водят неудачно созданные неологизмы? Ямоч-
ный ремонт, то есть ремонт ям на дорогах.
Перейдем к неправильному использова-
нию устаревших слов, слов иноязычного про-
исхождения, диалектизмов, разговорных и
просторечных слов, профессиональных слов.
Архаизмы: ныне день открытых дверей. Исто-
ризмы: Да, вот ты и буржуй! Иноязычные
слова: действия легитимные (законные, разре-
шенные). Диалектизмы: я купила рушник
(полотенце). Разговорные слова: куртка у меня
худая (дырявая). Профессионализмы и жарго-
низмы: водитель и водила.
Часто студенты забывают или не знают о
переносном смысле фразеологизмов: ждать у
моря погоды (очень долго ждать, понимают в
прямом смысле); он сидит сложив (сложа)
руки; играть значение и иметь роль (играть
роль, иметь значение).
Приведем ниже задания, которые выра-
жают различную семантику слов, их лекси-
ческую, стилистическую и логическую соче-
таемость. Довольно четко видно отличие слов
с нейтральной, разговорной, эмоциональной
возвышенной окраской. Выполнение подобной
работы, на наш взгляд, поможет студентам
видеть эти самые, часто допускаемые ошибки,
и работать серьезнее. Правильные варианты
ответов выделены курсивом.
1. Подчеркните только те слова и словосо-
четания, которым свойственна официально-
деловая окрашенность:
Воздать должное, нетрудоспособность,
извлекать квадратный корень, принять к ис-
полнению, страховой полис, быстро, надле-
жащий, предписывать, чудесный случай, про-
водить исследование, ходатайствовать, обви-
нительный приговор, поставить на вид, со-
циология, установленный порядок, единовре-
менное пособие, посоветовать, прямые обязан-
ности, прогулка, соглашение, несоблюдение,
дипломная работа, просрочка, ответчик.
2.Данные сочетания запишите в два стол-
бика: в левом - стилистически нейтральные, в
правом - стилистически отмеченные (то есть,
разговорно-бытовые):
Крутой спуск, крутой нрав; домашнее хо-
зяйство, домашний ребенок; махнуть платком,
махнуть за город; съехать по склону, съехать
на двойки; боевая слава, боевая девочка; дер-
жаться за город, держаться за кресло; влезть
на дерево, влезть в глупую историю.
3.Объясните значение выделенных выра-
жений:
У нас с тобой, Артем, ни кола, ни двора. На
соседней большой станции рабочие заварили
кашу. Этим контрабандистам Гришутка стал
поперек горла. Исчез, как в воду канул. Искал
до седьмого пота. "Свалился как снег на
голову", - смеясь, сказала Рита. К ночи он
совсем выбился из сил. Дело выеденного яйца
не стоит. Я в этих делах стреляная птица.
Скажи, Цветаев, за что ты на меня зуб имеешь?
4. Попробуйте восстановить полную форму
следующих разговорных фраз. Образец: Не
видели с детской коляской? - Не видели жен-
щину с детской коляской?:
1. У вас есть от кашля? (таблетки).
2. С зелеными балконами - это ваш? (дом).
3. Мне два за тридцать и один бублик?
(хлеб).
К. Т. Кенжеева, Р. С. Туребекова
165
ISSN 1563-0223 Bulletin KazNU. Filology series. № 2(148). 2014
4. За мной в очках и женщина с ребенком.
(мужчина).
5. В серой шубе не проходила здесь?
(женщина).
6. В синем халате всегда с ним кокетни-
чает. (медсестра или женщина).
5. Исправьте ошибки, назовите виды оши-
бок (плеоназм, тавтология и др.):
В Индии живут индейки, а в Корее корейки.
В комнате, возле печки, стояла девушка,
она была жарко натоплена.
Вынужден был совершить вынужденную
посадку.
Воздвигнуть скотный двор.
Книга пополняет кругозор
Любой проступок заслуживает уважения.
Мы вкалывали не покладая рук.
Он записал песни коренных аборигенов
севера
Отец умер, когда ему было 9 лет.
Отшумела белая метелица, оставив обиль-
ные осадки.
Он целую тарелку съел.
Сегодня у нас гости гостят из Испании.
Сложилась сложная ситуация
Соседний кот важно пришел на кухню.
Столяр сделал эту этажерку из дуба с
четырьмя ножками.
Студенты слушали лекцию по сварке про-
фессора Иванова.
Хорош зимний лес: синеватые тени сосен
лежат на снежном покрове.
Я одела шубу.
5. Замените слова нейтральными синони-
мами:
Адаптация, банальный, бесценный, брег,
вылезать, выя, древо, драпать, долговязый, дуб-
ликат, злато, око, лик, обет, вкушать, мыслить,
молвить притащить.
6. Найдите случаи нарушения традицион-
ной сочетаемости.
Достичь (успеха, выполнения, повышения,
порядка, послушания, победы). Провести (со-
вещание, перестройку, контроль, организа-
цию, завершение, помощь, оценку). Проявить
(медлительность, заботу, желание, дисцип-
лину, энергичность, грубость, порядок, равно-
душие).
Таким образом, речевая ошибка – это
ошибка не в построении, не в структуре
языковой единицы, а в ее использовании, чаще
всего в употреблении слова. По преимуществу
это нарушение лексических норм.
Развитие у студентов умения чувство-
вать и отбирать правильные речевые сред-
ства с учетом ситуации и обстановки речи,
умение избегать двузначности, тавтоло-
гии, тяжеловесных конструкций, несомнен-
но, приведет к мастерству, к культурной
речи.
Литература
1 Введенская Л.А., Павлова Л.Г., Кашаева Е.Ю. Русский язык и культура речи. – М.: учебное пособие для вузов. –
Ростов-на Дону: Феникс, 2001.
2 Голуб И.Б. Русский язык и культура речи. – М.: Логос, 2001.
References
1 Vvedenskaya L.A., Pavlova L.G., Kashaeva E.Yu. Russkiy yazyk i kul'tura rechi. – M.: uchebnoe posobie dlya vuzov. –
Rostov-na Donu: Feniks, 2001.
2 Golub I.B. Russkiy yazyk i kul'tura rechi. – M.: Logos, 2001.
К вопросу о речевых ошибках
Вестник КазНУ. Серия филологическая. № 3(149). 2014
ЖАС ҒАЛЫМДАР
МОЛОДЫЕ АВТОРЫ
UDC 81'374
D. Myrzakhat
Magistrant of a I course of Kazakh National University of the name al-Farabi,
Almaty, Kazakhstan
Scientific leader
D. f. n. professor A. H. Azamatova
e-mail:
dana_2408@mail.ru
Electronic corpora as a basis of modern English dictionaries
The article is devoted to analysis of the various aspects of correlation between two linguistic disciplines: corpus
linguistics and lexicography. It describes the current state of electronic corpora, provides a brief overview of the
development stages of English lexicography. The article details the process of compiling major English corpora and
defines their main functions. Particular attention is paid to determine the value of electronic corpora when creating
dictionaries, the positive and negative impact of corpora on the development of lexicography.
Key words: electronic corpus, lexicography, corpus linguistics, text, dictionary.
Электронды корпус заманауи ағылшын сөздіктерінің негізі ретінде
Мақаланың негізгі мақсаты
корпустық лингвистика мен лексикография салаларының арақатынасының
барлық аспектілерін талқылау. Бұл мақалада электронды корпус және ағылшын лексикографиясы сала-
ларына сипаттама беріліп, олардың тарихы мен даму кезеңдеріне қысқаша шолу жасалынады. Ағылшын
тілінің ірі корпустарының құрастырылу үдерісі қарастырылып, корпустың негізгі қызметтері айқындалады.
Сондай-ақ электронды корпустардың сөздік жасауға қандай пайдасы бар екендігі анықталады. Корпустың
лексикография саласына тигізетін әсерінің артықшылықтары мен кемшіліктері мысалдар арқылы нақты
дәлелденеді.
Түйін сөздер: электрондық корпус, лексикография, корпустық лингвистика, мәтін, сөздік.
Д. Ы. Мырзахат
Электронный корпус как основа словарей современного английского языка
Данная статья посвящена анализу различных аспектов соотношения двух лингвистических дисциплин:
корпусной лингвистики и лексикографии. В ней описывается современное состояние электронных корпусов,
дается краткий обзор этапов развития лексикографии английского языка. В статье подробно рассматривается
процесс создания крупных английских корпусов и выделяются их основные функции. Особое внимание
уделяется определению значения электронных корпусов при создании словарей, положительное и негативное
влияние корпусов на развитие лексикографии.
Ключевые слова: электронный корпус, лексикография, корпусная лингвистика, текст, словарь.
__________________________________
Corpus linguistics plays an important role in
compiling, writing and revising dictionaries, as
within a few seconds the linguist can get examples
of words or phrases from millions of spoken and
written texts. And since corpora continue to grow
and are constantly being expanded with new texts,
lexicographers have an instant access to up-to-
date information.
The practice of dictionary-making began in
1600s when Robert Cawdrey involved words that
were considered difficult as they were borrowed
from another language into his version of the
dictionary [1, 49]. The words which came from
Latin-English dictionaries and other available
167
ISSN 1563-0223 Bulletin KazNU. Filology series. № 3(149). 2014
texts of the time were given brief definitions,
synonym and a fixed form. It was Samuel Johnson
who distinctly introduced the methods or steps
that were taken to create his dictionary in the
1700s and some of the methods were then fol-
lowed by the committee entrusted to create “A
New Dictionary” or currently known as the
Oxford English Dictionary in the 1800s.
A corpus is a collection of samples of aut-
hentic spoken and written text which are used for
analysis of words, meanings, grammar and usage
[2, 74]. In Saussurian terminology, the text is akin
to that of parole, while the corpus provides the
evidence of langue. The term corpus linguistics is
used when a corpus is specifically used to study a
language. Lindquist distinguishes the term with
other branches of linguistics such as sociolin-
guistics (the study of language and society), or
psycholinguistics (the study of language and the
mind) in that corpus linguistics is a specific
method used in language study, the “how to”
rather than the “what”. In other words, corpus
linguistics is an approach rather than a specific
field of language study [3, 38].
In 1950s, there was a growing dissatisfaction
of how language could not reason out the many
‘ungrammatical’ patterns found in English. There
was a strong call for empirical, real language data
[4, 46]. It was then that corpus was invented. The
first corpus was made out of a survey of English
usage conducted by two universities, University
of London and the Brown University Corpus in
Providence. In the 1960s, both compiled its mil-
lion word corpus of written text from 500 reading
passages, which was named Brown Corpus. This
American corpus was a landmark in corpus
linguistics since it was the first corpus to employ a
computer in its making. In 1982, the British
version of the corpus, named the LOB corpus was
compiled by Hofland and Johansson. LOB is an
abbreviation from The Lancaster-Oslo-and Ber-
gen, and as its name suggests it is a collaborative
attempt between the three universities: the
University of Lancaster, the University of Oslo,
and the University of Norwegian Computing
Centre of the Humanities.
However, both the Brown corpus and LOB
corpus were deemed to be inadequate to sample
English vocabulary. This gave birth to John Sin-
clair’s English Lexical Studies which specifically
aimed to investigate vocabulary using an electro-
nic text of spoken and written language. The study
gave prominence to collocation - words that
naturally co-occur together. Aimed to represent
varieties of English where it is used as a first or
second language, Sidney Greenbaum compiled
one-million-word corpora called The International
Corpus of English in 1988. The unique feature of
this corpus is that it samples more spoken
language (60%) than its written counterpart
(40%).
In the early 1990s, major universities and
companies together compiled British National
Corpus (BNC) containing 100 million words from
1980 up to 1993. The compilers were Oxford
University Press, Longman, Chambers, the British
Library, Oxford University and Lancaster
University. The aim of the corpus is to provide a
balanced corpus that represents British English.
The corpus includes 10% spoken language and
90% written language, which comprises of 25%
fiction and 75% non-fiction. One big distinction
between BNC and Brown is that the former took
samples from a longer piece of text between
40,000 and 50,000 words. This gives BNC an
added advantage of being representative since text
contains a different use of words at the beginning,
in the middle, and at the end. Due to its sheer size,
representativeness, and care, most British pub-
lishers prefer to make use of this corpus as their
source of lexicographic information.
Typically, any corpora will need to go through
a three-step process in its making. Before going
through these three steps, however the writer
needs to determine the basic outlines of a corpus
such as the size of the corpus, the genre of the
corpus, whether it will specifically look into
written, spoken language, or both. Sinclair points
out that the principles underlying corpus creation
should be as large as possible including samples
from a broad range of material in order to
accomplish one way of representativeness to be
anticipated with the technology of the time. The
corpus should also be classified into different
genres and even size. Once this basic outlines is
determined, the three-step process may begin. It
starts with collecting the data, spoken and written.
It entails gathering a large mass of speech, written
texts, obtaining permission, and doing a careful
and organized record-keeping. The next step is
computerization which entails converting raw
spoken or written text into a digital format in a
computer. Recording of speech may be painsta-
king since it needs to be transcribed manually.
Another concern with spoken text is the issue of
naturalness of the speech; it needs to be recorded
in a natural, casual way that resembles how
people speak every day in real life, not in a stilted
way. Though written records seem to be less
painstaking, it also has its problem, mainly the
Electronic corpora as a basis of modern English dictionaries
168
Вестник КазНУ. Серия филологическая. № 3(149). 2014
copyright issue. Still some texts that come from
books, magazines, and other written sources need
to be retyped since scanning device software that
detect and scan words automatically usually
contain errors, so many that it’s best to avoid
using them altogether. The last step is annotating,
which involves assigning information such as
parts of speech, etymology, for each data. It
should be noted that the three mentioned steps
need not to be seen as a separate process; they are
all closely connected. For example, after gathering
recording of speech, it may be best to transcribe it
there and then.
Corpus may have given a lot of contributions
in language study, but its impact to lexicography
did not start until 1989. Together with the advance
of computer software, both have since contributed
significantly to the development of lexicography.
Since everything is automated and recorded in a
digital format, lexicographers can now save their
time and the tremendous amount of work needed
in compiling a dictionary. Typically, a dictionary
usually has information on the part of speech,
usage, meaning, pronunciation, etymology of a
word. Before the advent of corpora, all this infor-
mation had to be gathered manually; lexicograp-
hers needed to do the hard labor of collecting slips
of paper containing text that they intend to include
in the dictionary. For this reason, it took roughly
50 years to complete Oxford English Dictionary,
which was later known as New English Dictionary
[5,124]. With corpora, dictionary makers can now
use a large sample of authentic spoken and written
text as a source to illustrate how each word in
their list is used in real life. The citation used in
dictionary comes from real-life discourse. Real
contexts also provide accurate, well-defined
lexical meanings in the definition of a word in
dictionary, which is a huge improvement over the
previous dictionary practice where words were
defined using an unscientific manner. One huge
improvement in dictionary making is the rich
information available for words that have many
invariant meanings such as take, go, and time,
which tend to be overlooked in the previous
dictionary practice [6,86].
Another huge advantage of using corpora in
lexicography is that information on word fre-
quency can also be obtained. This way, lexico-
graphers can assign whether a word is among the
first 500 most common words, the next 500 and so
on. Meyer notes that the most frequent words are
functional words such as the, an, a, and, and of
which carry little lexical meaning and the least
frequent words are content words such as proper
nouns. Gries mentions two kinds of frequency
information that lexicographers can obtain from a
corpus: frequencies of occurrence of linguistic
elements in the so-called frequency list, and
frequencies of co-occurrence of these linguistic
elements in concordances. Lindquist defines
concordance as “a list of all the contexts in which
a word occurs in a particular text”. Using a Key
Word in Context concordance, words can be
retrieved within their surrounding text, and be
presented vertically on the screen. Since the infor-
mation is presented in contexts, lexicographers
can easily assign the collocations of each word in
their dictionary.
Since corpus is discourse-based, it means that
the word appears in haphazard, arbitrary col-
lection of occurrences. Dictionary makers need to
check for some contradictions with ‘real’ mea-
ning. It is thus dangerous to solely depend on
corpus. One way to check the word in context is
to expand the text by retrieving its original source.
The huge amount of data in the corpus also
allows lexicographers to look for new words that
occur for the first time in spoken or written text.
However, the corpus has to be large enough to
glean information on vocabulary items. A small
corpus such as LOB corpus which stores roughly
one million word items could not give lexico-
graphers enough information on the range of
vocabulary items. A monitor corpus is also
needed, in which large data of language is pooled
from time to time, rather than fixed only in one
particular time period. This way, the corpus is
frequently updated with new words and meanings
in today’s growing language.
The first dictionary to be founded wholly on
corpus is Collins COBUILD series of English
Language Dictionary compiled in 1987, guided
by John Sinclair. The dictionary has its citation
taken from real life discourse, and each word is
defined from these authentic texts, instead of
relying on previous dictionary. This entails using
a very large corpus so that it may be able to
include all lemmas including their word senses.
However, this presents problem in that there tends
to be an exclusion of rare words such as
apothegm. Besides being the first corpus-based
dictionary, COBUILD is innovative in that the
definitions are related to a classroom teacher
explaining the words. For example in describing
the word junk, it says: “You can use junk to refer
to old and second-hand goods that people buy and
collect”.
In the practice of dictionary-making, one
crucial distinction has to be made between corpus-
D. Myrzakhat
169
ISSN 1563-0223 Bulletin KazNU. Filology series. № 3(149). 2014
based dictionary and corpus-driven dictionary.
Dictionaries such as Collins COBUILD series of
English Language dictionaries are said to be
corpus-driven if the corpus itself is used to vali-
date information presented in the dictionary. Ho-
wever, if the corpus is used to extract the infor-
mation used in the dictionary, it is called corpus-
driven. Teubert suggests that dictionary should
follow corpus-driven approach so that it may com-
plement standard linguistics and not just extend it.
The role of the computer has a clerical role in
lexicography which reducing the labor of sorting
and filing and examining very large amounts of
English in a short time [7, 39]. From simple tools,
it has evolved to a substantial progress together
with crucial, profound and basic linguistic gene-
ralizations. By these kinds of developed tools,
they have revealed many topics for inquiry which
have not been well explored by traditional lin-
guistic methods.
In the modern era, the word has been reserved
for collections of texts that are stored and
accessed electronically. Electronic corpora are
usually larger than the paper-based collections
which are basically small, previously used to
study the aspect of language [8,120]. This is due
to the capacity of computers that can store and
process large amount of information compared to
the previous time.
Together with the technological advance in
computer, corpus provided a significant contri-
bution to the development of dictionary making.
Corpus linguistics made such a huge impact in
dictionary-making: it significantly reduces the
time and the heavy work it needs to compile a
dictionary since everything is automated and
computerized; each dictionary now resembles
how language is used in real world; frequency of
each word in the list can be assigned; much more
information can be given to words with a lot of
variant meanings such as go, and take; it makes it
easy to include collocation because words appear
in its surrounding text; it can quickly take ‘new’
everyday words into the system.
Достарыңызбен бөлісу: |