Алматы 2016 жалпы білім берудегі қазақ тілінің жиілік сөздігі


о м о г р а ф т а р д ы ң



Pdf көрінісі
бет18/41
Дата02.12.2022
өлшемі308,09 Kb.
#54474
1   ...   14   15   16   17   18   19   20   21   ...   41
о м о г р а ф т а р д ы ң  (жалпы саны 230) қолмен ажыратылу ісі қатар жүргізілді. 
Сөзтізбеде жиілігі жағынан ажыратылған омонимдер жеке сөздік түрінде 
осы басылымның қосымшасындағы дискіде электрондық нұсқада берілді. Ал 
əрқайсысының жиілігі мəтіннен тексеріліп, анықталған кейбір омографтарды 
4-кестеден көруге болады. 
12
Омонимдердің сөздігі жеке жасалды, осы кітапқа қосымша дискіде берілді.


23
4-кесте.
Сөздікте мағынасы ажыратылған омографтар (бұл омографтардың
бастапқы тізімі, ал жиілік сөздікте екі, үш сөз табы қойылған
бұл сөздер жеке реестрде беріліп, көрсетілді)
СӨЗ/сөз табы
СӨЗ/сөз табы
абаймен/fi o/үс
қиналыс/ет/зт
ағартушы/зт/ет
қисын/ет/зт
ағын/сн/зт
қоспа/зт/ет
адымдай/сн/ет
құйын/зт/ет
аза/зт/ет
құрал/зт/ет
айдай/сн/ет
қырын/сн/ет
айқындаушы/сн/ет
қызба/сн/зт/ет
айнала/зт/ет
қылмысты/сн/зт
алушы/зт/ет
қына/зт/ет
анада/үс/зт
қысқа/сн/зт
анықтау/ет/сн
қыстау/зт/ет
аңды/ет/зт
қыстық/сн/ет
ап/ел/ет
қышқылды/сн/зт
аптал/сн/ет
лақтырушы/ет/зт
аптап/зт/ет
мекенде/ет/зт
арнау/зт/ет
меңгеруші/зт/ет
аршыл/сн/ет
модельде/ет/зт
арықта/ет/зт
модельдеуші/ет/зт
асқан/үс/ет
мойында/зт/ет
аспа/зт/сн/ет
мойындаушы/зт/ет
асты/зт/ет
мұңдас/сн/ет
асын/ет/зт
мүйіздей/ет/зт
асыра/үс/ет
мініс/зт/ет
атау/зт/ет
нашарлау/сн/ет
атта/ет/зт
негізде/ет/зт
аттан/од/ет/зт
оймақ/зт/ет
атты/сн/зт/ет
ойнақта/ет/зт
ауа/зт/ет
ойыс/зт/ет
ауған/зт/ет
оқтау/ет/зт
аударма/зт/ет
онда/үс/са/ес
ауыс/сн/ет
ондағы/ес/са
аштық/зт/ет
оңбаған/сн/ет


24
əрекеттесуші/зт/ет
орайлас/сн/ет
бейімдеу/сн/ет
оралма/ет/сн
бесті/зт/са
орама/зт/ет
борат/зт/ет
орма/зт/ет
бөгет/зт/ет
орманды/сн/зт
бөгеу/зт/ет
орталықтан/ет/зт
бөле/зт/ет
орында/ет/зт
бөлектеу/сн/ет
орынды/сн/зт
бұрау/зт/ет
орынсыз/сн/зт
бұрыс/зт/ет
орыстан/ет/зт
біліс/сн/ет
өндір/зт/сн/ет
бітеу/сн/зт/ет
өтел/зт/ет
бітір/зт/ет
пысықтау/ет/сн
езбе/сн/ет
пікірлес/сн/ет
езу/зт/ет
серпіліс/зт/ет
екпе/сн/зт/ет
сипат/зт/ет
елес/зт/ет
соғушы/зт/ет
еміс/үс/ет
соғысушы/зт/ет
ене /зт/ет
сойыс/зт/ет
енші/зт/ет
соқтығыс/зт/ет
есепті/сн/үс/зт
сұқпа/зт/ет
ескерту/зт/ет
сұрау/зт/ет
етекте/ет/зт
сыйлас/ет/сн
дегендей/үс/ет
сыйын/ет/зт
демеу/зт/ет
сынама/зт/ет
егеу/зт/ет
сілтеме/зт/ет
жазба /зт/ет
сіңір/ет/зт
жақтас/сн/ет
табу/зт/ет
жақтау/зт/ет
табысты/сн/ет
жалау/зт/ет
тақау/үс/ет
жалдау/зт/ет
талды/сн/зт
жанар/зт/ет/fi o
талма/зт/ет
жанды/сн/зт/ет
таңдай/зт/сн
жаппа/зт/сн/ет
тапсырма/зт/ет
жарау/зт/сн/ет
тарау/зт/ет
жаудыр/сн/ет
тасы/ет/зт
желе/зт/үс
татар/ет/зт
жеміт/зт/сн
тату/сн/ет


25
жетекте/зт/ет
теңеу/зт/ет
жуа/зт/ет
тоқыл/зт/ет
жұмбақта/зт/ет
тоқыма/зт/ет
жылын/зт/ет
туған/зт/ет
жырға/зт/ет
туында/зт/ет
жыртыс/зт/ет
тұжырымда/зт/ет
зерттеуші/зт/ет
тұсау/зт/ет
илеу/ет/зт
тəркілеу/зт/ет
иі/ет/зт
тұманда/зт/ет
кезде/ет/зт
түйе/зт/ет
кездік/ет/зт
түлен/зт/ет
кезеп/зт/ет
түрме/зт/сн/ет
кезік/ет/зт
түсте/зт/ет/үс
келісімді/сн/зт
түсуші/зт/ет
кеспе/зт/ет
түсіністік/зт/ет
кешпе/сн/ет
тізбе/зт/ет
көктеу/зт/ет
тілеу/зт/ет
көрші/зт/ет
тіреу/ет/зт
көрін/зт/ет
тіркес/зт/ет/сн
көсеу/зт/ет
тіркеу/ет/зт
көшір/зт/ет
ұлу/ет/зт
кіріс/зт/ет
ұлыс/зт/ет
кіріспе/зт/ет
ұмтылыс/ет/зт
қадау/зт/сн/ет
үгіт/зт/ет
қаза/зт/ет
үндеу/ет/зт
қаймақта/ет/зт
үнді/зт/сн
қайшылас/сн/ет
үстеме/зт/ет
қаласыз/сн/ет
шабыс/зт/ет
қалау/зт/ет
шаға/зт/ет
қалдық/зт/ет
шөлде/зт/ет
қалмақ/зт/ет
шұбат/зт/ет
қамырық/зт/ет
шылау/ет/зт
қанар/зт/ет
шынтақта/ет/зт
қандас/зт/ет
шыңда/ет/зт
қанды/сн/зт
шытын/ет/зт
қандық/зт/ет
шілікті/сн/зт
қаптал/зт/ет
ызылда/ет/зт
қарқынды/сн/зт
ықпалдас/сн/ет


26
қарман/ет/зт
ылғалда/ет/зт
қату/сн/ет
ылғалды/сн/зт
қатысты/сн/ет
ілбі/ет/зт
қашаған/сн/зт/geo
ілгерілеу/ет/сн/зт
қашау/ет/зт
іле/geo/үс/ет
қима/зт/ет
ілмек/зт/ет
электролизде/ет/зт
Əрбір сөз табына қатысты леммалау кезіндегі қиындықтар мен мəселелер жəне 
оларды шешу жолдары туралы сөз таптары жеке сөзтізбесінің ерекшеліктері 
туралы төмендегі тараушада жан-жақты айтылды. 
8-кезең. Статистикалық мəлімет алу. Сөзтізбенің құрамы осы кезеңдегі 
өңдеуден өткізілгеннен кейін сөздіктің статистикалық деректері мынадай форму-
ла бойынша есептелді: 
Абсолютті жиіліктер қосындысы алынған мəтіндер көлеміне тең:
1
2
3
1
;
n
i
n
i
N
f
f
f
f
f
=
=
= + + + ⋅⋅⋅ +

F
i
  абсолютті жиілік.
Қатынастық жиілік: 
;
i
i
f
F
N
=
Жиынтық қатынастық жиілік: 
1
1
n
i
i
i
f
F
N
=
=
=
∑ ∑
.
Сөздік бірлігінің м ə т і н д і қ а м т у п а й ы з ы н ы ң пайыздық салмағы: 
1
1
1
100%
100%
n
n
i
i
i
f
F
N
=
=

=
=


.
Көрсетілген формулалар арқылы сөздіктің статистикалық деректері мен бір 
топ сөздің қайталана кездесу жиілігі негізіндегі олардың мəтінді қамту пайызы 
есептеліп, жиілік сөздікте көрсетілді.
Осы тұста бір топ сөздің мəтінді қамту пайызы ұғымына түсінік бере кету 
сөздіктің тұтынушысы үшін пайдалы болмақ. Бұл терминнің мəнін басқаша 
түсіндірген болса, оны сөздік сөзтізбесіндегі қатарынан тұрған сөздердің мəтінді 
түсінуге қатысты үлесінің көрсеткіші деуге де болады. Бұл көрсеткіш жеке 
сөздерге ешқандай қатысы жоқ, ол басынан бастағандағы бір топ сөзге қатысты 
жиынтық көрсеткіш болып табылады.
Мəселен, жалпы əліпбилі-жиілік сөздіктегі абадан сөзі 7 млн сөзқолданыстан 
астам мəтінде небары 2 рет қолданылады, демек оның реестр басында тұрғандағы
мəтінді қамту пайызы 0,00003 – өте төмен. Сонымен бірге ол əліпбилі-жиілік 
сөздікте бірінші сөз. Яғни, басқаша айтқанда, сөздіктегі осы бірінші тұрған 
сөзді ғана білу мəтіннің 0,00003 пайызын түсіну мүмкіндігін береді. Ал егер осы 
бірінші тұрған сөзбен қоса абажадай, абажурлы 2-3-сөзді де танып-білу мəтінді 
түсіну пайызын сəл болса да арттыра түседі, 0, 00015 болады. Бірақ бұл өте төмен 


27
көрсеткіш, 1-ге де жетпейді, себебі бұл сөздердің жиілігі өте төмен (біреуі 2 рет, 
екіншісі 6 рет, үшіншісі 3-ақ рет қолданылған).
Ал жалпы жиілікті-əліпбилі сөздікте абадан жиілігі төмен сөз ретінде соңғы 
жақта 24316-ретте тұр, яғни сөздіктің бұл типіндегі сөзтізбеден бірінші тұрған, 
яғни бол сөзінен бастап осы 24316-реттегі, яғни абадан сөзіне дейін меңгерген 
адам мəтіннің 99,7 пайызын түсінеді деп жорамалдауға əбден болады. Бір топ 
сөздің мəтінді қамту пайызы деген көрсеткіш осындай практикалық маңызға 
ие. Төменде сөздіктің статистикалық сипаттамасында жалпы жиілікті-əліпбилі 
сөздіктің негізсөз сөзтізбесінің осы көрсеткіш бойынша кестесі берілді
13
.
9-кезең. Негізсөз жəне сөзформалар сөзтізбесін жүйеге келтіру. Негізсөз, 
яғни екінші нұсқадағы сөзтізбе əліпбилі-жиіліктік типте əзірленді. Оның 
құрамында сөйлеу стиліне, бейканондық лексикаға қатысты сөздердің 
орфографиялануының алуан түрлі варианттары, жаргон, диалект сөздер, яғни 
бейəдеби тілдің лексикалық бірліктер сараптама барысында өңделді, біразы 
сөзтізбеден алынды. 
Ал сөздік сөзтізбесінің бірінші нұсқасында, яғни сөзформалар тізбесінде 
сөздер леммаға келтірілмеген күйде сақталды. Бұл сөзтізбені сөзформалар 
құрады. Оның құрамында да жоғарыда айтылған бейəдеби тілдік бірліктер болды. 
Сөзтізбенің екі нұсқасы да осындай бірліктерден тазаланды. Алайда сөзформалар 
сөздігінде ішінара қиылып тасталған өте сирек қолданыстағы тым пəс стильдегі 
бірліктер болмаса, бұлардың біразы сақталды. Оның себебі сөзформаларда 
сөзтүрленімнің барлық ерекшелігін қамту мақсат етілді. Екі сөзтізбедегі аздаған 
айырмашылыққа қарамастан, олар ортақ принциптерге сүйеніп, құрастырылды.


Достарыңызбен бөлісу:
1   ...   14   15   16   17   18   19   20   21   ...   41




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет