НЕГІЗГІ БӨЛІМ
Мәтін бірлігі ретінде «сөз қолданыс» деген
атауды қолдандық. Мәтінге статистикалық зерт-
теу жүргізу кезіндесыртқы формалары бір-біріне
сәйкес келетін сөз қолданыстары көптеп кездеседі,
бұларды «сөз формасы» деп алдық. Бұл сөз фор-
малары алфавитті-жиілік сөздіктің бірлігі ретінде
де қолданылады.
Негізгі лексикалық мағыналары өзара жақын
сөз формаларының жиыны «сөз» деп аталатын
лексикалық бірліктерді құрайды. Жиілік сөздіктегі
әрбір сөз бастапқы негізге немесе түбірге келтіріл-
ді, Мысалы, барды, барып, барған, барша, бара-
мын т.б. сөз формаларының негізі ретінде бар сөзі
алынды. Зерттеу жүргізілген мәтіндерімізде бас-
тапқы негіз немесе түбір ретінде есім сөздер үшін
жекеше түрдегі атау септігі формасы, ал етістіктер
үшін ІІ-жақ бұйрық рай формасы алынды. Себе-
бі, кейбір сөздіктерде алынып келген тұйық рай
формасы сөз топтарын ажыратуда, яғни сөздерді
белгілі бір топқа жатқызуда қиындық келтіретін
болды. Үстеу, одағай, еліктеу сөздер мен көмекші
сөздер негізінен түбір формада кездесіп отырған-
149
ҚАЗА
ҚСТАННЫ
Ң
ҒЫЛЫМЫ
МЕН
Ө
М
ІР
І •
НАУКА
И
ЖИЗНЬ
КАЗАХСТАНА
•
SCIENCE
AND
LIFE
OF
KA
ZAKHST
AN
дықтан көбіне сол күйінде қалдырылды. Зерттеу
барысыңда сөздер мен сөз формаларына арнайы
индекстеу жүргіздік немесе әрбір сөзді шартты
түрде алынған бір таңбамен белгілеп отырдық. Бұл
сөз таптарының классификациясына негізделді.
Қазіргі тіл білімінде сөздер негізгі үш белгісі-
не қарай таптастырылуда: лексикалық мағынасы,
морфологиялық құрылымы және синтаксистік
қызметі [Қалыбеков Б.Е, 2004, 182]. Осы үш белгі-
лерін салыстыра отырып, әрбір сөзді белгілі топқа
қатысты белгілермен таңбаладық. Бұл жерде сөз-
дерді индекстеу мен оларға морфологиялық тал-
дау жасауда кері алфавитті-жиілік сөздіктерді де
пайдаландық [Мусаходжаев С.У., 2004, 17]. Сөздер-
ді бұлайша лексика-грамматикалық топтарға бөлу
кезінде кейбір қиындықтар байқалды. Атап айт-
қаңда, омонимдерді ажырату кезінде әрбір сөз-
дің мағынасы тек контексте қарастырғанда ғана
анықталды. Бұл омонимдерді ажыратуға септігі
тигенімен, біз сөз табының ішіндегі омонимдерді
ажыратуда, сөз топтарына қарасты таңбаларға қо-
сымша цифрлар белгілеуге мәжбүр болдық. Соны-
мен, сөздердің белгілі бір лексика-грамматикалық
топқа қаты стылығы мына төмендегіше белгіленді:
з – зат есім, с – сын есім, a – сан есім, е – етістік,
ү – үстеу, л – еліктеу сөздер, м -есімдік, ш – шылау,
о – одағай, д – модаль сөздер (әртарап, бейтарап
сөздер), к – көмекші есімдер. Ал енді лексикалық
омонимдерді ажыратуда 2 – кісі аттары, 4 – қыс-
қарған сөздер, 5 -ойын аттары, 6 — газет-журнал-
дар, оқулықтар, көркем шығармалар мен ғылыми
еңбектердің аттары, 7 – географиялық атаулар, 8
– ру, тайпа, ұлт аттары, 9 – жануарлардың аттары
деп алынды.
Әдетте жиілік сөздіктері алынатын мәтіндерді
зерттеудің екі түрі белгілі: мәтіндердің барлығын
тұтас қарастыру және таңдамалы зерттеу. Мәтін-
дерді тұтасымен зерттеу кезінде бізді қызықтыр-
ғаннысанада лексикалық бірліктің барлық қолда-
ныстары түгел қамтылуы тиіс. Ал таңдама (выбор-
ка) арқылы зерттеуде белгілі бір мақсатқа сәйкес
әр түрлі көлемдегі таңдамалы мәтіндер сараланып,
таңдалып алынады. Мұнда ең аз мөлшердегі ми-
нималды таңдама мәтін көлемі шамамен алғанда
1000 сөз қолданыстағы мөлшер болып табылады.
Зерттеу барысында бұл екі әдістің ішінде мәтін-
ді тұтасымен қарастыру түрін қолданғанымызбен,
кейбір эксперименттерде таңдама мәтін арқылы
зерттеу әдісін де пайдаланып отырдық. Егер жиі-
лік сөздік таңдама әдісі арқылы алынатын болса,
онда алынған статистикалық модель түпнұсқасы-
ның ерекшеліктерін қаншалықты қамти алатын-
дығы жайлы сұрақ туындайды. Мұндай жағдайда
алынған мәтіннің (таңдаманың) өз түпнұсқасына
сәйкестілігі болса, онда бұл таңдаманың дұрыс
алынғандығын көрсетеді. Алынған жиілік сөздік-
тің сапасын көрсететін екінші бір жағдай – тізімге
(реестрге) алынған сөздердің әлі зерттелмеген,
жаңа мәтіндерде каншалықты кездесіп отыратын-
дығы. Зерттеуімізге негіз етіп алынған біз қарас-
тырған мектепке арналған текстер 1970-2000 жыл-
дардағы БСО және БӘ мәтіндерімен салыстыруда
осы жағын да ескердік.
Алфавитті-жиілік сөздікте белгілі бір зерттеуге
алынған мәтін көлеміндегі сөздердің не олардың
тұлғаларының қолданылу жиілігі көрсетіле оты-
рып, алдыңғы әріптері бойынша қатаң әліпби төр-
тібімен беріледі. Жиілік сөздіктің бұл түрі зерттеуге
қажет болған лексикалық топтарды оңай ажыра-
туға, ондағы керек сөздерді тез тауып алуға, қара-
лып отырған мәтіннің стильдік сапасын таңдауға,
зерттеуге алынған шығарма тілінің лексикалық
байлығы мен оны жазған автордың сөз қолда-
нысындағы тілдік ерекшеліктерді сонымен бірге
шеберлігін білуге, дублет сөздердің қай нұсқала-
рының жиі, ал қай нұсқаларының сирек қолданы-
латындығын білу арқылы олардың орнықтылығын
анықтауға, жарыса қолданылатын сөздердің қай
нұсқаларының әдеби нормадан шығатындығын
анықтауға жәрдемдеседі [Молдабеков К.М., 1985;
Мусаходжаев С.У., 1986, 143].
Жиілік сөздік белгілі бір зерттеуге алынған мә-
тіндегі сөздердің, не оның тұлғаларының қолданы-
лу жиілік санына қарай қатаң кемімелі төртіппен
орналаскан тізбесі болып саналады. Егер мұнда
сөздер мен оның тұлғаларының қолданылу жиі-
лік саны бірдей болып келсе, онда олар алфавит-
ті-жиілік сөздіктегідей алдыңғы әріптері бойынша
катаң әліпби төртібімен беріледі. Ал енді кері ал-
фавитті-жиілік сөздіктер белгілі бір зерттеу ныса-
насындағы мәтін құрамындағы сөздердің, оның
тұлғаларының соңғы әріптері бойынша қатаң
әліпби төртібімен берілетін, мәтіндегі жиілігі қоса
көрсетілетін түрі екені белгілі [Фрумкина P.M., 1964,
115]. Жиілік сөздіктің бұл түрі 3зерттеушіге сөздің
негізгі бөлшектерін ажыратып тануға және ол
бөлшектердің қолданылуынаталдамалар жасауға
мүмкіндік береді.Сонымен бірге ол мәтіндердегі
сөз тудырушы және сөз түрлендіруші қосымша-
ларды қиындықсыз тез тауып алуға көмектеседі.
Бұларға қоса, кері алфавитті-жиілік сөздіктегі
сөз тұлғаларының соңғы әріптеріне қарай бірың-
ғайласып төртіппен орналасуы зерттеушіге омо-
нимдес қосымшалардың сыңарларын бір-бірінен
ажырата білуге де септігін тигізеді. Ал, олардың
мәтіндегі қолданысын көрсететін жиілік көрсет-
кіштері ол қосымшалардың тұрақты-тұрақсызды-
ғы, өнімді-өнімсіздігін, нормалану жағдайындағы
ерекшелік сипатын анықтауға көмегі тиеді. 0 және
1970-2000 жылдардағы текстер мен БӘ әр түрлі
көлемдегі сөздер мен сөз формаларының және
сөз қолданыстардың шамасын аңғартады. Біз қа-
растырған оқулық мәтіндерінде 1970-2000 жыл-
дардағы мәтіндерге қарағанда сөздер мен сөз
қолданыстар және сөз формалары аз қолданыл-
ған. Бұдан байқайтынымыз, таңдама көлемі ұлғай-
ған сайын, мәтіннің сөзбен қамтылу коэффициенті
де өсіп отырады. Агглютинативті тілдерде әдетте
бұл коэффициент 90% шамасында болады [Ысқа-
қов А., 1964, 182].
150
ҚАЗА
ҚСТАННЫ
Ң
ҒЫЛЫМЫ
МЕН
Ө
М
ІР
І •
НАУКА
И
ЖИЗНЬ
КАЗАХСТАНА
•
SCIENCE
AND
LIFE
OF
KA
ZAKHST
AN
50 және 70 жылдардағы мектепке арналған
текстердің әрбір сыныпқа қатысты пәндері бойын-
ша сөз,сөз формасы мен сөз қолданыстарымен
қамтылуының көрсеткіштері берілді. Мұндағы әр-
бір сыныптағы пәндер арасында лексикалық тұл-
ғалармен қамтылуы жағынан 50 және 70 жылдар
оқулықтары арасында айтарлықтай айырмашы-
лықтарды көреміз.Мысалы,
Біз қарастырған 1 сыныпқа арналған «Қазақ
тілі» оқулығының 1024 сөз, 2480 сөз формасы мен
6314 сөз қолданысқа, ал 70 жылдардағы 1 сынып-
қа арналған “Қазақ тілі” оқулығы 1454 сөз, 2867
сөз формасы мен 8910 сөз қолданысқа тең екен-
дігі байқалды. Бұл айырмашылық 70 жылдардағы
оқулықтардың 50 жылдармен салыстырғанда ғы-
лыми-танымдық және оқу-әдістемелік мазмұны-
ның ғылымдағы соңғы жаңалықтармен толығып,
оқулық мәтіндерінің құрылымы күрделене түсуі-
нің нәтижесі екендігі кейінгі тарауларда толығырақ
сипатталады.
Қарастырылып отырған біз қарастырған оқу-
лықтардың лексика-грамматикалық топтармен
қамтылуындағыерекшеліктер пайыздықкөрсет-
кіштермен берілді.
Өзге сөз таптарына қарағанда қолданылуы жө-
нінен жоғарыпайыздық көрсеткішке ие зат есім-
дердің ішінен жалқы есімдерді бірнеше топтарға
бөле отырып, шартты белгілермен көрсету бары-
сында анықталғаны – 50 жылдар оқулықтарындағы
барлық сөз қолданыстардың 0,8%-ын адам аттары,
0,73%-ын географиялық атаулар, 0,17%-ын ру, тай-
па, ұлттардың аты, ал ең аз пайыздық көрсеткішті
(0,0016%) мәдени-ағарту орындарының аты қам-
тиды екен. Көптеген статистикалық зерттеулердің
нысанында қамтыла бермейтін зат есімдердің бір
тобы — жалқы есімдер белгілі бір пәндік-тақы-
рыптық мазмұн мен ғылыми-әдіснамалық ауқым-
ға қатысты болғандықтан, олардың оқулықтарда
белгілі бір дәрежеде қамтылуы міндетті.Бірақ осы
жалқы есімдердің де баланың таным-түсінігін арт-
тырып, ұғындық ой қорыту қабілетін дамытатынын
ескере бермейміз. Оқулық мәтіндерінің құрасты-
рылуында ескерілетін мәселенің тағы бірі – дерек-
сіз ұғымдағы зат есімдер мен нақты мәнді сөздер-
дің ара қатынасы «10-ға – бір», яғни 10 нақты сөзге
1 дерексіз мәнді сөз [Құсайынов А.Қ., 2000, 19-22]
тура келуі дұрыс деп қарастырылатынына сүйене
отырып, бұл реттіліктің біз қарастырған оқулық-
тарда сақталмағандығы анықталды. Еңді осы оқу-
лық мәтіндеріндегі сөз таптарының ара салмағын
олардың қолданысы бойынша анықтайтын бол-
сақ, жоғарыдағыдай көріністі байқаймыз.
Сыныптар бойынша алғандағы сөз қолданыс-
тарды салыстыру барысында анықталғаны – зат
есімдердің үлес салмағы өзге сөз таптарына қара-
ғанда жоғары деңгейді көрсетеді (1 сыныпта 8483
с.қ., 2 сыныпта 16412 с.қ., 3 сыныпта 49495 с.қ.).
Өйткені, зат есімдер тілдегі өзге сөздердің барлы-
ғына әрі ұйтқы, әрі өзек болып қызмет атқарады
[Засорина Л.Н., 1966, 135]. А.Жұбанов өз еңбегінде
қазақ мәтіндерін тудырушы сөз таптарының бірі
ретінде оларды 70-тен аса семантикалық топтар-
ға бөледі. Ал осы Біз қарастырған сөз таптарының
қолданысын 70 жылдардағы оқулықтармен және
БӘ салыстыру барысында төмендегіше көріністі
байқаймыз:
Мұнда 50 жылдардағы оқулықтар мен 70 жыл-
дардағы оқулықтарда сыныптар бойынша алғанда
зат есімдердің алатын үлестік салмағы шамалас (50
ж. БСО 1 сыныпта 34,87%, 2 сыныпта 37,19%, 3 сы-
ныпта 42,14% болса, 70 ж. БСО 1 сыныпта 38,84%,
2 сыныпта 39,42%, 3 сыныпта 42,46%) болып келсе,
БӘ зат есімдердің пайыздық үлесі де соған жақын
(37,7%). Сол сияқты өзге сөз таптарының қолданы-
сы бойынша да салыстырылған мәтіндерде олар-
дың алатын үлестік салмағы ұқсас екендігін көре-
міз.
Мұның өзі БСО мәтіндік құрылымындағы та-
қырыптық-мазмұндық ұқсастықты ғана емес, со-
нымен бірге сөз таптарынын қолданылуындағы
белгілі бір заңдылықты аңғартса керек. Бұл тұжы-
рымның нақтылығына 90 және 2000 жылдардағы
оқулықтарды салыстыру барысында көз жеткізуге
болады.Келтірілген мәліметтерден 90 және 20000
жылдардағы оқулықтардың мәтіндеріндегі сөз
таптарының ара салмағы жоғарыда келтірілген де-
ректерге ұқсас екендігін байқаймыз: 90 жылдарда-
ғы оқулықтарда зат есімдердің қолданылуы 39,14%
болса, 2000 жылдардағы оқулықтарда 38,61%. Сол
сияқты етістіктердің қолданылуын салыстыра-
тын болсақ, Біз қарастырған оқулықтарда олар-
дың үлесі 30,16% шамасында (1 сыныпта 32,26%,
2 сыныпта 31,17%, 3 сыныпта 29,35%) болса, 90
жылдарда 29,02%, 2000 жылдарда 29,01%. Мұн-
да тіліміздегі сөз таптарының ішіндегі ең күрделі
және қарымы ең кең грамматикалық категория
ретіндегі етістіктердің біз қарастырған оқулықтар-
дағы қолданылуы әр жылдардағы оқулықтармен
шамалас деңгейді көрсетеді. Бұл да біз қарастыр-
ған мәтіндердегі сөз таптарының қолданысындағы
өзіндік ерекшелік дер едік.
Алдыңғы зерттеулер көрсеткендей (Бектаев,
Молдабеков), мәтіндердің статистикалық жағынан
нақты бір жиіліктегі сөздермен қамтылуы зертте-
лініп отырған мәтіннің көлеміне байланысты. Ста-
тистикалық жағынан едәуір аз мағлұмат беретін
сөздерді көлемі шағын оқулықтар береді. Жиілік
сөздіктің бастапқы (едәуір жиі кездесетін) аумақта-
рында ақпарат көлемі онша болмайды. Өйткені бір
ғана «ол» есімдігінің жиілігі 3609 (50 ж. БСО). Зерт-
телініп отырған оқулықтардағы мәтіндердің едәуір
жиі кездесетін лексикалық единицалармен қамты-
луы өте төмен. 50 жылдар оқулықтарында 40,77%,
70 жылдар оқулықтарында 39,96%, Б|Ә 30,51%, 90
ж. оқулықтарында 40,28%, ал 2000 жылоқулықта-
рында 40,13% .Нақтылы бір жиіліктегі және нақты
бір синтаксистік ақпараты бар түрлі мөлшердегі
сөздерді анықтау барысында, әр сыныпқа тиісті
жиі кездесетін, яғни жиілігі Ғ
≥
4болатын, мәтін-
нің 30-40%-ын қамтитын лексикалық бірліктерді
151
ҚАЗА
ҚСТАННЫ
Ң
ҒЫЛЫМЫ
МЕН
Ө
М
ІР
І •
НАУКА
И
ЖИЗНЬ
КАЗАХСТАНА
•
SCIENCE
AND
LIFE
OF
KA
ZAKHST
AN
таңдап алдық. Біздің ойымызша, абсолютті жиілігі
4-ке тең немесе одан артық сөздердің әрбірі қай-
талана қолданылу нәтижесінде бала жадында ұзақ
сақталады да, бұл сөздерді ол толық меңгереді деп
айтуымызға болады. Мысалы, ағай сөзі 50 ж. оқу-
лықтарында 36 рет, 70 ж. оқулықтарында 40 рет, ал
Б/Ә 60 рет қолданылған.
Алайда мұндай сөздердің көптігі оқушыға бе-
рілетін ақпарат көлемінің азаюына жағдай туғы-
зады. Демек, сөздердің қолданылу жиілігі мен
мәтіндердің ақпараттық қызметі арасында кері
қатынас бар деп айта аламыз. Өйткені, оқушы бір
ғана сөзді қайталай бермей, оның орнына мәтінде
бұрын кездеспеген жаңа мәнге ие сөздерді игере-
тін болса ғана оның танымдық көкжиегі кеңи тү-
седі. Сонымен бірге мұндай сөздердің тек сандық
тұрғыда ғана емес, сапалық тұрғыда меңгерілуін,
яғни оқушының белсенді сөздік қорында болуын
да ескерген жөн.Сонда ғана олардың тіл байлығы
молайып, білім дәрежесі артады. Өйткені сөздің
лексикалық мағыналары талай рет қайталана қол-
данылу нәтижесінде санамызға сіңіп қалыптасады.
Мұнда олар сол сөз білдіретін зат, не құбылыстың
белгілі бір қасиеттеріне негізделіп, ол сөз атал-
ғанда санамызда сол касиеттер мағынаның басты
көрсеткіштері, яғни мәндері ретінде көрінеді. Енді
қарастырған оқулықтардағы жиі қолданысқа ие
сөздерге назар аударсақ, салыстырьшушы мәтін-
дер арасында сөздердің қолданылымындағы мы-
надай ерекшеліктерді аңғарамыз:
Мәтіннің көлемі ұлғайған сайын, мұндай сөз-
дердің де абсолютті шамасы артқанымен, түрлі тіл-
дердегі олардың жиынтық қатынасты жиілігі 0,60%
шамасыңда болады. Сонымен бірге аз қолданыс-
тағы сөздердің молдығы жазушы, немесе ақын
тілінің байлығы немесе оның өзіндік ерекшелігін
көрсетеді деп есептелінеді. Бірақ бұл тұжырым
таңдама әдісі арқылы алынған мәтіндердің көлемі
бірдей болған жағдайда ғана дұрыс деп тануымыз
керек. Салыстырылыпотырған 1950-2000 жыл-
дардағы оқулық мәтіндері мен БӘ (Ғ<4), сонымен
бірге орыс тіліндегі жиілік сөздіктер және Абай
шығармаларынан (Ғ<2) байқайтынымыз – таңда-
ма көлемі ұлғайған сайын, аз кездесетін сөздердің
үлесі азаяды.
Мысалы, таңдама көлемі 185961 сөз қолда-
нысқа (с.қ.) тең (10298 сөз) Біз қарастырған оқу-
лықтарда аз кездесетін сөздердің үлесі 59,22%, ал
таңдама көлемі 241984 сөз қолданысқа (12284 сөз)
тең 70 жылдардағы оқулықтардағы олардың үле-
сі 60,03%, таңдама көлемі 226374 сөз қолданысқа
тең 90 жылдардың оқулықтарындағы аз кездесетін
сөздердің үлесі 59,71%, таңдама көлемі 368965 сөз
қолданысқа тең 2000 жылдар оқулықтарындағы
олардың үлесі 57,33%. Засорина құрастырған таң-
дама көлемі 120843 сөз қолданысқа тең болатын
орыс тіліндегі сөздіктегі ең аз кездесетін сөздер
63,98% болса, Абай шығармаларындағы олардың
үлесі 64,43%. Сондықтан да ең аз кездесетін сөз-
дерді салыстыруға байланысты пікірлер мен қо-
рытындылар жасау барысында өзара бірдей кө-
лемдегі таңдамаларды, яғни 185961 (жуықтағанда
200000 с.қ.) сөз қолданыс пен 368965 сөз қолданыс
аралығындағы таңдамаларды шартты түрде өзара
деңгейлес деп қарастырдық. Сондағы 1950-2000
жылдардағы оқулықтарды салыстырудан байқа-
ғанымыз – бұл көлемдегі таңдамалар үшін ең аз
кездесетін сөздердің үлесі 57-60% шамасында бо-
лады. Ал 100000 және 120000 сөз қолданыс ара-
лығындағы таңдамалар көрсеткендей, агглютина-
тивті тілдер үшін (БӘ 97260 с.қ.) бұл шама 69-70%
болса, флективті тілдерде ол 64-70% шамасында
болады. Алынған нәтижелерді флективті тілдерді
агглютинативті тілдерден ажырататын типология-
лық сипаттамалар ретінде де қарастыруға болады.
Достарыңызбен бөлісу: |