39 6) МАҒЫНАСЫ АЖЫРАТЫЛҒАН ОМОНИМДЕРДІҢ ЖИІЛІГІ. Мор-
фологиялық талдағыштан өткен, омонимі ажыратылған мəтіндерден жиілік сөздік
алу əлдеқайда жеңіл. Олай болмаған жағдайда, омоним сөздерге келгенде автомат
оларды танымайды да, əр сөз табына жататын омоним сөздердің қайсысының жиі
кездесетінін нақты көрсете алмайды. (Мысалы, ақ сөзі əрі сын есім, əрі етістік).
Омоним ажыратылған корпустары жасалған тілдер көп емес, ал болған күнде
мəтін көлемі шағын болып келеді. Себебі барлық омонимдерді автоматты түрде
ажырататын компьютерлік бағдарлама ешбір тілде жасалмаған деуге болады.
Біздің тəжірибемізде де, морфологиялық талдағыш таныған аздағаны болмаса,
омонимдер негізінен құрастырушылардың қол күшімен ажыратылды.
Сөздіктің бұл түрінде жоба барысында мəтіннен алынып, ажыратылған қазақ
омонимдерінің жиілігі берілді. Олардың дені түркілік түбірден жасалған сөздер
екені туралы жоғарыда айтып кеттік. Омонимдердің қатарында біреуінің ерекше
жоғары, ал екіншісі төмен жиіліктен көрінетіні туралы құбылыс та аңғарылды.
Сонымен бірге омонимдерді стильдер бойынша үлестірілім əліпбилі-жиілікте
берудегі мақсат, олардың əрқайсысының түрлі функционалдық стильдердегі
«болмысын» таныту болды. Мəселен, қара сөзінің сын есімдік омонимі ресми-
іскери стильде белсенді емес, ал көркем əдебиет стилінде жоғары жиілік
мəндерінен көрінді. Бұл сөздік оқыту мəтіндерін құрастырушылар үшін ғана
емес, тіл зерттеушілері үшін де қызық мəліметтер бере алады деп ойлаймыз.
7) СӨЗФОРМАЛАРДЫҢ ЖИІЛІГІ 17
. «Жалпы білім берудегі қазақ тілінің
жиілік сөздігінің» бір түрі ретіндегі «Сөзформалардың жиілік сөздігі» – қазақ
тіл біліміндегі алғашқы тəжірибе, үлкен нəтиже. Əдетте сөзформалар сөздігі
тілдегі сөздердің түрленім формасын тізімдеуді мақсат етеді. Нəтижесінде бір зат
есім немесе бір етістік сөз қанша формамен түрлене алады деген статистикалық
мəлімет алынады. Алайда ұсынылып отырған сөзформалардың жиілік сөздігінде
сөздердің барлық түрленім парадигмасы қамтылмауы мүмкін, өйткені сөздік база-
сына алынған мəтіндерде кездескен сөзформалар ғана тіркелді.
Жалпы сөзформалардың жиілік сөздігі тіл білімінің дəстүрлі зерттеулері
үшін ғана емес, жаңа бағыттағы ізденістер, əсіресе ұлттық корпустар құрастыру,
оның ішінде морфологиялық анализатор жұмысы үшін де құнды мəліметтер бере
алады. Ұсынылып отырған сөзформалар сөздігі қазақ тілінің 5 стилі қамтылған
мəтіндерден алынған теңгерімді, жан-жақты мəтін базасында əзірленгендігімен
құнды.
Жиілік сөздік жасаудың бір жолы – мəтіндерден сөзформалардың жиілік
сөздігін алу арқылы қолдап леммаға келтіру. «Жалпы білім берудегі қазақ
тілінің жиілік сөздігі» осы əдіс арқылы жасалды. Ал осы еңбекке негіз болған
«Сөзформалардың жиілік сөздігі» де тіл білімі ғана емес, оқыту, автоматты аудар-
ма жасау сияқты іргелі істерге негіз болатын маңызды еңбек деуге болады.
Сөзформалар жиілік сөздігі сөзтізбесінің, яғни бірінші сөзтізбенің негізгі үш