Қазақ тілінде морфологиялық талдауды жүзеге асырудың формалды моделі
Қазақ тілінің грамматикалық заңдылықтарын [122] қарастыратын болсақ, қазақ тілінің тілдік ережелері формалдауға ыңғайлы және жақсы нәтижелер алуға мүмкіндік береді.
Негізінен алғанда табиғи тілді оқуды екі жақты позициямен жүзеге асыруға болады. Олар: талдау және синтездеу. Тілдік ережелерді синтездеу ережелері арқылы талдауды жүзеге асыруға немесе керісінше істеуге болады. Қазақ тілін оқыту синтездеу немесе талдау тұрғысынан да қарастыра беруге болады. Қазақ тіліндегі тілдік ережелерді талдау тұрғысынан формалдау [123] пайдаланушымен табиғи тілдік байланыс жасау жүйелерінде қойылған сұратымдарды түсіну үшін қажет болса, синтездеу берілетін жауаптарды, яғни айтылымдарды генерациялау кезінде қажет болады.
Қазақ тілі түрік тілдес тілдерге жатады және әрбір сөз үшін көп сөзпішімдерімен айқындалады [124]. Қазақ тілінің морфологиясында сөздер негізгі түбір мен туынды түбірден жұрнақтар мен жалғаулар арқылы немесе сөздерді өзара қосарлау, тіркеу әдістерімен жасалатыны және олар қайсы бір сөз таптарына жататыны белгілі және әр сөз табының өзіндік сөз түрлендіруші, сөз тудырушы қосымшалары бар [125]. Қазақ тілінде қосымшалардың сөз түбіріне жалғану тізбегі нақты анықталған: ең алдымен сөз тудырушы немесе түрлендіруші жұрнақтар, содан кейін сөз түрлендіру жалғаулар жалғанады. Айта кететін жайт, қазақ тілінде қосымшалар негізінен, үндестік заңы бойынша жалғанады. Үндестік заңы дегеніміз осы тілдегі сөздердің, сөз бен қосымшаның бір-бірімен дыбысталуы жағынан үндесе қолданылуы. Үндестік заңы буын үндестігі (сингорманизм) және дыбыс үндестігі (ассимиляция) болып екіге бөлінеді. Сөздердің соңғы буынының жіңішкелігі мен жуандығына қарай қосымшалардың бірыңғай жіңішке не жуан болып жалғануын сингармонизм немесе буын үндестігі дейміз. Яғни буын үндестігі сөздің соңғы буынындағы дауысты дыбыстың қосымшадағы дауысты дыбысқа әсері болып табылады. Мысалы, жи-на+сын, із-де+ттір. Буын үндестігі орыс тілінде жоқ, қазақ тілінің ерекшелігіне жатады. Сонымен қатар, қазақ тіліндегі тағы бір ерекшелік, ол сөз соңы келесі әріптерге бітетін болса және қосымша дауысты дыбыстан басталса, онда келесі өзгертулер болады: «п» - «б», «қ» - «ғ», «к» - «г».
Қазіргі кезде онтология әртүрлі пәндік облыстардағы объектілер арасындағы қарым-қатынасты моделдеудің өте кең таралған құралы болып табылады.
Қазақ тілінің «Сөз табы» қолданбалы онтологиясы [126] жалпы онтологияны құрудың принциптері негізінде жасалды, бірақ мұнда білімді бейнелеу тілі (моделі) ретінде семантикалық гиперграфтар қолданылды.
Онтологияны төмендегідей (2.1) анықтаймыз:
(2.1)
мұндағы ‑ пәндік облыстың семантикалық гиперграфы, – пәндік ортаның түсініктер жиыны (гиперграфтың төбелері);
– түсініктер арасындағы қатынастар жиыны (гиперграфтың доғасы мен қабырғасы);
– берілген пәндік облыстағы қатынастар мен түсініктер атауының жиыны;
– онтологиядағы шығару процедураларының жиынтығы.
Пәндік ортаның түсініктер жиыны бірнеше ішкі жиындарға, формула (2.2) бөлінеді:
(2.2)
мұнда - бұл пәндік ортаның барлық ішкі сыныптарының сыныбы болып табылады.
Біздің қарастырып отырған жағдайда құрылып отырған қолданбалы онтологияда «Сөз табы» негізгі сынып болып есептеледі. - пәндік ортаның құрылымдық түсініктерінің ішкі сыныбы. Біздің жағдайымызда бұл – сөз табының грамматикалық категориясына қатысты жіктеу, - құрылымдық түсініктемелерді «құрайтын» сыныптар – грамматикалық категориялардың өз ішінде бөлінуі, - түсініктемелер қасиеті – түрленуі. - қасиеттер мағынасы – жалғау және жұрнақтар. Онтологияның түсініктері ағылшын тілінде берілген. Төменде көрсетілген сөз таптарының онтологиялық моделдерінің ерекшеліктері, онда грамматикалық категориялар, семантикалық топтармен қатар, олардың семантикалық белгілері (жұрнақтар) алынған. Семантикалық белгілер сөз түбірлерінен жаңа басқа мағыналы сөз тудыру мен оларды талдауды формалдауға мүмкіндік береді. Бұл қазақ тілі үшін алғаш рет жасалынып тұр.
Қазақ тілі зат есімінің формалды моделі
Зат есім -заттық ұғымды білдіреді. кім? не? деген сұрақтарға жауап береді. Сөйлемнің бастауыш қызметін атқарады.
Зат есім үшін (N) семантикалық топтары ретінде жанды (anim) және жансыз (inanim) екендігі алынады. Осыған байланысты зат есімнің түрленуі және зат есімнен басқа сөз таптарын тудыру жүзеге асады. Қазақ тілінде зат есім жіктеледі (pers_end), септеледі (cases), көптеледі (number) және тәуелденеді (poss_end) және зат есімнен зат есім, зат есімнен сын есім, зат есімнен етістік тудыруға болады [127].
Зат есім онтологиясын құру үшін Protégé [128] онтологиялық редакторын пайдаланамыз. 7 суретте зат есімнің семантикалық белгілерін ескере отырып онтологиясы құрылды [129].
7 сурет – Зат есімнің онтологиялық моделі
8 суретте онтологияны семантикалық гиперграфты пайдалана отырып графикалық бейнелеу көрсетілген.
8 сурет – Зат есім онтологиясын семантикалық гиперграф арқылы
графикалық бейнелеу
2 кестеде зат есім онтологиясындағы негізгі түсініктер мен қатынастар көрсетілген.
2 кесте – Зат есім онтологиялық моделіндегі түсініктер мен қатынастар
ID
|
Белгіленуі
|
Сипаттамасы
|
1
|
2
|
3
|
|
N
|
Зат есім
|
|
|
Достарыңызбен бөлісу: |