Муканова асель сериковна
диссертация Асель
Сынып-төбе –«Етістік»: ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; . Сыныптар жиынын белгілеп алғаннан кейін етістіктің онтологиялық моделін семантикалық гиперграф арқылы бейнелеуге болады. Гиперграф H(V, E), мұндағы: ; ; Қазақ тілінде морфологиялық талдауды жүзеге асыру алгоритмі Морфологиялық талдаудың негізгі мақсаты мәтінді өңдеудің келесі деңгейлерінде қолданыс табатын сөзпішімдер мен сөзжасамдардың морфологиялық ақпаратын анықтау. Морфологиялық талдауды жүзеге асырудың негізгі үш әдісі бар. Олар: декларативті, процедуралық және аралас әдістер. Морфологиялық талдауды жүзеге асырудың декларативті әдісінде әрбір сөздің мүмкін болатын сөзпішімдері мен сөзжасамдары және оларға тән морфологиялық ақпараттарымен бірге сөздікте сақталады. Бұл жағдайда морфологиялық талдаудың міндеті ретінде сөзпішімдер мен сөзжасамдарды сөздіктен іздеу және сөздікте сақталған морфологиялық ақпаратты алып жазу болып саналады. Сондықтан да бұл әдіс кезінде айтарлықтай морфологиялық талдау болмайды, тек оның нәтижесі ғана сақталады. Әрбір сөз үшін оның сөзпішімдері мен сөзжасамдарының көп болуына сәйкес деклатаривті әдіс есептеу жүйесі жадының көп мөлшерін жұмсауды қажет етеді, сол себепті де сөздікті құру және оны қамтамасыз етуде, ақпараттың көп мөлшерде артық болуына байланысты көптеген қиындықтардың туындауына әкеліп соғады. Көрсетілген әдістің артықшылығы ретінде талдаудың өте үлкен жылдамдылығы мен барлық мүмкін болатын сөзпішімдер мен сөзжасамдар жиынына қатынасының әмбебаптылығын көрсетуге болады. Процедуралық әдіс табиғи тіл жөніндегі морфологиялық білімдердің алдын ала жүйеленуін және жекелеген сөзпішімдер мен сөзжасамдарға морфологиялық ақпаратты меншіктеу алгоритмін құруды қажет етеді [135]. Процедуралық морфологиялық анализатор келесі деңгейлерден тұрады: берілген сөзпішімдер мен сөзжасамдардың түбірін анықтау, оның идентификациясы (теңестірілуі, тану), оларға қажетті морфологиялық ақпараттарды жазу. Ол үшін сөз түбірлерінің сөздіктері мен қосымшалар сөздігі қолданылады. Қазақ тіліндегі сөздердің көбісі бір типтес қосымшаларды қолданатындықтан, сөз түбірлерінің сөздіктері мен қосымшалар сөздігінің көлемі декларативті әдісте қолданылатын сөзпішімдер сөздігінінен әлдеқайда аз болады. Бұл әдістің кемшілігі сәйкестендіру сөздігін құру көп еңбек етуді қажет етеді және оны шешу өте қиын. Осы әдісті жүзеге асыру салыстырмалы түрде аз жадты қажет етеді, бірақ осы кезде сөзпішімдерді оның құрамына бөлуге және сәйкестендіру процедурасын жүзеге асыруға байланысты морфологиялық анализ жасау уақыты ұзарады [136]. Аралас әдіс. Нақты күрделілік дәрежесі бар жүйелерде көбінесе аралас әдіс қолданылады. Бұл жағдайда сөзпішімдер сөздігімен қоса, түбірлер сөздігі де қолданылады. Бірінші деңгейде декларативті әдістегідей сөздік бойынша сөзпішімдерді іздеу жүзеге асырылады, және іздеу табысты болса, онда талдау осы деңгейде тоқтатылады. Ал керісінше болса, онда түбірлер сөздігі іске қосылады және талдаудың процедуралық әдісі қолданылады. Біз процедуралық әдісті қолдана отырып, морфологиялық талдауды жүзеге асырамыз. Тезауруста тек қана сөздердің түбірлері және олардың морфологиялық ақпараты ретінде қандай сөз табына жататындығын көрсетеміз. Ал қосымшалар әр сөз табының өзгеру троекториясына қатысты жеке бөлек сақталады. Бұл бізге талдау жасауды жылдам жүзеге асыруға мүмкіндік береді, себебі қосымшаларды әр сөз табына қатысты ғана іздейміз. Морфологиялық талдау алгоритмі: БАСЫ. Морфологиялық анализатор кірісіне графематикалық талдаудан кейін алынған сөздер тізбегі беріледі. Берілген сөздер тізбегінен цикл бойынша сөз алынады. Сөз тезаурустан тексеріледі. Егер сөз табылса, оның сөз табы жазылады да, 9 - қадамға өтеді, егер сөз табылмаса 4 - қадамға өтеді Сөз оңнан солға қарай әріп бойынша циклмен оқылады. Қалған сөз тезаурустан тексеріледі. Егер сөз табылса, онда сөздің қалғаны қосымша деп есептелініп, табылған сөздің сөз табы жазылып, 5 - қадамға өтеді. Қосымша табылған сөздің сөз табына қатысты басқа сөз табын тудырушы жұрнақтардан ізделінеді. Егер жұрнақ табылса, оның морфологиялық ақпараты жазылады да, 9 - қадамға өтеді. Егер табылмаса 6 - қадамға өтеді Қосымша оңнан солға қарай әріп бойынша циклмен оқылып, қалған қосымша үшін 5 - қадам қайталанады. Егер жұрнақ табылмаса 7 - қадамға өтеді. Қосымша табылған сөздің сөз табына қатысты сөз түрлендіруші жалғаулардан ізделінеді. Егер жалғау табылса, оның морфологиялық ақпараты жазылады да, 9 - қадамға өтеді. Егер табылмаса 8 - қадамға өтеді. Қосымша оңнан солға қарай әріп бойынша циклмен оқылып, қалған қосымша үшін 7 - қадам қайталанады. Егер берілген сөздер тізбегі цикл бойынша барлығы талдаудан өтпесе, 2 - қадамға өтеді. Егер берілген сөздер тізбегі цикл бойынша барлығы талдаудан өтсе, онда талдаудың СОҢЫ. Қазақ тілінде синтаксистік талдауды жүзеге асырудың формалды моделі Cинтаксистік талдау табиғи тілді өңдеудің үрдісі тізбегінде ең маңызды орын алады. Ол ақпараттық іздеу, сұрақ‑жауап жүйелерінде және берілген мәтіннен білімдерді алу жүйелерінде қолданылады. Табиғи тіл мәтіндерін өңдеу облысында синтаксистік талдау ретінде қандай да бір (табиғи немесе формалды) тілдің лексемаларын оның формалды грамматикасымен сәйкестендіру алынады. Синтаксистік талдаудың бірлігі ретінде сөйлем алынады. Берілген мәтінді машинаның түсінуі есебінде синтаксистік талдау мәтіннің мағынасын формалды бейнелеуге жақындатуға мүмкіндік береді. Сол себепті де синтаксистік құрылым семантикалық талдаудың кірісі ретінде аралық нәтиже болып табылады.. ТТ сөйлемдерінің синтаксистік құрылымының модельдері Ноама Хомского [137] жұмыстарында ұсынылған құраушылар грамматикасына, не Люсье́на Тенье́ра [138] және Игорь Мельчук [139] жұмыстарында негізін алған тәуелділіктер грамматикасына негізделген. Құраушылар грамматикасы моделі ТТ мәтіндері құраушылар иерархиясынан‑жобалы синтаксистік топтары түрінен тұрады деп болжайды. Бұл синтаксистік топтар өзара қиыса алмайды, бірақ олар ұсақ топтардан, тіпті атомарлы топтан, яғни сөйлемнің ең кіші бөлігі сөзден тұратын ұсақ топтардан құрала алады. Мұндай иерархиялық құрылымды құраушылар ағашы деп атайды. Тәуелділіктер грамматикасы мәтін сөйлемін тәуелділіктер ағашы түрінде құрылымдауға болады деп болжайды. Онда сөздер бағытталған доғалар, яғни басыңқы және бағыныңқы сөздер арасындағы синтаксистік бағыну байланысынан тұрады [140-141]. Тәуелділіктер грамматикасы есептерін формалдаудың бірнеше сыныптарын бөліп қарастыруға болады. Бірінші сыныпқа жобалық тілдік құрылымды модельдеу формалдау жатса, екіншісіне шектеу жиынтығы түрінде формалдау жатады, ол тәуелділіктер грамматикасы аоқылы жобалық және жобалық емес тілдік құрылымдарды модельдеуге мүмкіндік береді. Тәуелділіктер грамматикасын бейнелеудің тағы бір сыныбы қандай да бір ережелер жүйесін беруден тұрады. Бұл тәсілдеме Михаэль Ковингтон [142] жұмыстарынан бастау алады. Ол талдаудың қарапайым алгоритмін ұсынды, яғни сөйлемнің бірінші сөзінен бастап солдан оңға қарай сөздерді сүзу арқылы ағымдағы сөз бен оның алдындағы барлық сөздер арасында байланыс орнату. М. Ковингтон бұл алгоритм арқылы дұрыс синтаксистік ағаштар құруға және ол ағаштар тәуелділіктер грамматикасының басқа күрделі формализмдерінен тұра алатындығын көрсетті. Синтаксистік тәуелділіктер ағашының құраушылар ағашынан негізгі айырмашылығы мұнда құраушыларды білдіретін терминалды емес төбелер болмайды, ал синтакситік байланыстар грамматикалық қызметін немесе сөздер арасындағы жалпы семантикалық қатынасты айқындауға мүмкіндік береді. Сол себепті де бұл жұмыста синтаксистік талдау үшін тәуелділіктер грамматикасы қолданылады. Қазақ тілінде сөз тіркестерді құрудың формалды ережелері Әртүрлі сөз таптарына түрлендіруші қосымшаларды қосу арқылы алынған сөзпішімдері, сөздер белгілі синтаксистік заңдылықтарға сүйене отыра байланысып, мағыналық мән беріп сөз тіркесін, сөз тіркестері жай сөйлемдер [143], жай сөйлемдер күрделі сөйлемдерді жасайды. Сөз тіркесінің синтаксисі сөздердің өзара тіркесу тәсілдері мен сұлбаларын (формаларын), тіркесу қабілеттілігі және сөз тіркестерінің құрамы мен түрлерін морфологиямен тығыз байланыста қарастырады. Онда сөздерді сөз тіркестері мен сөйлемнің бөлшектері ретінде, жалғауларды сөздерді өзара байланыстырып тұратын морфологиялық-синтаксистік категория ретінде зерттейді. Сөз тіркестері грамматикалық тәсілдер арқылы байланысқан кем дегенде толық мағынасы бар екі сөзден құралады. Құрастырушы сыңарлар бірі бағыныңқы, екіншісі басыңқы мүше ретінде қызмет атқарады [144]. Сөздердің синтаксистік байланысының екі түрі бар: аналитикалық және синтетикалық. Аналитикалық тәсілге сөздердің орны тәртібі, интонация арқылы және шылаулар арқылы байланыс түрлері жатады. интонация арқылы байланыс. Сөздер интонация тәсілімен байланысқан кезде, дауыстың ырғағы мен әуені негізгі қызмет атқарады. Дауыс екпіні, логикалық екпіннің қойылуына қарай қай сөз қай сөзбен байланысып тұрғаны анықталады. Мысалы: Абзал анасын қатты күтті. Осы сөйлемде Абзал сөзінен сөзінен кейін кідіріс жасасақ, анасын күткен Абзал екенін білеміз. Ал егер Абзал анасын тіркесінен соң іркіліс қойылса, Абзал анасын күткен белгісіз біреу болар еді; сөздердің орны тәртібі. Сөздердің орны тәртібі тәсілі сөйлем құрамындағы сөздер орындарының сақталуын қажет етеді. Сөйлемдегі сөздердің орын тәртібінің ауысуы мағыналық өзгеріс те тудырады. Мысалы: қызықты кітап, жасыл көйлек, көгілдір аспан тіркестері анықтауыштық қатынасты білдіріп, затты анықтауға қызмет етсе, кітап қызықты, көйлек жасыл, аспан көгілдір десек, предикаттық қызметке көшіп, сынға екпін түсіреді. Бұндай тіркес түрлері публицистикалық , көркем шығармаларда кездеседі; шылау сөздер арқылы байланыс тәсілдері. Шылау сөздер сөз тіркесінің құрамындағы сөздердің граматикалық, мағыналық жағынан байланыстырады. Мысалы: 1. Университетке дейін үш аялдама бар. 2. Ардақ арқылы беріп жіберді [145]. Сөздердің синтетикалық тәсіл арқылы байланысына сөз тіркестерінің құрамындағы сөздердің жалғаулар арқылы байланысуы жатады. Сөз тіркесіндегі сөздер септік, көптік, тәуелдік, жіктік жалғаулармен байланысуын қосымшалар арқылы байланыс тәсілі дейміз. Сөздерді байланыстыруда ерекше қызметті септік жалғаулар атқарады. Мысалы: Дүкеннен азық-түлікті алды. Сөйлемде дүкеннен алды (шығыс септік), азық-түлікті алды (табыс септік) деген екі сөз тіркесін септік жалғаулар жасап тұр. Сөздердің сөйлем ішінде жалғаулар арқылы байланысуына қарай сөз тіркестерінің бес түрлі байланысу түрлерін көрсетуге болады. Олар: Қабысу – сөздердің ешқандай жалғаусыз іргелес тұрып байланысуы. Мысалы, алтын адам, елу кітап, қызғылт орамал, ол кім, қандай үлкен, бұл кішкентай, ақ құман, т.б. Меңгеру – сөздердің бағыныңқы бөлімі іліктен басқа септік жалғауларының бірінде болатын байланысы. Мысалы, комиссияға мүше, өзіңе үлгі, елге жақсы, өзіңе өзің, т.б. Матасу – сөздердің бірі ілік септік жалғауында, екіншісі тәуелдік жалғауында болып байланысуы. Мысалы, адамның баласы, жасылдың түрі, олардың кітабі, оның кітабы, т.б. Қиысу – сөз бен сөздің жіктік жалғаумен жақ жағынан үйлесе байланысқан түрі. Мысалы, мен келемін, оқушылар оқиды, олар жүгірді, т.б. Жанасу – сөздердің еш жалғау жалғанбай, жалғаусыз орын тәртібінің алшақ тұрып, араларына сөздер салып байланысуы. Жанасу көбіне етістікті сөз тіркесі болып келеді, үстеу мен етістіктен, көсемше мен етістіктен құралады. Мысалы, шалқытып өлең айту – шалқытып айту, ертең кету – ертең ауылға кету т.б. Сөз тіркестері сөздердің өзара тіркесу қабілетіне қарай есімді және етістікті болып екі салаға бөлінеді (15 сурет). Есімді сөз тіркестердің басыңқы бөлімі есімдердің бірі, ал етістікті сөз тіркестерінің басыңқы бөлімі етістік болады. 15 сурет – Сөз тіркестерінің сөздердің өзара тіркесу қабілетіне қарай бөлінуі Cөздердің тіркесуі кезінде бағыныңқы сөз басыңқы сөзбен байланысып, қандай да бір грамматикалық мағына пайда болады. Грамматикалық мағына анықтауыштық, пысықтауыштық, толықтауыштық қатынас арқылы пайда болады. Анықтауыштық қатынас қабысу, матасу арқылы, толықтауыштық қатынас меңгеру кезінде есімді, етістікті тіркес арқылы, пысықтауыштық қатынас меңгеру, қабысу, жанасудың етістікті тіркестері арқылы жасалады [146]. Қазақ тілі сөз таптарының формалды моделдері арқылы алынған ережелер арқылы қазақ тілінде сөз тіркестерін құрудың ережелерінің онтологиялық моделдерін көрсетуге болады. 5 кестеде сөз тіркестерін құрудың онтологиялық моделдеріндегі негізгі түсініктер берілген. 5 кесте – Сөз тіркестерін құрудың ержелерінің онтологиялық моделдеріндегі негізгі түсініктер
жүктеу/скачать 5,36 Mb. Достарыңызбен бөлісу: |