Интеллектуалды сұрақ‑жауап жүйесінің қолданушы интерфейсі
Қазақ тілінің грамматикасы бойынша сұрақ‑ жауап жүйесін іске қосу интернет-браузер арқылы жасалады. Қазақ тілі табиғи тілде сұрақ жауап жүйесі бейнесі 27 суретте көрсетілген.
Қазақ тілі табиғи тілінде сұрақ-жауап жүйесі келесі қосымшалардан тұрады:
сұрақ қою;
сөздік;
онтология;
сұрақтар сұлбасы.
27 сурет - Қазақ тілі табиғи тілде сұрақ жауап жүйесі
Сұрақтарды табиғи тілде немесе SparQl сұратым тілінде қоюға болады. Сөздікте білімдер базасында жоқ жаңа түсініктерді олардың сөз таптары мен ағылшын нұсқасын көрсету арқылы енгізуге болады. Онтология қосымшасында басқа пәндік облыс бойынша жұмыс жасау үшін жаңа онтологияны енгізуге болады немесе қазақ тілі грамматикасы онтологиясында өзгерістер енгізуге мүмкіндік бар. Сұрақтар сұлбасында табиғи тілдік мәтінді өңдеуден өткізгеннен кейін алынған синтаксистік құрылымдарды пайдалана отырып, мәтінді семантикалық талдауға қажетті жаңа сұрақтар сұлбасын қосып немесе өңдей аламыз. Жүйе кодының үзінділері Г Қосымшасында келтірілген.
Бөлім бойынша қорытынды
Бұл бөлімде қазақ тілі грамматикасы пәндік облысы бойынша онтологияны құрудың алгоритмі жасалып, оны жүзеге асыру арқылы, онтология білімдерін формалды тілде cипаттай отырып, пәндік облыс бойынша білімдер базасы құрылды. Сол білімдер базасы бойынша қазақ тілінде тілдесуге мүмкіндік беретін интеллектуалды сұрақ‑жауап жүйесі программалық жүзеге асырылды. Онда қолданушының сұрағы лингвистикалық талдаудан өткізіліп, сөз тіркестерінің SPO триплет моделдерінің түрлеріне сәйкес келуіне байланысты өңделіп, сұрақ базадағы білімдерге сәйкестендіріліп, соған байланысты білімдер базасында бар ақпарат бойынша мағыналы жауап қайтару жүзеге асырылған.
ҚОРЫТЫНДЫ
Қазіргі кезде мәтіндік ақпараттың күн санап өсуі және олардың құрылымдарының күрделі болуы табиғи тілдегі мәтіндерді талдайтын, олардың мағынасын түсіне алатын және олардың негізінде жаңа білімдер алатын, адам мен машина арасында табиғи тілде қарым-қатынас жасауға мүмкіндік беретін интеллектуалды жүйелерді қажет етеді. Ондай жүйелерді жобалау және құру үшін білімдерді бейнелеу мен өңдеудің моделдері мен әдістерін қарастыру керек.
Диссертациялық жұмыста қазақ тіліндегі білімдерді семантикалық өңдеудің мәселесін кешенді зерттеу және шешуге арналған жұмыстар жүргізілді. Жұмыс нәтижесі бойынша барлық қойылған есептер орындалды.
Жүргізілген зерттеулердің нәтижесінде келесі қорытындылар жасалды:
Біріншіден, қазақ тілінің морфологиялық және синтаксистік ережелеріне талдау жасалды. Олардың негізінде қазақ тіліндегі мәтіндерді лингвистикалық талдау үшін сөз таптарына байланысты сөздердің түрлену траекториясы ғана емес, сонымен қатар бір сөз табынан басқа сөз таптарын тудыру ережелері де есепке алынып, сөз таптарының онтологиялық моделдері жасалып, ондағы білімдерді бейнелеу тілі ретінде семантикалық гиперграф алынды, бұл бізге онтологиядағы жекелеген экземплярлар арасындағы қатынасты осы экземплярларды біріктіретін сыныптар арасындағы қатынас арқылы анықтауға мүмкіндік бергендіктен, морфологиялық талдау барысында сөз түрлендіруші қосымшалар жалғауларды ғана емес, сөз тудырушы жұрнақтарды да ескеруге мүмкіндік береді. Морфологиялық талдау нәтижесінде қазақ тілінде сөзтіркестерін құрудың ережелерінің онтологиялық моделдері құрылып, формалды ережелері алынды. Олардың негізінде морфологиялық және синтаксистік талдаудың алгоритмдері жасалып, программалық түрде жүзеге асырылды.
Екіншіден, қазақ тілі грамматикасы пәндік облысы бойынша білімдер базасын құрудың моделдері мен әдістері талданып, ол бойынша онтологиялық модел құрылып, ондағы білімдер формалды тілде сипатталып, логикалық ережелерге сай қазақ тілі грамматикасы пәндік облысы бойынша білімдер базасы құрылды.
Үшіншіден, қазақ тілі грамматикасы пәндік облысы білімдер базасы негізінде қазақ тіліндегі білімдерді семантикалық өңдеудің семантикалық моделі мен әдісі қарастырылып, программалық түрде жүзеге асырылды.
Төртіншіден, қазақ тілі грамматикасы пәндік облысы бойынша пайдаланушымен қазақ тілінде жазбаша диалог жүргізетін интеллектуалды сұрақ‑жауап жүйесінің архитектурасы құрылып, программалық жүзеге асырылды. Бұл жүйеде табиғи тілде келген мәтін лингвистикалық талдаудан өтіп, сөз тіркестерінің байланысу түрлеріне қарай семантикалық талдауды жүзеге асырып, ондағы ақпаратты білімдер базасындағы білімдерге сәйкестендіру арқылы қолданушы сұрағына табиғи тілде жауап береді. Бұл жүйенің басқа жүйелерден айырмашылығы, сұрақ‑жауап жүйесі қазақ тілінде жұмыс жасайды, ол мәтіндерден құрылған деректер қоры негізінде емес, өзінің жеке білімдер базасы негізінде жұмыс істейді. Бұл бізге білім базасындағы білімдерден логикалық ережелер арқылы жаңа білімдер алуға мүмкіндік береді. Табиғи тілде келіп түскен сұрақты лингвистикалық талдаудың барлық деңгейінен өткізеді, соның нәтижесінде онтологиядағы жекелеген түсініктер арқылы ғана емес, оларды біріктіретін сыныптар арасындағы байланысты анықтау арқылы мағынасына қарай жауап береді. Білімдер базасына жаңа білімдер қосу мүмкіндігі қарастырылған. Сонымен қатар, жүйе сұрақты енгізіп бастағаннан енгізілген сөзді білімдер базасынан іздеп, оған қатысты ақпаратты ұсына алу мүмкіндігі бар. Ол қате сұрақ қоймауға мүмкіндік береді және жүйенің интеллектуалдылығын тағы бір қырынан көрсетеді.
Жұмыс Л.Н. Гумилев атындағы Еуразия ұлттық университетінің «Жасанды интеллект» ғылыми-зерттеу институты базасында екі ғылыми-зерттеу грантының, атап айтқанда «Қазақ тілінің жазбаша және ауызша сөйлеулерін тану және тудыруды автоматтандыру» ҚР БҒМ ғылыми-зерттеу гранты (мемлекеттік тіркеу нөмірі №0112РК02251), «Оқыту, білімді бақылау және бағалау интеллектуалды жүйесі» ҚР БҒМ ғылыми-зерттеу гранты (мемлекеттік тіркеу нөмірі №0113РК01423) аясында орындалды.
Зерттеудің ғылыми нәтижесі Л.Н. Гумилев атындағы Еуразия ұлттық университеті, «Информатика және ақпараттық қауіпсіздік» кафедрасының оқу үрдісінде «6М060200-Информатика» мамандығының «Жауаптарды синтездеу әдістері» және «Сұрақтарды талдау» таңдау компоненттерінен тұратын элективті модулі «Сұрақ - жауап жүйесі» пәні мен «Адам - машина өзара әрекеттесуі» және «Білімді алу және деректер қоймасы» таңдау компоненттерінен тұратын мамандық модулі «Адам-машина өзара әрекеттесуі және Бизнес Интеллект» пәнін оқытуға ендірілді (Д Қосымшасы).
Зерттеу нәтижелерін қазақ тілін оқыту, қазақ тілінде іс жүргізу, қазақ тіліндегі ақпараттардың морфологиясын және синтаксисін тексеру мүмкіндігі бар қазақ тілінде қарым-қатынас жасайтын интеллектуалды ақпараттық технологиялар мен жүйелерді дайындауда және телекоммуникациялық жүйелерде қазақ тіліндегі ақпаратты дұрыс қабылдау, беру мен өңдеуде, сонымен қатар, мемлекеттік басқару ұйымдары, әртүрлі деңгейдегі білім беру мекемелері, оқу орталықтары және сол сияқты басқа да мемлекеттік, мемлекеттік емес кәсіпорындарда пайдаланауға болады. Зерттеу нәтижелерін қолдану пайдаланушылар жұмыстарының тиімділігін арттыруға тікелей септігін тигізеді. Бұл еліміздің әртүрлі қызмет, білім, ғылым, техника, технология және басқа салаларына байланысты қазақ тілінің қолданылу аясын кеңейтеді.
Алынған барлық нәтижелер ғылыми ортада жаңашыл болып табылады және халықаралық рецензияланатын басылымдар мен конференциялар жинағында, сонымен қатар Thomson reuters базасына кіретін баспада 1 мақала, Scopus деректер қорына кіретін баспада 2 мақала жарияланған.
Достарыңызбен бөлісу: |