Cұрақ-жауап жүйесінің архитектурасы
Сұрақ-жауап жүйелерінде пайдаланушының табиғи тілде келіп түскен сұрағын мағынасына қарай өңдеп, оған мағыналы жауап қайтаруға арналған жүйе болғандықтан, онда табиғи тілді өңдеу технологиялары қолданылады [157]. Кез келген сұрақ-жауап жүйелеріне ең алдымен табиғи тілде құрылған сұрақ мәтін түрінде келіп түседі. Содан кейін кірген сұрақ өңделіп, іздеу жүзеге асырылады және жауап беріледі. 21 суретте сұрақ – жауап жүйесінің архитектурасы [158] бейнеленген.
21 сурет – Сұрақ -жауап жүйесінің архитектурасы
Келіп түскен сұрақтың мағынасын түсіну үшін компьютер алдымен мәтінді табиғи тілдік өңдеуден өткізуі қажет. Табиғи тілді өңдеу графематикалық, морфологиялық, синтаксистік және семантикалық талдаудан тұрады.
Графематикалық талдау морфологиялық талдау алдындағы дайындық деңгейі болып табылады. Мәтін элементтерін сөзге, бос орынға, тыныс белгілеріне бөледі. Мәтіннің қанша сөз, сйлемнен тұратынын анықтайды.
Морфологиялық талдау кірген мәтіннің әрбір сөзпішімінің мүмкін болатын грамматикалық мінездемелері (септік, сапалық, есептік, сөз табы т.б.) нұсқаларын анықтау.
Синтаксистік талдау сөзпшімдер арасындағы синтаксистік байланыстарды анықтайды, мәтіннің синтаксистік құрылымын құрайды.
Семантикалық талдау мәтіннің синтаксистік құрылымын онтология түсінігі мен қатынастарына сәйкестендіру.
Білімдер базасы, жауапты тудыру. Пәндік облыс бойынша онтологиядан сұратым бойынша логикалық ережелерді пайдалана отырып, формалданған сұраққа жауап іздеу.
Алынған жауап. Жауаптың пәндік облысқа қатыстығын тексеру.
Жауап. Қолданушы сұрағына табиғи тілде жауап беру
Білімдер базасын құру
Пайдаланушы мен машина арасында табиғи тілде байланыс орнату үшін интеллектуалды жүйенің берілген пәндік облыс бойынша қандай сұрақтарға жауап беретіндігі немесе қандай мәліметтерді өңдей алу мүмкіндігіне ие болу керектігін анықтау қажет. Ол үшін алдымен берілген пәндік облыстың білімдер базасын құру қажет. Білімдер базасы ретінде пәндік облыс онтологиясын аламыз.
Пәндік облыс онтологиясын құру үшін
Берілген пәндік облысқа талдау жасау қажет. Пәндік облысқа талдау жасау деңгейі келесілерден тұрады:
- Пәндік облыс бойынша білімдерді жүйелі түрде бейнелеуді жүзеге асыру, онда болатын үрдістерді жалпы сипаттау, ережелер мен шектеулерді түсіну;
- Пәндік облыстың негізгі түсініктері (терминдері) глоссарийін құру. Олардың анықтамаларын көрсету;
- Пәндік облысқа талдау жасау кезіндегі негізгі принциптер: түпкі мақсатын, түсініктер байланысын, иерархиясын, дамуын анықтау. Сонымен қатар, бұл деңгейде құрылатын онтологияға қойылатын шарттар да анықталады.
Пәндік облыстың онтологиялық сипаттамасы бөліктерін құру
Кез-келген пәндік облыс онтологиясын құру үшін сол пәндік облыстың түсініктері қажет. Әр түсініктің көлемі мен мазмұны бар. Әр түсініктің бір немесе бірнеше аты бар. Барлық түсініктер семантикалық тәуелділікке байланысты бірнеше класстарға бөлінеді:
- түрге қатысты;
- бүтін және бөлік;
- бірлік және жалпылық;
- нақты немесе абстракті болуы;
Пәндік облыс онтологиясы шын әлемнің концептуалды моделі, сондықтан да ондағы түсініктер шындықты сипаттай алуы қажет. Ол үшін түсініктер (Х) жиынын, олардың арасындағы қарым-қатынас (R) пен интерпретация функцияларының ақырғы жиынын (F) анықтау қажет.
Х жиынын анықтау. Пәндік облыс онтологиясын құру кезінде ең маңызды рөл атқарады. Ол бос жиын болмауы қажет. Пәндік облыс терминдері анықталады, олардың нақты түсінік пе әлде класс-түсінік екендігі көрсетіліп, басқа терминдермен мүмкін болатын қатынастары көрсетіледі. Семантикалық тәуелділігіне байланысты орналастырылады.
R жиынын анықтау. Пәндік облыс түсініктері арасындағы қарым-қатынастарды анықтайды.
F жиынын анықтау. Пәндік облыстың негізгі терминдері глоссарийін құру.
Пәндік облыс онтологиясын графикалық жобалау және формалды сипаттамасын құру. Алдыңғы деңгейлер бойынша анықталған жиындар негізінде пәндік облыстың концептуалды моделі құрылады. Ол үшін Protégé онтологиялық редакторы қолданылды. Содан кейін құрылған онтологияның формалды сипаттамасын онтология білімдерін бейнелеу тілінде (біздің жағдайымызда OWL) аламыз және онтографтың графикалық бейнеленуін көреміз.
Пәндік облыс онтологиясын құру алгоритмінің блок схемасы 22 суретте көрсетілген.
22 сурет – Пәндік облыс онтологиясын құру алгоритмінің блок схемасы
Енді қазақ тілі грамматикасы онтологиясын жоғарыда көрсетілген пәндік облыс онтологиясын құру алгоритмі бойынша жасайық. Сонда:
Қазақ тілі грамматикасы бойынша жүйе табиғи тілде төменде берілген сұрақтарды өңдеп, оларға білімдер базасындағы білімдер [159] арқылы жауап беруі қажет.
Сұрақтар түрі:
1. Сөз табы дегеніміз не?
2. Зат есім деген не?
3. Сын есімнің анықтамасы?
4. Сан есімнің мағыналық түрлерін атаңыз?
5. Зат есім көптеледі ме? деген сияқты сұрақтар.
Қойылатын сұрақтарға жауаптар тізімі:
Зат есім деген не? Зат есім – заттық ұғымды білдіретін сөз табы. Кім? Не? Деген сұрақтарға жауап береді. Сөйлемде бастауыш қызметін атқарады.
Зат есімнің мағыналық түрлерін атаңыз? Зат есімнің мағыналық түрлері: жалқы зат есім, жалпы зат есім, деректі зат есім, дерексіз зат есім, жанды зат есім, жансыз зат есім және т.б.
Енді қазақ тілі грамматикасы бойынша білімдер базасын құру үшін қажетті түсініктер мен олардың арасындағы қарым-қатынасты және олардың иерархиясын анықтау қажет. Мысал үшін, грамматика, морфология, сөз табы, сөз, зат есім, жалқы, жалпы, деректі, көптік жалғау, септік жалғау, көптік категориясы, шақ, шырай және т.б. Пәндік облыстың түсініктері мен олардың арасындағы байланысты, иерархиясын анықтау үшін псевдотабиғи тілде жазып аламыз. Мысалы:
грамматика
бөлінеді:
- морфология;
- синтаксис.
зат есім:
зе;
барлық зат есімдердің жиынтығы;
қазақ тілі морфологиясы;
сөз табы.
зат есім
бөлінеді (мағынасына қарай):
- жанды зат есім;
- жансыз зат есім;
- жалқы зат есім;
- жалпы зат есім;
- деректі зат есім;
- дерексіз зат есім.
зат есім
септеледі;
- септік жалғау;
- көптік категориясы:
көптелген зат есім және т.б.
Қазақ тілі грамматикасы пәндік облысы онтологиялық сипаттамасы бөліктерін құру.
Х жиынын анықтау. {грамматика, морфология, синтаксис, сөз табы, зат есім, жалқы, жалпы, жалғау, септік жалғау және т.б}.
R жиынын анықтау. Морфология мен синтаксис грамматиканың ішкі класы, зат есім сөз табының ішкі класы, жалқы зат есім зат есімнің нақты түрі деген сияқты қатынастар анықталады {жиын-элемент, түрі, септеледі, бөлінеді, болып табылады және т.б.}
F жиынын анықтау. Грамматика, морфология, сөз табы, сөз, зат есім, жалқы, жалпы, деректі, көптік жалғау, септік жалғау, көптік категориясы, шақ, шырай және т.б
Қазақ тілі грамматикасы пәндік облысы онтологиясын графикалық жобалау және формалды сипаттамасын құру. Алдыңғы деңгейлер бойынша анықталған жиындар негізінде қазақ тілі грамматикасы облыстың концептуалды моделі құрылды. Ол үшін Protégé онтологиялық редакторы қолданылды. Пәндік облыс онтологиясының OWL тіліндегі сипаттамасынан үзінділер В Қосымшасында келтірілген. 23 суретте қазақ тілі грамматикасы онтологиясының бөлігі көрсетілген.
23 сурет – Қазақ тілі грамматикасы пәндік облысы онтологиясының
бір бөлігі
Достарыңызбен бөлісу: |