Түсінік – білімдерде сипатталған әлем элементтерінің жалпыланған қандай да бір класын бейнелейтін білімдер жүйесінің элементі.
Формалдау – формалданған теорияда мазмұнды білімді бейнелеу.
Шығару механизмі – шығару ережелерінің жиынтығы және осы ережелерді басқару стратегиясы.
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР
ББ
‑ Білімдер базасы
БҒСБК
– Білім және ғылым саласының бақылау комитеті.
ДБ
– деректер базасы
ДББЖ
– деректер базасын басқару жүйесі.
ДҚФ
– дұрыс құрылған формулалар
МТ
– морфологиялық талдау.
ҚР БҒМ
– Қазақстан білім және ғылым министрлігі.
СТ
– синтаксистік талдау.
СЖ
– семантикалық желі.
ТТ
– табиғи тіл
ЭЖ
– экспертті жүйе
NLP
– natural language processing
OWL
‑ Web Ontology Language
RDF
‑ Resource Description Framework
SPARQL
‑ Protocol and RDF Query Language
SPO
‑ Subject Predicate Object
КІРІСПЕ
Жұмыстың жалпы сипаттамасы. Диссертациялық жұмыс Жасанды интеллект (Artificial Intelligence) саласына, соның ішінде Табиғи тілді өңдеу (Natural Language Processing) бағытына қатысты қазақ тіліндегі білімдерді семантикалық өңдеудің мәселесін кешенді зерттеуге және шешуге арналған. Қойылған мәселені әртүрлі табиғи (ағылшын, орыс және басқа) тілдерде білімдерді өңдеуге қатысты ғылыми зерттеулерді талдай отырып, олардың негізінде қазақ тіліндегі білімдерді бейнелеу мен өңдеудің семантикалық моделдері, әдістері мен алгоритмдерін құру және оларды программалық жүзеге асыру арқылы шешілді.
Диссертациялық жұмыста алынған ғылыми нәтижелерді тәжірибелік жүзеге асыру үшін қазақ тілі бойынша берілген білімдерді бейнелеу және семантикалық өңдеу арқылы қазақ тілінде жазбаша диалог жүргізу мүмкіндігіне ие нақты уақыт (онлайн) режімінде мағыналық жауап беретін интеллектуалды сұрақ-жауап жүйесі әзірленді.
Зерттеу жұмысының өзектілігі.Қазақ тілі Қазақстан Республикасының мемлекеттік тілі ретінде елдің ішкі қарым-қатынасында ақпарат алмасу саласы [1] бойынша қарқынды дамуы керек. Сол себепті де халыққа қызмет көрсету салалары бойынша қажетті ақпаратты іздеп, пайдаланушыға онлайн режімінде жауап беретін сұрақ-жауап жүйесі қызмет атқаруы керек. Бірақ қолданыстағы ақпараттық іздеу жүйелерінде қажетті білімдерді іздеу мәтінде берілген білімнің семантикасын (мағынасын) есепке алмай, мәтіндегі кілттік сөздерді пайдалану арқылы жүзеге асырылады. Мұндай іздеулер қажетті нәтиже бермейді, себебі олар сұрақтағы сөздер арасындағы лингвистикалық және мағыналық өзара байланыстарды есепке алмайды. Сондықтан қажетті ақпаратты мағынасы бойынша іздеп, өңдеп және пайдаланушыға мағыналық жауап беретін интеллектуалды сұрақ-жауап жүйелері жүзеге асырылуы қажет. Олар интеллектуалды ақпаратты-анықтамалық жүйелердің қасиеттерін қамти отырып, онлайн режімінде табиғи тілдік интерфейстерді пайдаланады [2].
Кез-келген интеллектуалды жүйені жасау үшін алдымен берілген пәндік облыс білімдерін бейнелеп, оның семантикалық моделін тұрғызу керек. Білімдерді бейнелеудің ең кең таралған түрі, ол табиғи тілде берілген мәтіндер. Табиғи тіл адамдар арасында қарым- қатынас жасау тілі [3]. Білімдердің мәтіндік түрде берілуі адам үшін табиғи жағдай болып табылады және ондай білімдер жеңіл түрде қабылданады, таралады және дамиды. Кез-келген тілді оқып үйренудің негізі осы тілде жазылған мәтіннің мағынасын түсінуге және сол тілде өз ойын дұрыс жазуға, жеткізуге қажетті білімдердің болуын қажет етеді. Осындай білімдерді формалды тілдерде бейнелеп, өңдеу арқылы мағыналық жауап беру мүмкіндігіне ие интеллектуалды ақпараттық іздеу жүйелерін жүзеге асырып, оларды іске қосқаннан кейін олармен кез-келген уақытта және кез-келген жерде онлайн режімінде табиғи тілде қарым-қатынас жасау арқылы мағыналық жауап (ақпарат) алуға мүмкіндік туады.
Жоғарыда айтылған есептердің негізінде табиғи тілді моделдеу мәселесі жатыр. Тілді моделдеу мәселесі табиғи тілді машинаның өңдеуі мен түсіне алуына қатысты зерттеулердің ішінде ең негізгісі болып табылады. Бұл зерттеулердің негізі Хомский А.Н., Теньер Л., Миллер Д. [4], Люгер Дж., Журавской Д. еңбектерінен бастау алады. Қазіргі кезде мұндай зерттеулер IBM, Microsoft, Google сияқты ауқымды коорпорациялар лабораторияларында, Хорошевский В., Гаврилова Т., Сулейманов Д.Ш., Голенков В.В., Башмаков И.А., Ермаков А.Е., Тузов В.А., Апресян Ю.Д., Виноградов Д. В., Гладко A.B., Мельчук И.Д. секілді ғалымдар еңбектерінде жалғасын табуда. Сонымен қатар, зерттеу тақырыбы бағытына сәйкес келетін Тукеев У.А., Балова Т.Г., Рахимова Д.Р., Нугуманова, Макажанов А., Махамбетов О. сияқты қазақстандық ғалымдардың еңбектерін атап айтуға болады. Жоғарыда айтылғандардың барлығы диссертациялық жұмыстың тақырыбының дұрыс таңдалғандығын және оның өзектілігін дәлелдейді.