Диссертацияның құрылымы және көлемі. Диссертациялық жұмыс қазақ
тілінде жазылған, кіріспеден, өзара байланысты үш тараудан, қорытындыдан
және пайдаланылған әдебиеттер тізімінен тұрады.
Кіріспеде
диссертациялық
жұмыстың
өзектілігі
дәйектемеленеді,
мақсаттар, міндеттер, объектілер, зерттеу пәні мен тәсілдері тұжырымдалады,
алынған нәтижелердің ғылыми жаңалығы мен практикалық құндылығы
көрсетілген,
жұмысқа
ізденуші-докторанттың
қосқан
үлесі
сипатталған,
жұмыстың апробациясы және соған байланысты басылымдар туралы ақпарат
беріледі.
Бірінші бөлім ғылыми-білім беру қызметін қолдаудың ақпараттық жүйесін
құруға жарамды әдістемелік амалдар мен технологияларды талдауға арналған.
Ашық жүйелер құрылымы стандарттарына сәйкес құжаттың құрылымы мен
мазмұны халықаралық деректер схемаларына сай сипатталуы керек. Тезаурустар
дерек схемаларын салыстырмалы талдау нәтижесінде Zthes схемасының
артықшылығы көрсетілді.
Ғылыми-білім беру қызметі аясындағы пайдаланушылардың ақпараттық
мұқтаждықтарының
көрсетілген
талдауы,
соңғы
20
жыл
ішінде
бұл
мұқтаждықтардың сипаты айтарлықтай өзгеріске ұшырағанын көрсетті, атап
айтқанда, ғылыми қызметкерлердің электронды ақпараттық технологияларды
қолдана отырып барынша жылдам қанағаттандыру қажеттілігі туындады.
Ақпараттық мұқтаждықтарды жылдам қанағаттандыру мүмкіндігі ғылыми
ақпараттың интернетте пайда болуына, сондай-ақ, оның қайсыбір ақпараттық
жүйе каталогында тіркелуіне байланысты. Ғылыми-білім беру қызметі аясында
заманауи пайдаланушылардың ақпараттық мұқтаждықтарын қанағаттандыру
үшін ақпаратты іздеу мен классификациялаудың күрделі функцияларын қолдау,
сондай-ақ, ресурстарды категория (айдарлар) және сөздік-классификатор
бойынша қарау қажет.
Ғылыми-білім беру қызметін қолдаудың ақпараттық жүйесіне қойылатын
негізгі талаптар тұжырымдалды. Атап айтқанда, мұндай жүйе ақпаратты
жойылудан
сенімді
ұзақ
мерзімді
және
қорғанды
сақталуын
қолдауы;
ресурстарды сәйкестендіру мен классификациялауды қамтамасыз ету үшін үлкен
көлемді
сөздік-классификатор
енгізуі;
әлсіз
құрылымды
ақпараттық
ресурстарды; ақпараттық ресурстар арасындағы өзара байланысты қолдауы;
пайдаланушы сұраныстарын қамтамасыз етудің интеллектуалды қызметін,
сондай-ақ,
пайдаланушының
аналитикалық
жұмысын
қолдауға
арналған
бағдарламалық интерфейстер қосуы тиіс; интероперабелділік талаптарды
қанағаттандыруы және т.б.
Сандық репозиторийлер мен ғылыми-білім беру қызметін қолдаудың
ақпараттық жүйесіне арналған бар платформалар құрылымының технологиялық
талдауы нәтижесінде Dspace жүйесі таңдалды.
Құжаттарды классификациялаудың иерархиялық пен фасеттік амалдарына
салыстырмалы талдауы өткізілген және фасеттіктің артықшылығы көрсетілген.
Ғылыми қызметті ақпараттық қамтамасыз етуде көбірек қолданылатын кейбір
классификаторларға қысқа шолу жасалған. Осы классификаторлардың біреуі де
шағын пәндік салада жан-жақты классификациялау өткізуге арналмағаны
туралы тұжырым жасалған.
Мәтіндік құжатты өңдеудегі маңызды міндет ретінде, оларды шешпейінше
классификациялауды автоматтандыру мүмкін болмайтынын, сондай-ақ, олардан
ақпаратты алу координаттық индекстеу болатыны көрсетілді.
Координаттық
индекстеудің
негізгі
теориялық
негіздемелері
мен
принциптері сипатталған.
Кілттік терминдер
жиынтығын
құруды
автоматтандыру
процесінен
құралатын координатты индекстеу процесін автоматтандыруда, мәтін сөздерін
табиғи тілде сәйкестендіру, оларды қалыпты түрге келтіру мен тезаурустағы
кілттік терминдермен салыстыру міндеті туындайды. Ол морфологиялық
талдағышты қолданумен шешіледі, онда мәтін сөздерінің морфологиялық
белгілері беріледі және сөздердің қалыпты түрлері анықталады. Морфологиялық
талдау өткізуге арналған аспаптарға жүргізілген сараптау қазақ тілі сөздерін
қалыпты түрге келтіру алгоритмінің жүзеге асырылуын анықтаған жоқ және оны
жасау қажеттігін дәйектеді.
Екінші бөлім ғылыми-білім бері қызметінде қолдаудың ақпараттық
жүйесінің
концептуалды
моделін
сипаттауға
арналған.
Онда
модельде
қолданылатын негізгі болмыстар, сондай-ақ, олардың топтары мен ішкі топтары,
метадеректер мен қатынастардың типтері айқындалған және қарастырылған.
Модель құжаттың ғылыми ақпараттық кеңістіктің негізгі болмысы ретіндегі
ұғымына негізделеді, оған басылым, тұлға, ұйым, факт, кілттік термин және т.б.
болмыстар, сондай-ақ, олардың арасындағы байланыстар (қатынастар) да енеді.
Ақпараттық жүйе қызметінің функциялары мен түрлері, сондай-ақ, функцияның
жүзеге асуы – ресурс сәйкестендірілуі сипатталған.
Модель
пайдаланушының
келесі
қажеттіліктерін
қанағаттандырады:
ресурстардың
бір
мағыналы
сәйкестендірілуі,
құжаттар
арасындағы
байланыстар, ресурстар белгіленуінің қамтамасыз етілуі, жалпы жүйелік
пайдаланушылық талаптары.
Құжаттарды классификациялауды өткізу үшін олар іздеу сипатына сәйкес
вектор түрінде берілуі керек. Мәтіндерді вектор түрінде беру үшін координаттық
индекстеу тәсілі қолданылады. Құжаттың іздеу сипаты ретінде метадеректер
мәнінің
жиыны
қызмет
етеді.
Координаттық
индекстеу
процесінде
пайдаланылғаны жөн метадеректер тізімі құрылған. Тезаурусты жүзеге асыруға
таңдалған
Zthes
деректер
схемасы
кейбір
элементтерді
қосу жолымен
түрлендірілген.
Үшінші бөлімде ғылыми-білім беру қызметінде қолдаудың ақпараттық
жүйесін жүзеге асыру бағдарламасы сипатталған.
Жүйенің ақпараттық моделі көп деңгейлі болуы және кемінде екі
компоненттен: деректерді сақтаудың ішкі жүйесінен (сандық репозиторий) және
ақпараттық ресурстарды басқару сервистерінің ішкі жүйесінен тұруы керектігі
туралы түйін жасалды. Репозиторийлер деректерімен алмасу үшін пайдалануға
болатын OAI-PMH хаттамасы сипатталған.
Ақпараттық технологиялар бойынша орыс, ағылшын және қазақ тілі
терминдері бар үш тілді тезаурус жасалды. Тезаурусты пайдалану ғылыми-білім
беру қызметі саласындағы негізгі міндеттерін шешеді: бар ақпараттық
ресурстарды жүйелеу мен классификациялау, ресурстармен аналитикалық
жұмыс жүргізу мүмкіндігі мен әр жүйенің ішінде, сондай-ақ, сыртқы жүйелерде
де ресурстарды интеграциялауды қамтамасыз ету. Қазақ тілі сөздерін қалыпты
түрге келтірудің жаңа алгоритмі берілген.
Құжаттарды координаттық индекстеудің құжаттарға олардың іздеу белгісі
алгоритмі ұсынылған, кейін олар кластерлеу мен классификациялау міндеттерін
шешуге қолданылады.
Басылымдар мен айдарлар (тақырыптық) ұқсастық өлшемін атрибуттарды –
кілттік терминдерді (дескрипторларды) салыстыруға негізделген бекіту тәсілдері
жасалды және тестілеуден өткізілді. Осы ұқсастық өлшеміне негізделген
құжаттарды тақырыптық классификациялау алгоритмі берілді.
Диссертация қорытындысында негізгі теориялық және практикалық
нәтижелер мен түйіндер келтірілген.
Жалпы алғанда, ақпараттық технологиялардың дамуы, сондай-ақ ақпарат
беру және өңдеу технологиясы ғылыми-білім беру процесінің іс жүзінде барлық
кезеңдерін ұйымдастыруға түбегейлі жаңа мүмкіндіктер пайда болуына әкелді,
ол өз кезегінде, ғылыми қауымдастықтың ақпараттық қажеттіліктерін сапалы
өсуіне себеп болды.
Ғылыми
және
ғылыми-ұйымдастырушылық
ақпаратты
ұсынатын
құрылымды жасау маңызды мәселе болып қала береді. Себебі іс жүзінде
көптеген қарапайым пайдаланушылар, өз бетінше жай контексттік немесе
атрибуттық іздеуге қарағанда, күрделірек сұраныс құруда қиындыққа тап
болады, өйткені, ақпаратты ұсынудың базалық құрылымы мен интеллектуалды
жүйенің логикалық жүйесі алдын-ала қалыптастырылған ақпараттық сұраныстар
жиынына
жауап
беруі
қажет,
олар
осы
жүйе
негізінде
алатын,
пайдаланушылардың (олардың информатика саласындағы квалификациясына
қарамастан) ақпарат пен білімдегі негізгі ақпараттық
мұқтаждықтарын
қанағаттандыратындай жағдайда болар еді.
Ғылыми-білім
беру
қызметін
қолдаудың
ақпараттық
жүйесін
лингвистикалық қамсыздандыруды жасау мақсатында АТ-технология бойынша
ДҚ түріндегі PostgreSQL ДҚБЖ аясында көптілді тезаурус жасалды. Көп тілділік
тіл-компоненттерде ақпаратпен алмасу мәселесін шешуге мүмкіндік береді.
Тезаурус және сөздіктік мақала көмегімен пайдаланушыны қызықтыратын
таңдаулы, айтарлықтай шағын пәндік сала, сол сипатталатын пәндік саланың
негізгі ұғымдары мен олардың арасындағы байланыстар сипатталады. Әдетте
пәндік сала зерттелетін оқу курсы немесе курстың нақты тақырыбымен ғана
шектеледі. Ғылыми-білім беру қызметін қолдау ақпараттық жүйесіндегі
мамандандырылған көптілді тезаурустарды жасау мен пайдалану сөзсіз
қызығушылық тудырады және жүйені мүлде басқа сападағы топқа ауыстырады.
Үлестірілген ақпараттық жүйелер құру кезінде, үлестірілген ақпараттық
ресурстарға (топтамалар, дерек қорлар және т.б) қолжетімділік технологиясына
«клиент-сервер» технологиясындағы тезаурустарға бірыңғай ANSI/NISO Z39.50
стандартын пайдалана отырып, қолжетімділікті қамтамасыз еткені қисынды.
Стандартты
Z39.50 хаттамасымен сүйемелденетін Zthes деректер схемасын
пайдалану,
тезаурус
түрлі
дерек
қорларының
жеке
құрылымдық
айырмашылықтарын жасыруға және соңғыларын туындатпай бірыңғай
интерфейс қамтамасыз етуге мүмкіндік береді.
Классикалық Zthes
схемасы
үш
өріс:
Достарыңызбен бөлісу: |