Мадина аралбаевна самбетбаеваның 6D070300 – Ақпараттық жүйелер мамандығы бойынша философия докторы (PhD) дәрежесін алу үшін дайындаған

жүктеу/скачать 277,18 Kb.

Pdf көрінісі

бет	1/37
Дата	31.12.2021
өлшемі	277,18 Kb.
	#22945
түрі	Диссертация

1 2 3 4 5 6 7 8 9 ... 37

Байланысты:
sam-ann

«Ғылыми-білім беру қызметін қолдауға арналған ақпараттық жүйе үшін ақпараттық технологиялар бойынша қазақ тілі морфологиясын ескере

МАДИНА АРАЛБАЕВНА САМБЕТБАЕВАНЫҢ

6D070300 – Ақпараттық жүйелер мамандығы бойынша философия

докторы (PhD) дәрежесін алу үшін дайындаған

«Ғылыми-білім беру қызметін қолдауға арналған ақпараттық жүйе үшін

ақпараттық технологиялар бойынша қазақ тілі морфологиясын ескере

отырып көптілді тезаурус жасау» тақырыбындағы PhD диссертациясына

АҢДАТПА

Зерттеу тақырыбының өзектілігі. Ақпараттық технологиялардың дамуы,

сондай-ақ ақпарат беру және жасау технологиясы ғылыми-білім беру процесінің

іс жүзінде барлық кезеңдерін ұйымдастыруға түбегейлі жаңа мүмкіндіктер пайда

болуына әкелді, ол өз кезегінде, ғылыми қауымдастықтың ақпараттық

қажеттіліктерін сапалы өсуіне себеп болды. Күнделікті ғаламтордың барлық

мүмкіндіктерін пайдаланушы, компьютермен жабдықталған қазіргі заманғы

ғылыми-білім беру саласындағы қолданушылар кәдімгі форматтағы оқу

материалдары, оқулықтар немесе құрылымдалмаған мәтіндік файлдарды және

оқу

үрдісінің

дәстүрлі

әдістерін

қанағат

тұтпайды.

Қазіргі

кезде

оқу

материалдары оқып-үйренушілерге сандық формат түрінде берілуі мүмкін, олар

іздеу және әртүрлі классификациялау қызметтерін қолдауы тиіс. Зерттеудің

өзекті мәселелерін атап айтатын болсақ:

‒ қазіргі кезде ақпараттық ресурстардың едәуір бөлігі сандық түрге

көшірілгеніне қарамастан, олар әлі күнге дейін жеткілікті жүйелендірілмеген

және құрылымдалмаған, сондықтан ақпараттық ресурстарды классификациялау

мен жүйелендіру ғылыми-білім беру үрдісін жеңілдете алады.

‒ білімнің пәндік саласындағы ұғымдық аппараттар толық жүйеленбеген.

Мамандандырылған тезаурустарды жасаудың басты мәселесі көп еңбекті,

интеллектуалды және уақыттық ресурстарды қажет етеді.

‒ пайдаланушылардың ақпараттық қажеттіліктерін қанағаттандыру үшін

ақпаратты іздеу және классификациялаудың таңдамалы функциясын қолдау

қажет, сонымен қатар ресурстарды категориялары (айдарлар) және сөздіктер-

классификаторлары бойынша қарап шығу қажеттілігі.

‒ іздеу және классификациялау үрдісін бірмезетте бірнеше тілдермен

қолдау қажеттілігі.

Ресурстар жүйесінің (тақырыптық классификациялау) есебі ең маңызды

есеп болып табылады, оны шешу үшін пайдаланушыны қызықтыратын

таңдалған тар пәндік облысты жабатын, кілттік терминдерді (ұғымдар) және

логикалық-семантикалық категорияларды (фасеттерді) нақты анықтап алу

қажет.

Ғылыми процесс кезінде, әсіресе білім беру қызметінде әр түрлі

материалдар

мен

құжаттарды:

қойылған

есепке

сәйкес

құжаттарды

классификациялау, жүйелеу мен қажетті құжаттарды іздеуде және әдебиет

көздерімен жұмыс істеу барысында көп уақыт пен күш қуат кетеді.

Қазіргі уақытта ғылыми зерттеулерді қолдауға бейімделген едәуір қуатты

ақпараттық жүйелер бар. Олардың ішінде, фактографиялыққа жақын ақпараттық

жүйелерді атап кетуге болады, мысалы, РҒА БҒАК (Ресей ғылым академиясы

Бірыңғай ғылыми ақпараттық кеңістігі), РҒА СБ АРКЖ – (РҒА СБ ақпараттық

ресурстарының кіріктірілген жүйесі), «euroCRIS» және құжаттық, мысалы,

«eLibrary», «Информика», «MathNET». Осы және басқа деңгейдегі аталған

жүйелер

ақпараттағы

ғылыми-зерттеу

қауымдастығының

ақпараттық

қажеттілігін

қанағаттандырады,

дегенмен

олардың

әрқайсысының

функционалдық кемшіліктері болады.

Жүйелердің

көпшілігінде

әр жүйенің

ішінде, сондай-ақ,

сыртқы

жүйелермен де ресурстардың интеграциясын қамтамасыз ету ресурстарымен

талдау жұмысын өткізуде мүмкіндіктерінің шектеулі болғандығы негізгі

кемшілігі болып табылады (халықаралық стандарттар және нұсқаулар, төмен

интероперабельдік жиі ескерілмейді). Бұл ғылыми-білім беру саласында өте

қолайсыз, негізгі басты міндеттердің бірі ол, нақты ғылыми фактілер (мысалы

«кибернетика термині нені білдіреді» немесе «берілген мақаланың авторы кім»)

және ақпараттық жүйенің маңыздылығы (тұлғалар, фактілер, құжаттар,

басылымдар және т.б.) арасындағы байланысты орнату болып табылады.

Ақпаратты жүйелеудегі стандартты тәсіл таксономиялардың көмегімен

құжаттарды классификациялау болып табылады. Таксономия – бұл иерархиялық

құрылымдық түрде оларды реттейтін (сөздіктер) және басқарылатын сөздік

(тезаурус) түрінде терминдерді топтайтын пәндік классификациялау. Қандай да

бір пәндік саланы сипаттау үшін әдетте қызметтік терминдердің нақты бір

жиынтығы пайдаланылады, олардың әрқайсысы берілген пәндік саладан қандай

да бір ұғымды сипаттайды немесе белгілейді. Ұғымдарды бөліп алу (кілттік

терминдер), бөліп алынған ұғым құжаттарын талдау кезіндегі салыстыру мен

олардың арасындағы парадигмалық қатынастарды (мысалы, аталық-ұрпақ түрі)

қою классификациялаудың негізін құрайды.

Ақпараттық ғылыми-білім беру жүйесін қамтамасыз етуде ең қолайсыз

жағдай соңғы жүз жыл бойы кітапханаларда өңделген ақпараттар жүйесі және

классификациялау

технологиялары

классификацияланатын

құжаттардың

тақырыптық жақындықтары салдарынан біржақты пәндік салаларда жұмыс

істемейді. Мысалы, математика немесе информатика бойынша ресурстарды

классификациялауға арналған ең қолайлы сөздіктер ӘОЖ және «MSC2000»

немесе «ЮНЕСКО» тезаурусы, ереже бойынша бір категорияға, нақты оқу курсы

үшін таңдап алынған барлық ресурстар жатады.

Мамандандырылған тезаурустарды жасау пәндік саладағы (бұл жағдайда

информатика) ұғымдық аппаратты жүйелеу және даму сияқты өз бетінше өзекті,

сонымен қатар Интернетте құжаттарды классификациялау және жүйелеу,

адекваттық автоматтық индекстеу және іздестіру ұйғарымдарды тұжырымдау,

іздестіру қажеттіліктерді қалыптастыру ортасы, ақпараттарды толық мәтінді

деректер қорында логикалық іздеу де өзекті болып табылады.

Тезаурусты құрудың басты мәселесі еңбек сыйымдылығы мен қолмен

құрудың жоғары құнында, оны құру үрдісіндегі төмен икемділікте болып

табылады. Қолмен индекстеудің т

езаурустарда ұқсас ұғымдардың жиынтығы бір

ұғымға, яғни, индекстеудің субъективтілігін төмендетуге арналған ең толымды

ұғымға келтіріледі. Автоматтандырылған тезаурустарда синонимдер қатарын

іздеу кезінде пайдалануға мүмкіндік беретін семантикалық жақын ұғымдар

дискретті

бірлік

ретінде

ұсынылған.

Индекстелетін

ақпараттың

барлық

тақырыптық әртүрлілігіне сәйкес келетін тезаурусты құрудың күрделілігі қазіргі

заманғы ақпараттық жүйелерде оның танымал еместігі негізгі себеп болып

табылады. Бірақ, егер қандай да бір білім беруде ақпараттық жүйелердің

нәтижелілігі туралы сұрақты қарастыратын болсақ, онда мұндай жүйедегі

мамандандырылған тезаурустарды құру және пайдалану анық қызығушылықты

және жүйені мүлдем басқа сапалы топ түрінде ұсынады.

Қазақстан және Ресей Федерациясы сияқты елдердің ғылыми-білім беру

қызметін қолдау үшін ақпараттық жүйені құру кезіндегі қосымша ерекшеліктер

бір уақыттағы бірнеше тілдердегі іздестіру және классификациялау процестерін

қолдау қажеттілігі болып табылады: Қазақстан үшін – кемінде үш (қазақша,

орысша және ағылшынша) тілде, Ресей үшін, негізінен, екі тілде (орысша және

ағылшынша). Демек, көптілді тезаурус арқылы берілетін не интеграцияланған

кеңістікте, эквивалентті қатынастарды орнатуға болатын элементтер арасындағы

әр түрлі үш тілді кеңістікте сәйкес келетін тілдерде индекстелуі керек.

Белгілер кеңістіктердің элементтері құжатта әртүрлі сөзжасамдар түрінде

ұсынылуы мүмкін, сондықтан құжаттарды индекстеу кезінде нақты тілдің

морфологиясын ескеру маңызды мәселе болып табылатынын атап өткен жөн.

Құжаттарды классификациялау жүйесін бір уақытта орысша, ағылшынша

және қазақша құру әрекеттері авторға беймәлім.

Жоғарыда айтылғандар ғылым саласының дамуына елеулі үлес қосатын, өте

маңызды міндет,

ақпараттық

технологиялар

үшін

көптілді

тезаурусты

пайдаланатын, зерттеушілердің ақпараттық қажеттіліктерін қанағаттандыратын,

таңдамалы іздеу механизмдермен жабдықталған ғылыми-білім беру қызметін

қолдау үшін ақпараттық жүйені құруды бекітуге негіз бола алады және өзекті.

Бұл зерттеудің ұлттық және халықаралық деңгейдегі маңыздылығы өте

жоғары, себебі зерттеудің

тақырыбы

өзекті және мәтінді талдауды

авоматтандыру бағыты бойынша түркі тілдеріне арналған мамандандырылған

лексикографикалық ресурстарды әзірлеуге теориялық және тәжірибелік үлес

қосады.

жүктеу/скачать 277,18 Kb.

Достарыңызбен бөлісу:

1 2 3 4 5 6 7 8 9 ... 37