44
анықтауға мүмкіндік беретін сыныптама объектісінің қасиеті
немесе сипаттамасы.
Жіктеу топтастыру – сыныптама объектілерінің бөлігін бір
немесе бірнеше белгілері бойынша біріктіретін жиынтық
немесе қосалқы жиынтық.
Қазіргі
уақытта
сыныптама
жүйелерінің
екі
түрін
қолданады: иерархиялық және көп аспектілі. Бұл жүйелер
жіктеу
белгілерін
қолданудың
әртүрлі
стратегиясымен
ажыратылады.
Ақпаратты
жіктеудің иерархиялық жүйесі мына түрде
құрылған:
1. Элементтердің
бастапқы жиынтығы нөлдік деңгейді
құрайды және таңдалған жіктеу белгісіне байланысты бірінші
деңгейді құратын сыныптарға бөлінеді.
2. Бірінші деңгейдің әр сыныбы
оған тән жіктеу белгісіне
сәйкес қосалқы сыныптарға бөлінеді, олар екінші деңгейді
құрады.
3. Екінші деңгейдің әр сыныбы үшінші деңгейді құратын
топтарға бөлінеді және т.с.с.
Жіктеудің иерархиялық жүйесінің жақсы жағы – құрудың
жеңілдігі; иерархиялық құрылымның әртүрлі тармақтарында
тәуелсіз жіктеу белгілерін пайдалану.
Жіктеудің
иерархиялық
жүйесінің
кемшіліктері
–
өзгерістерді енгізудің күрделілігіне әкелетін қатаң құрылымы,
өйткені барлық жіктеу топтастыруды қайта бөлуге тура келеді;
алдын ала көзделмеген белгілер
бойынша объектілерді
топтастырудың мүмкін еместігі.
Көп аспектілі жүйе (фасеттік және дескрипторлық) — бұл
жіктеу
негіздемесі
ретінде бірнеше тәуелсіз белгілерді
(аспектілерді) қатарлас пайдаланатын жүйе.
Ақпаратты
жіктеудің фасеттік жүйесі объектілердің
жиынтығын жіктеудің белгілі бір аспектісі –фасет бойынша
тәуелсіз жіктеу топтастыруға қатарлас бөлу болып табылады.
Мысалы, фильмдерді мына топтарға сәйкес жіктеуге болады –
түрі (деректі, ойын, анимациялық); жанры (боевик, комедия,
романтика, фэнтези); ұзақтығы; жылы; елі; режиссері; басқа
параметрлер (үнсіз, үнді, түрлі-түсті, қара-ақ және т.с.с.).
Осылайша, әр фильм белгілердің жиынтығына ие. Қажетті
фильмді іздеген кезде талап етілетін
атрибуттардың қиысуы
пайдаланылады.
Осы жіктеу жүйесі (иерархиялық жүйеден айырмасы) жіктеу
белгілерін
бір-бірінен,
сондай-ақ
жіктелетін
объектінің
семантикалық құрамынан тәуелсіз таңдауға мүмкіндік береді.
Жіктеудің фасеттік жүйесін құрған кезде әртүрлі фасетте
пайдаланылатын мәндердің қайталанбауы қажет.
45
Жіктеудің фасеттік жүйесінің жақсы жақтары – бар
топтастырудың құрылымын өзгертпей сыйымдылығы үлкен
сыныптаманы құру мүмкіндігі; бар топтастырудың құрылымын
өзгертпей сыныптаманың барлық жүйесін оңай түрлендіру
мүмкіндігі.
Жіктеудің фасеттік жүйесінің кемшілігі – оны құрудың
күрделілігі (жіктеу белгілерінің барлық алуан түрлілігін ескеру
қажет).
Ақпаратты
іздеуді
ұйымдастыру
үшін,
тезарустарды
(сөздіктерді) жүргізу үшін
жіктеудің дескрипторлық жүйесі
тиімді пайдаланылады, оның тілі ақпараттық объектілердің
табиғи тіліне жақын. Дескрипторлық әдістің мәні мынада.
1. Белгілі бір пән саласын немесе
біртекті объектілердің
жиынтығын сипаттайтын негізгі сөздер (дескрипторлар) немесе
сөз тіркестері жиынтығын іріктейді.
2. Таңдалған
негізгі
сөздер
мен
сөз
тіркестерін
қалыптандыруға
ұшыратады,
яғни
синонимдердің
жиынтығынан бір немесе бірнеше ең жиі қолданылатынын
таңдайды.
3. Дескрипторлар
сөздігін, яғни қалыптандыру рәсімінің
нәтижесінде іріктелген өзекті сөздер мен сөз тіркестері сөздігін
жасайды.
Дескрипторлар арасында байланыстар орнатылады, олар
ақпаратты
іздеу
саласын
кеңейтуге
мүмкіндік
береді.
Байланыстар үш түрлі болуы мүмкін:
— синонимдік, өзекті сөздердің
синонимдер ретінде біршама
жиынтығын көрсетеді («студент – оқушы- оқытылатын»);
— тек түріндегі, объектілердің кейбір сыныбын бұдан
толымды сыныпқа енгізуді көрсетеді («университет – факультет
– кафедра»);
— ассоциациялық, ортақ қасиеттерге ие дескрипторларды
біріктіреді («студент –емтихан- профессор – дәрісхана»).
Сыныптауышты әзірлеу кезінде шешуге тура келетін ең
күрделі мәселе болып жіктеу және кодтау әдістерін таңдау және
жіктеу белгілері жүйесін таңдау табылады. Сыныптауыштың
негізі оның көмегімен шешілетін міндеттердің сипатына сәйкес
келетін жіктеудің елеулі белгілері болуы тиіс.
Бұл ретте осы
белгілер бағынысты немесе бағынысты емес болуы мүмкін.
Жіктеудің бағынысты белгілері мен сыныптауыш шешуі үшін
арналған міндеттердің тұрақты кешені кезінде объектілердің
жиынтығын бағынысты жіктеу топтастыруға рет-ретімен
бөлетін жіктеудің иерархиялық әдісін пайдаланған жөн.
Жіктеудің
бағынысты
емес
белгілері
мен
шешілетін
46
міндеттердің үлкен серпінділігі кезінде жіктеудің фасеттік
әдісін пайдаланған жөн.
Достарыңызбен бөлісу: