4.1-кесте Тезаурусты құру реті
Топтастыру бірліктін атауы Операциялар Бастапқы мәтін немесе бастапқы мәтіннің
фрагменті
Кілттік сӛздерді іздеу (мәтінде белгілеу)
Нормативті сӛздік
Кілттік сӛздерді бірыңғай морфологиялық нысанға және
жазуға келтіру. Синонимия мен полисемияны еске алу,
мысалы, кӛпір (құрылыс), кӛпір (жүріс бӛлігі)
Дескрипторлы сӛздік
Жақын кілттік сӛздерден класс құрылады, қорытылған
есім тандап алынады (дескриптор)
Нормативті анықтамалық-сӛздік (ақпараттық
іздестіру тезаурус)
Тақырып-заттық саласы туралы мәліметтермен
дескрипторлы сӛздікті толтыру
Ақпараттық іздестіру тезаурус құжаттарды және ақпараттық
сұраныстарды координаталы индексациялау үшін арналған, оларда әліпби
ретімен бар дескрипторлар және оған синонимды кілттік сӛздер келтірілген,
және де дескриптор арасындағы ең маңызды қатынастар кӛрсетілген.
Функцияға байланысты лексикалық жағынан тезаурус бірліктері дескриптор
мен шартты синонимға бӛлінеді.
Дескриптор – шартты баламалылық класты белгілейтін бірмәнді
кілттік сӛз немесе код, оған баламалы сӛздер және оларға мағынасы бойынша
жақын сӛздер қосылған. Тезаурустың элементарлы құрылымдық бірлігі –
сӛздік мақала.
Мысал . Есептеуіш машиналар:
компьютерлер, ЭЕМ, есептеуіш кешендер
дербес, үлкен ЭЕМ, кіші ЭЕМ, супер-ЭЕМ
есептеу техникасы, есептеуіш техника, инженерлік есептеу теориясы
есептер, Интернет, ойындар, экономика
.
Осында тезаурус
d i
M 1
,
M 2
,
M 3
,
M 4
,
мұндағы
d i
– бас дескриптор;
M 1
– әліпби бойынша реттелген берілген бас дескриптордың шартты
синонимдар кӛптігі, онымен бірге шартты баламалылық класты жасайды;
M 2
– реттелген дескрипторлар кӛптігі, олардың әрбіреуі тегі-түрі бас
қатынаспен байланысқан;
M 3
– реттелген дескрипторлар кӛптігі, олардың әрбіреуі түрі-тегі бас
қатынаспен байланысқан;
M 4
– реттелген дескрипторлар кӛптігі, олардың әрбіреуі бүтін-бӛлік, бӛлік-
бүтін, себеп-салдар және т.б. бас қатынаспен байланысқан.
Топтастыру қиыншылықтардың себебі объективті болады. Қоршаған
әлем күрделі, оның ішінде қатты шекаралар және айқын шектелген кластар
жоқ. Жаппай құбылмалық суретті күрделендіреді.
34
Қатты суреттелген шекараны бӛліп кӛрсету кезіндегі проблемаларды
шешетін ғылым таксономия деп аталады. Бұйымды бір мәнді топтастыруға
қиын болған жағдайда, оны сандар арқылы бағаланған белгілер жиынтығы
бойынша кейбір класқа жатқызады. Бұл жағдайда сандық таксономия туралы
айтады.