Оқулық Қазақстан Республикасы Білім және ғылым министрлігі бекіткен Алматы, 2011



Pdf көрінісі
бет18/76
Дата15.11.2023
өлшемі2,02 Mb.
#122505
түріОқулық
1   ...   14   15   16   17   18   19   20   21   ...   76
4.6-сурет
. Иерархиялық топтастыру 
Осылай, мысалы, иттерді тектер бойынша топтастыру кезінде ит 
ұғымын колли, дог және овчаркаларға бӛлу дұрыс емес. Егер біз барлық 
колли, дог және овчаркаларды бірге жинасақ, «иттер» деген класс 
алалмаймыз. 
Қанша тектер тізімін толтыра бермесек, бәрі бір кейбіреулерін 
жоғалтамыз. Дұрыс вариант: иттер – бұл «догтар және «догтар емес»», 
«догтар емес» - бұл «овчаркалар және «овчаркалар емес»» және т.б. 
Иерархиялық топтастыру кӛптеген салаларда қолданылады. Компьютер 
болмаған кезде, ол есепке алу мен жүйелеудің негізі болып табылатын 
(мысалы, биологияда, 
4.7-сурет
). Жануарлардың әртүрлілігін жүйелеу 
зерттейді. Оның басты міндеті – жануарларды топтар (жіктеу) бойынша 
үлестіру. Топтастырудың негізгі бірлігі – жануарлар түрі.


32 
4.7-сурет
. Ч.Дарвин бойынша жануарлардың топтастыру фрагменті 
Автоматтандырылған 
жүйелерде 
қазір 
тезаурустар 
кӛптен 
қолданылады (
4.1- кесте
) және фасетты жіктеулер (
4.8-сурет
).
4.8-сурет.
Фасетты жіктеу 
Иерархиялық топтастыру жүйенің негізгі артықшылығы – үлкен 
ақпараттық кӛлем және іздестірудің оңайлығы (қолмен іздеу мүмкіндігі). 
Кемшіліктері – құрылым иілгішінің аз болуы, түрлі белгілердің еркін үйлесуі 
бойынша объектілерді агрегаттауға мүмкін емес.
Алфавит-заттық топтастыру
– бұл алфавит ретінде орналасқан 
(телефон анықтамалығы) кластар жүйесі (олардың әрбіреуі заттың немесе 
фактілердің бір түріне сәйкес). Осындай жіктеудің мысалы ағылшын-қазақ 
сӛздігі. Сӛздер алфавит ретіне сәйкес қатаң орналасқан.
Кейде басқа принцип ыңғайлы – әртүрлі әріпке басталатын, бірақ бір 
жағдайға немесе затқа қатысатын барлық сӛздерді қатар қою. Мысалы, 
«полиция», «аурухана», «сақтандыру» сӛздерді «авария» бӛліміне 
орналастыру орынды. Бұл жағдайда заттық жіктеумен жұмыс істейміз.
Тезаурус
– құжаттың немесе ақпараттық сұраныстың орталық нүктесі 
(тақырып). Әдетте, қарапайым кластар есімі болып табылатың, табиғи тілдің 
кейбір қарапайым сӛздердің және сӛз тіркестерінің тізбегі түрінде 
кӛрсетіледі. Осындай сӛздер – 
n
-ӛлшемді тақырып-заттық кеңістігіндегі 
құжат координаталары. Құжаттық немесе ақпараттық сұраныстың 


33 
координаталы индексациялау үшін толық мәнді (қызметтік емес) сӛздер 
пайдалану мүмкін, олар тікелей индексацияланатың мәтіндерден алынады. 
Осындай сӛздер мен тіркелер – кілтті болады. Тезаурусты құру процесі 
4.1- 
кестеде
келтірілген. 


Достарыңызбен бөлісу:
1   ...   14   15   16   17   18   19   20   21   ...   76




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет