Кластерлер
саны
өскен
сайын
олардың
әрқайсысының мүшелері бір-біріне көбірек ұқсайды,
бірақ көрші кластерлер бір-бірінен аз ерекшеленеді.
Шектен
шыққан жағдайға келтірсе, онда әрбір
деректер элементі жеке кластерде болады, бұл
пайдалы ақпарат бермейді.
Сондықтан ымыраға келу керек.
Кластерлер нақты
айырмашылықтарды сақтай отырып, кластерлердің
саны
бизнес-шешімдер
үшін
маңызды
заңдылықтарды
анықтауға
мүмкіндік
беретін
жеткілікті үлкен болуы керек. Кластерлердің
оңтайлы санын анықтаудың бір әдісі-шөгінді графигі
(график каменистой осыпи)
немесе Кеттель графигі
(scree plot) (сурет. 2).
Иілу (излом) - бұл кластер ішілік әртүрлілікті
дұрыс кластерлердің
оңтайлы санын ұсынатын
шөгінді графигіндегі күрт иілуі. 2 суретте 1
суреттегі екі кластерге сәйкес келетін екі иілуді
көруге болады. 3-ке сәйкес тағы бір кішірек
қисық бар, бұл үшінші
отбасылық фильмдер
кластерін енгізуге болатынын білдіреді. Бірақ
олардың одан да көбін енгізу қазірдің өзінде бір-
бірінен
аздап
ерекшеленетін
тым
кіші
кластерлерді береді.
Кластерлердің
санын
анықтағаннан
кейін
деректерді таратуға болады.