Дәріс k-орта әдісімен кластерлеу



Pdf көрінісі
бет4/4
Дата27.11.2023
өлшемі423,17 Kb.
#129688
1   2   3   4
Байланысты:
Дәріс 4 ҮД

Шектеулер
k-кластерлеу 
өте 
пайдалы 
болғанымен, 
оның 
шектеулері бар: 
Әрбір деректер элементін тек бір кластермен 
байланыстыруға болады
. Кейде деректер элементі 
дәл екі центрдің ортасында орналасады, бұл оның осы 
кластерлерге қосылу мүмкіндігін бірдей етеді. 
Кластерлер сфералық болып есептеледі
. Деректер 
элементтері үшін ең жақын кластер центрін табудың 
итерациялық процесі оның радиусымен шектеледі, 
сондықтан алынған кластер тығыз сфераға ұқсайды. 
Егер кластердің нақты формасы, мысалы, эллипс 
болса, бұл проблема болуы мүмкін. Содан кейін 
кластерді қысқартуға (усечен) болады және оның 
кейбір мүшелері басқасына тағайындалады. 


Кластерлер бүтін (
цельными)
деп есептеледі
. k-
means әдісі олардың бір-бірімен қиылысуына немесе 
бір-бірінің ішінде орналасуына мүмкіндік бермейді. 
Әрбір деректер элементін бір кластерге мәжбүрлеудің 
орнына, 
әрбір 
деректер 
элементінің 
басқа 
кластерлерге қаншалықты тиесілі болуы мүмкін 
екендігін 
есептейтін 
икемді 
топтау 
әдістерін 
қолдаланып, бұл сфералық емес немесе қабаттасатын 
кластерлерді табуға көмектеседі. 
Осы 
шектеулерге 
қарамастан, 
k-means 
әдісі 
кластерлеудің 
күші 
оның 
талғампаз 
қарапайымдылығында жатыр. Жақсы тәсіл - деректер 
құрылымын бастапқы түсіну үшін k- means әдісі 
кластерлеуден бастау, содан кейін оның кемшіліктері 
жоқ жетілдірілген әдістерді қолдану.


Қысқаша қорытынды
K-кластерлеу – ұқсас деректер элементтерін 
бірге топтастыру тәсілі. Бұл k кластерлердің саны 
алдын ала көрсетілуі керек. 
Деректер элементтерін топтау үшін алдымен 
олардың 
әрқайсысы 
кластермен 
байланыстырылады, 
содан 
кейін 
кластер 
центрлерінің 
позициялары 
(орындары) 
жаңартылады. Бұл екі қадам өзгертулер 
таусылғанша қайталанады. 
k - кластерлеу сфералық, қабаттаспайтын 
кластерлер үшін жақсы жұмыс істейді.


Әдебиеттер 
1.Ын А., Су К. - Теоретический минимум по Big Data 
(Библиотека программиста) - 2019.pdf, 40-49 стр. 
2.Поручиков М. А. Анализ данных: учеб. пособие /– 
Самара: Изд-во Самарского университета, 2016. – 88 с. 
ISBN 978-5-7883-1085-5


Достарыңызбен бөлісу:
1   2   3   4




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет