Университеттің 85 жылдығына арналған Қазіргі заманғы математика


материалдар жинағы, 25 қараша, 2022 жыл



Pdf көрінісі
бет356/527
Дата14.10.2023
өлшемі12,2 Mb.
#114644
1   ...   352   353   354   355   356   357   358   359   ...   527
Байланысты:
TaimanovMatem

материалдар жинағы, 25 қараша, 2022 жыл 
327 
Шаг 2. Далее, объединяем кластеры по методу ближайшего соседа. Пересчитываем 
матрицу по следующему правилу: 
k
 

ij
 
) = 
k
 

i
 
k
 

j
 
)}

Итерации продолжаются, пока не выполнится критерий остановки (то есть, пока 
величина d не достигнет заданного значения). 
Пример: 
Рассмотрим множество из восьми формул пятизначной логики 
Лукасевича. 
1




2


y
) ; 
3
= (

z
)


4


y
z
)


5


(

z


6


(

z
))


7
= ((

y

z
)


8
= (

z
) ( 

x
) . 
Их меры нетривиальности соответственно равны: 
I

1
) = 0,2000; 
I

2
) = 0,8000; 
I

3
) = 0,3000; 
I

4
) = 0,3584; 
I

5
) = 0,3000; 
I

6
) = 0,4092; 
I

7
) = 0,2716; 
I

8
) = 0,3416. 
Построим матрицу расстояний, используя расстояние (1): 










0,7600 0,1000 0,3416 0,4560 0,3876 0,2500 0,4248 


0,6840 0,5472 0,5000 0,5004 0,6420 0,5032 


0,3248 0,5120 0,3660 0,2460 0,4712 


0,4032 0,0508 0,1300 0,4424 


0,4212 0,4276 0,1416 


0,1688 0,4628 


0,4756 


Наименьшее расстояние = 0,0508 между формулами θ
4
и θ
6
. Объединяем их в 
кластер θ
46
, и далее, действуем по алгоритму выше. 
Итерация 1:
min 

,

) = 0,0508 = 

,


. Кластеры: 
1

2

3

46

5

7

8


, d=0,0508. 
Итерация 2: 
d=0,1000. 
min 

,
j
) = 0,1000 = 

,


. Кластеры: 
13

2

46

5

7

8



Итерация 3: 
d=0,1376. 
min 

,

) = 0,1300 = 

,
46 

. Кластеры: 


13

2

467

5

8

Итерация 4: 
d=0,1376. 
min 


) = 0,1416 = 






. Кластеры: 
13 



467 

58

Итерация 5: 
d=0,2092. 
min 

,

) = 0,2460 = 
13 
,
467 



. Кластеры: 


58 

13467

Итерация 6: 
d=0,2092. 
min 

,

) = 0,4032 = 
58 

13467 



. Кластеры: 


1345678 

Итерация 7: (
2

1345678
) = 0,5000 . Кластер
12345678
, d=0,6000. 
Если перед началом работы алгоритма зададим d, равную, например, 0,1500, то 
алгоритм останавливается после четвѐртой итерации и выдаѐт результат: 
Кластер 1: θ
1
, θ
3
.Кластер 2: θ
2
.Кластер 3: θ
4
, θ
6
, θ
7
.Кластер 4: θ
5
, θ
8



Университеттің 85 жылдығына арналған «Қазіргі заманғы математика: 
проблемалары және қолданыстары» III халықаралық Тайманов оқуларының 
материалдар жинағы, 25 қараша, 2022 жыл 
328 
0,8 
0,7 
0,5 
0,6 
Алгоритм к-средних (k-means) 
Пусть имеется множество объектов 

. Сначала 
каким-либо образом выбираются 

начальных точек (центров). Затем осуществляется 
последовательность итераций, каждая из которых состоит их двух шагов: 
1.
Обновление кластеров. При заданных 

центрах 
C
k
 


= (1,2,.., 


каждый объект 


приписывается к ближайшему из центров 
C
k
 
. Таким образом, 
образуются кластеры 
S
k
 


= (1,2,.., 



2.
 
Обновление центров. Для каждого кластера 
S
k
 
вычисляется его центр 
тяжести (внутри классовое среднее), который объявляется новым центром
C
k

Процесс останавливается, когда кластеры на шаге 

совпадут с кластерами 
на шаге 

[10]. 
Алгоритм к-средних для кластеризации множества формул Ł
n
 
Рассмотрим конечное множество логических формул Ł
n
. Центрами будут являться 
некоторые 

формул из данного множества. Сначала определяем количество кластеров, 
затем выбираем центры кластеров, анализируя матрицу расстояний. Будем исходить из 
следующих предположений:— центры должны быть почти равноудалены друг от друга; 
— расстояния между кластерами должны быть максимально возможными, с учѐтом 
предыдущего пункта. 
Например, исходя из вышесказанного, из двух имеющихся вариантов (рис. 2) мы 
выберем второй. 
φ
1
φ
1
Итерация: 
φ
3
φ
2
0,4 
φ
3
φ
2
0,5 
Рис. 2. 
Шаг 1. Приписываем каждую формулу из множества к ближайшему центру. 
Шаг 2. Центр масс — столбец значений логики Ł
n
. Для определения этого столбца 
учитывается специфика многозначных логических формул: 
Вычисляется среднее арифметическое 
S
a
 
каждой модели. 
значений элементов одного кластера на 
Если 

принадлежит множеству логических значений 

=

,..., 


, то 

 
оно записывается в столбец значений. 

1, 




,1
Если 
S

V

, то в столбец значений записывается ближайшее снизу (или 
ближайшее сверху, это определяется до начала работы алгоритма) значение из 
V
n
 
оставаться в том же множестве моделей, и в той же логике Ł
n
). 
Итерации продолжаются, пока кластеры не перестанут изменяться. 
(чтобы 
Пример: 
Рассмотрим множество из восьми формул из предыдущего примера. 
Допустим, нам нужно получить три кластера. Анализируя матрицу расстояний, выбираем 


Университеттің 85 жылдығына арналған «Қазіргі заманғы математика: 
проблемалары және қолданыстары» III халықаралық Тайманов оқуларының 
материалдар жинағы, 25 қараша, 2022 жыл 
329 




центрами формулы 
2
4

5
) = 0,4032 
). 

4

5
. ( 
2

4
) = 0,5472 

2

5
) = 0,5000 

Распределяем оставшиеся формулы по центрам. Получаются кластеры: 
2











5

8

Ищем центры масс. Рассмотрим наглядно, как это происходит: 




1
/ 2 = 

1 1 3 
1
0, , 


, ,1
2 4 




3
/ 2 = 

1 1 3 
2
0, 

, , 
4 2 4 
,1
Допустим, в качестве значения мы определились брать ближайшее сверху 
значение. Тогда 
C
2


. Остальное — аналогично. Таким образом, мы вычисляем центры 

тяжести кластеров. 
Снова распределяем формулы по обновлѐнным центрам. Получаются следующие 3 
кластера: 
2











5

8

Кластеры не изменились. Следовательно, алгоритм останавливается и выдаѐт 
получившиеся кластеры в качестве результата. 
Заметим, что при таком начальном выборе центров получившиеся кластеры 
совпадают с кластерами на пятой итерации иерархического алгоритма. 
Наблюдения и выводы для различных N 

Был создан банк из 500 различных 
логических формул, откуда случайным образом выбирались подмножества формул. С 
помощью адаптированных алгоритмов, описанных в предыдущей главе, было проведено 
более 150 кластеризаций таких подмножеств при различных n, где n — это размерность, 
например, логики Лукасевича Ł
n

Исходя из рассмотренных примеров, были сделаны следующие выводы: 
1.
Для n = 2,…,7 наблюдается различие в составе кластеров. Начиная с n = 8 
кластеры и последовательность итераций практически не меняются (8 — это 
максимальное такое значение n для рассмотренных примеров. Для некоторых множеств 
состав кластеров не меняется даже после n = 4, для других — после n = 5. и т. д.). 
Таким образом, возникает гипотеза о нецелесообразности использования логики 
большой значности в реальных задачах от небольшого числа переменных. Частично это 
подтверждается самой конструкцией введѐнного того или иного расстояния. 
2.
Для алгоритма к-средних при вычислении центров масс наблюдаются одни и те 
же результаты как при замене среднего арифметического ближайшим сверху значением из 
V
n
 
, так и ближайшим снизу. Для данных вычислений расстояния и адаптированные 
алгоритмы кластеризации были программно реализованы. 
Заключение. 
В работе выполнены следующие задачи. Расстояния между 
логическими формулами и меры нетривиальности высказываний обобщены на случай 
произвольной n-значной логики, в частности с полной мерой учета многозначности; 
доказаны свойства этих величин, схожие со свойствами расстояния и меры как в случае 
классической логики, как и в случае произвольной многозначной логики. Также 
определѐн общий случай расстояния между логическими формулами, когда некоторые 
значения переменных заранее известны, что также является актуальным для реальных 
задач, когда некоторая информация уже задана. 


z w θ
5
θ
8
C
58 



0 0 




C
1




0 0 




C
2
… 




Достарыңызбен бөлісу:
1   ...   352   353   354   355   356   357   358   359   ...   527




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет