Университеттің 85 жылдығына арналған Қазіргі заманғы математика


материалдар жинағы, 25 қараша, 2022 жыл



Pdf көрінісі
бет356/527
Дата14.10.2023
өлшемі12,2 Mb.
#114644
1   ...   352   353   354   355   356   357   358   359   ...   527
материалдар жинағы, 25 қараша, 2022 жыл 
327 
Шаг 2. Далее, объединяем кластеры по методу ближайшего соседа. Пересчитываем 
матрицу по следующему правилу: 
k
 

ij
 
) = 
k
 

i
 
k
 

j
 
)}

Итерации продолжаются, пока не выполнится критерий остановки (то есть, пока 
величина d не достигнет заданного значения). 
Пример: 
Рассмотрим множество из восьми формул пятизначной логики 
Лукасевича. 
1




2


y
) ; 
3
= (

z
)


4


y
z
)


5


(

z


6


(

z
))


7
= ((

y

z
)


8
= (

z
) ( 

x
) . 
Их меры нетривиальности соответственно равны: 
I

1
) = 0,2000; 
I

2
) = 0,8000; 
I

3
) = 0,3000; 
I

4
) = 0,3584; 
I

5
) = 0,3000; 
I

6
) = 0,4092; 
I

7
) = 0,2716; 
I

8
) = 0,3416. 
Построим матрицу расстояний, используя расстояние (1): 










0,7600 0,1000 0,3416 0,4560 0,3876 0,2500 0,4248 


0,6840 0,5472 0,5000 0,5004 0,6420 0,5032 


0,3248 0,5120 0,3660 0,2460 0,4712 


0,4032 0,0508 0,1300 0,4424 


0,4212 0,4276 0,1416 


0,1688 0,4628 


0,4756 


Наименьшее расстояние = 0,0508 между формулами θ
4
и θ
6
. Объединяем их в 
кластер θ
46
, и далее, действуем по алгоритму выше. 
Итерация 1:
min 

,

) = 0,0508 = 

,


. Кластеры: 
1

2

3

46

5

7

8


, d=0,0508. 
Итерация 2: 
d=0,1000. 
min 

,
j
) = 0,1000 = 

,


. Кластеры: 
13

2

46

5

7

8



Итерация 3: 
d=0,1376. 
min 

,

) = 0,1300 = 

,
46 

. Кластеры: 


13

2

467

5

8

Итерация 4: 
d=0,1376. 
min 


) = 0,1416 = 






. Кластеры: 
13 



467 

58

Итерация 5: 
d=0,2092. 
min 

,

) = 0,2460 = 
13 
,
467 



. Кластеры: 


58 

13467

Итерация 6: 
d=0,2092. 
min 

,

) = 0,4032 = 
58 

13467 



. Кластеры: 


1345678 

Итерация 7: (
2

1345678
) = 0,5000 . Кластер
12345678
, d=0,6000. 
Если перед началом работы алгоритма зададим d, равную, например, 0,1500, то 
алгоритм останавливается после четвѐртой итерации и выдаѐт результат: 
Кластер 1: θ
1
, θ
3
.Кластер 2: θ
2
.Кластер 3: θ
4
, θ
6
, θ
7
.Кластер 4: θ
5
, θ
8



Университеттің 85 жылдығына арналған «Қазіргі заманғы математика: 
проблемалары және қолданыстары» III халықаралық Тайманов оқуларының 
материалдар жинағы, 25 қараша, 2022 жыл 
328 
0,8 
0,7 
0,5 
0,6 
Алгоритм к-средних (k-means) 
Пусть имеется множество объектов 

. Сначала 
каким-либо образом выбираются 

начальных точек (центров). Затем осуществляется 
последовательность итераций, каждая из которых состоит их двух шагов: 
1.
Обновление кластеров. При заданных 

центрах 
C
k
 


= (1,2,.., 


каждый объект 


приписывается к ближайшему из центров 
C
k
 
. Таким образом, 
образуются кластеры 
S
k
 


= (1,2,.., 



2.
 
Обновление центров. Для каждого кластера 
S
k
 
вычисляется его центр 
тяжести (внутри классовое среднее), который объявляется новым центром
C
k

Процесс останавливается, когда кластеры на шаге 

совпадут с кластерами 
на шаге 

[10]. 
Алгоритм к-средних для кластеризации множества формул Ł
n
 
Рассмотрим конечное множество логических формул Ł
n
. Центрами будут являться 
некоторые 

формул из данного множества. Сначала определяем количество кластеров, 
затем выбираем центры кластеров, анализируя матрицу расстояний. Будем исходить из 
следующих предположений:— центры должны быть почти равноудалены друг от друга; 
— расстояния между кластерами должны быть максимально возможными, с учѐтом 
предыдущего пункта. 
Например, исходя из вышесказанного, из двух имеющихся вариантов (рис. 2) мы 
выберем второй. 
φ
1
φ
1
Итерация: 
φ
3
φ
2
0,4 
φ
3
φ
2
0,5 
Рис. 2. 
Шаг 1. Приписываем каждую формулу из множества к ближайшему центру. 
Шаг 2. Центр масс — столбец значений логики Ł
n
. Для определения этого столбца 
учитывается специфика многозначных логических формул: 
Вычисляется среднее арифметическое 
S
a
 
каждой модели. 
значений элементов одного кластера на 
Если 

принадлежит множеству логических значений 

=

,..., 


, то 

 
оно записывается в столбец значений. 

1, 




,1
Если 
S

V

, то в столбец значений записывается ближайшее снизу (или 
ближайшее сверху, это определяется до начала работы алгоритма) значение из 
V
n
 
оставаться в том же множестве моделей, и в той же логике Ł
n
). 
Итерации продолжаются, пока кластеры не перестанут изменяться. 
(чтобы 
Пример: 
Рассмотрим множество из восьми формул из предыдущего примера. 
Допустим, нам нужно получить три кластера. Анализируя матрицу расстояний, выбираем 


Университеттің 85 жылдығына арналған «Қазіргі заманғы математика: 
проблемалары және қолданыстары» III халықаралық Тайманов оқуларының 
материалдар жинағы, 25 қараша, 2022 жыл 
329 




центрами формулы 
2
4

5
) = 0,4032 
). 

4

5
. ( 
2

4
) = 0,5472 

2

5
) = 0,5000 

Распределяем оставшиеся формулы по центрам. Получаются кластеры: 
2











5

8

Ищем центры масс. Рассмотрим наглядно, как это происходит: 




1
/ 2 = 

1 1 3 
1
0, , 


, ,1
2 4 




3
/ 2 = 

1 1 3 
2
0, 

, , 
4 2 4 
,1
Допустим, в качестве значения мы определились брать ближайшее сверху 
значение. Тогда 
C
2


. Остальное — аналогично. Таким образом, мы вычисляем центры 

тяжести кластеров. 
Снова распределяем формулы по обновлѐнным центрам. Получаются следующие 3 
кластера: 
2











5

8

Кластеры не изменились. Следовательно, алгоритм останавливается и выдаѐт 
получившиеся кластеры в качестве результата. 
Заметим, что при таком начальном выборе центров получившиеся кластеры 
совпадают с кластерами на пятой итерации иерархического алгоритма. 
Наблюдения и выводы для различных N 

Был создан банк из 500 различных 
логических формул, откуда случайным образом выбирались подмножества формул. С 
помощью адаптированных алгоритмов, описанных в предыдущей главе, было проведено 
более 150 кластеризаций таких подмножеств при различных n, где n — это размерность, 
например, логики Лукасевича Ł
n

Исходя из рассмотренных примеров, были сделаны следующие выводы: 
1.
Для n = 2,…,7 наблюдается различие в составе кластеров. Начиная с n = 8 
кластеры и последовательность итераций практически не меняются (8 — это 
максимальное такое значение n для рассмотренных примеров. Для некоторых множеств 
состав кластеров не меняется даже после n = 4, для других — после n = 5. и т. д.). 
Таким образом, возникает гипотеза о нецелесообразности использования логики 
большой значности в реальных задачах от небольшого числа переменных. Частично это 
подтверждается самой конструкцией введѐнного того или иного расстояния. 
2.
Для алгоритма к-средних при вычислении центров масс наблюдаются одни и те 
же результаты как при замене среднего арифметического ближайшим сверху значением из 
V
n
 
, так и ближайшим снизу. Для данных вычислений расстояния и адаптированные 
алгоритмы кластеризации были программно реализованы. 
Заключение. 
В работе выполнены следующие задачи. Расстояния между 
логическими формулами и меры нетривиальности высказываний обобщены на случай 
произвольной n-значной логики, в частности с полной мерой учета многозначности; 
доказаны свойства этих величин, схожие со свойствами расстояния и меры как в случае 
классической логики, как и в случае произвольной многозначной логики. Также 
определѐн общий случай расстояния между логическими формулами, когда некоторые 
значения переменных заранее известны, что также является актуальным для реальных 
задач, когда некоторая информация уже задана. 


z w θ
5
θ
8
C
58 



0 0 




C
1




0 0 




C
2
… 




Достарыңызбен бөлісу:
1   ...   352   353   354   355   356   357   358   359   ...   527




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет