материалдар жинағы, 25 қараша, 2022 жыл
327
Шаг 2. Далее, объединяем кластеры по методу ближайшего соседа. Пересчитываем
матрицу по следующему правилу:
k
,
ij
) =
k
,
i
k
,
j
)}
.
Итерации продолжаются, пока не выполнится критерий остановки (то есть, пока
величина d не достигнет заданного значения).
Пример:
Рассмотрим множество из восьми формул пятизначной логики
Лукасевича.
1
=
x
y
;
2
=
x
y
) ;
3
= (
x
z
)
y
;
4
=
x
y
z
)
w
;
5
=
y
(
x
z
)
;
6
=
y
(
x
z
))
w
;
7
= ((
x
y
)
z
)
w
;
8
= (
w
z
) (
y
x
) .
Их меры нетривиальности соответственно равны:
I
(θ
1
) = 0,2000;
I
(θ
2
) = 0,8000;
I
(θ
3
) = 0,3000;
I
(θ
4
) = 0,3584;
I
(θ
5
) = 0,3000;
I
(θ
6
) = 0,4092;
I
(θ
7
) = 0,2716;
I
(θ
8
) = 0,3416.
Построим матрицу расстояний, используя расстояние (1):
1
2
3
4
5
6
7
8
1
0
0,7600 0,1000 0,3416 0,4560 0,3876 0,2500 0,4248
2
0
0,6840 0,5472 0,5000 0,5004 0,6420 0,5032
3
0
0,3248 0,5120 0,3660 0,2460 0,4712
4
0
0,4032 0,0508 0,1300 0,4424
5
0
0,4212 0,4276 0,1416
6
0
0,1688 0,4628
7
0
0,4756
8
0
Наименьшее расстояние = 0,0508 между формулами θ
4
и θ
6
. Объединяем их в
кластер θ
46
, и далее, действуем по алгоритму выше.
Итерация 1:
min
i
,
j
) = 0,0508 =
4
,
6
)
. Кластеры:
1
,
2
,
3
,
46
,
5
,
7
,
8
i
j
, d=0,0508.
Итерация 2:
d=0,1000.
min
i
,
j
) = 0,1000 =
1
,
3
)
. Кластеры:
13
,
2
,
46
,
5
,
7
,
8
,
i
j
Итерация 3:
d=0,1376.
min
i
,
j
) = 0,1300 =
7
,
46
)
. Кластеры:
i
j
13
,
2
,
467
,
5
,
8
.
Итерация 4:
d=0,1376.
min
i
j
) = 0,1416 =
5
,
8
)
i
j
. Кластеры:
13
,
2
,
467
,
58
,
Итерация 5:
d=0,2092.
min
i
,
j
) = 0,2460 =
13
,
467
)
i
j
. Кластеры:
2
,
58
,
13467
,
Итерация 6:
d=0,2092.
min
i
,
j
) = 0,4032 =
58
,
13467
)
i
j
. Кластеры:
2
,
1345678
,
Итерация 7: (
2
,
1345678
) = 0,5000 . Кластер
12345678
, d=0,6000.
Если перед началом работы алгоритма зададим d, равную, например, 0,1500, то
алгоритм останавливается после четвѐртой итерации и выдаѐт результат:
Кластер 1: θ
1
, θ
3
.Кластер 2: θ
2
.Кластер 3: θ
4
, θ
6
, θ
7
.Кластер 4: θ
5
, θ
8
.
Университеттің 85 жылдығына арналған «Қазіргі заманғы математика:
проблемалары және қолданыстары» III халықаралық Тайманов оқуларының
материалдар жинағы, 25 қараша, 2022 жыл
328
0,8
0,7
0,5
0,6
Алгоритм к-средних (k-means)
Пусть имеется множество объектов
I
. Сначала
каким-либо образом выбираются
K
начальных точек (центров). Затем осуществляется
последовательность итераций, каждая из которых состоит их двух шагов:
1.
Обновление кластеров. При заданных
K
центрах
C
k
,
k
= (1,2,..,
K
)
каждый объект
i
I
приписывается к ближайшему из центров
C
k
. Таким образом,
образуются кластеры
S
k
,
k
= (1,2,..,
K
)
.
2.
Обновление центров. Для каждого кластера
S
k
вычисляется его центр
тяжести (внутри классовое среднее), который объявляется новым центром
C
k
.
Процесс останавливается, когда кластеры на шаге
t
совпадут с кластерами
на шаге
t
[10].
Алгоритм к-средних для кластеризации множества формул Ł
n
Рассмотрим конечное множество логических формул Ł
n
. Центрами будут являться
некоторые
K
формул из данного множества. Сначала определяем количество кластеров,
затем выбираем центры кластеров, анализируя матрицу расстояний. Будем исходить из
следующих предположений:— центры должны быть почти равноудалены друг от друга;
— расстояния между кластерами должны быть максимально возможными, с учѐтом
предыдущего пункта.
Например, исходя из вышесказанного, из двух имеющихся вариантов (рис. 2) мы
выберем второй.
φ
1
φ
1
Итерация:
φ
3
φ
2
0,4
φ
3
φ
2
0,5
Рис. 2.
Шаг 1. Приписываем каждую формулу из множества к ближайшему центру.
Шаг 2. Центр масс — столбец значений логики Ł
n
. Для определения этого столбца
учитывается специфика многозначных логических формул:
Вычисляется среднее арифметическое
S
a
каждой модели.
значений элементов одного кластера на
Если
S
принадлежит множеству логических значений
V
=
1
,...,
n
2
, то
a
оно записывается в столбец значений.
n
1,
n
1
n
1
,1
Если
S
a
V
n
, то в столбец значений записывается ближайшее снизу (или
ближайшее сверху, это определяется до начала работы алгоритма) значение из
V
n
оставаться в том же множестве моделей, и в той же логике Ł
n
).
Итерации продолжаются, пока кластеры не перестанут изменяться.
(чтобы
Пример:
Рассмотрим множество из восьми формул из предыдущего примера.
Допустим, нам нужно получить три кластера. Анализируя матрицу расстояний, выбираем
Университеттің 85 жылдығына арналған «Қазіргі заманғы математика:
проблемалары және қолданыстары» III халықаралық Тайманов оқуларының
материалдар жинағы, 25 қараша, 2022 жыл
329
2
2
2
4
центрами формулы
2
4
,
5
) = 0,4032
).
,
4
,
5
. (
2
,
4
) = 0,5472
,
2
,
5
) = 0,5000
,
Распределяем оставшиеся формулы по центрам. Получаются кластеры:
2
;
1
,
3
,
4
,
6
,
7
;
5
,
8
.
Ищем центры масс. Рассмотрим наглядно, как это происходит:
C
=
1
+
1
/ 2 =
1
1 1 3
1
0, ,
2
4
, ,1
2 4
C
=
1
+
3
/ 2 =
5
1 1 3
2
0,
8
, ,
4 2 4
,1
Допустим, в качестве значения мы определились брать ближайшее сверху
значение. Тогда
C
2
=
3
. Остальное — аналогично. Таким образом, мы вычисляем центры
4
тяжести кластеров.
Снова распределяем формулы по обновлѐнным центрам. Получаются следующие 3
кластера:
2
;
1
,
3
,
4
,
6
,
7
;
5
,
8
.
Кластеры не изменились. Следовательно, алгоритм останавливается и выдаѐт
получившиеся кластеры в качестве результата.
Заметим, что при таком начальном выборе центров получившиеся кластеры
совпадают с кластерами на пятой итерации иерархического алгоритма.
Наблюдения и выводы для различных N
2
Был создан банк из 500 различных
логических формул, откуда случайным образом выбирались подмножества формул. С
помощью адаптированных алгоритмов, описанных в предыдущей главе, было проведено
более 150 кластеризаций таких подмножеств при различных n, где n — это размерность,
например, логики Лукасевича Ł
n
.
Исходя из рассмотренных примеров, были сделаны следующие выводы:
1.
Для n = 2,…,7 наблюдается различие в составе кластеров. Начиная с n = 8
кластеры и последовательность итераций практически не меняются (8 — это
максимальное такое значение n для рассмотренных примеров. Для некоторых множеств
состав кластеров не меняется даже после n = 4, для других — после n = 5. и т. д.).
Таким образом, возникает гипотеза о нецелесообразности использования логики
большой значности в реальных задачах от небольшого числа переменных. Частично это
подтверждается самой конструкцией введѐнного того или иного расстояния.
2.
Для алгоритма к-средних при вычислении центров масс наблюдаются одни и те
же результаты как при замене среднего арифметического ближайшим сверху значением из
V
n
, так и ближайшим снизу. Для данных вычислений расстояния и адаптированные
алгоритмы кластеризации были программно реализованы.
Заключение.
В работе выполнены следующие задачи. Расстояния между
логическими формулами и меры нетривиальности высказываний обобщены на случай
произвольной n-значной логики, в частности с полной мерой учета многозначности;
доказаны свойства этих величин, схожие со свойствами расстояния и меры как в случае
классической логики, как и в случае произвольной многозначной логики. Также
определѐн общий случай расстояния между логическими формулами, когда некоторые
значения переменных заранее известны, что также является актуальным для реальных
задач, когда некоторая информация уже задана.
x
y
z w θ
5
θ
8
C
58
0
1
2
0 0
1
2
1
2
C
1
1
4
1
2
0 0
1
2
3
4
C
2
…
|