0,02
1
x
5
-0,20
0,04
-0,25
-0,24
1
Структура каскадной нейро-нечеткой сети показана на рис. 1. Сеть состоит из двух подсистем.
Первая подсистема диагностирует наличие СЭИ, вторая подсистема определяет тяжесть ХБП.
Рис. 1. Структура каскадной нейро-нечеткой сети
В каждом узле каскадной сети реализована модель нечеткого вывода Такаги-Сугено (Takagi T.,
Sugeno M.) [8]. В этой модели функция заключения определяется взвешенной суммой входных пере-
менных. Поэтому дефаззификатор на выходе системы не требуется, а модель вывода значительно
упрощается. Правила вывода в алгоритме Такаги-Сугено представляются в виде
1
1
2
2
0
1 1
Rule : If
is a
If
is a
If
is a Then y
j
j
n
nj
j
j
j
jn n
j
x
x
x
c
c x
c x
, (3)
●
Технические науки
104
№1 2017 Вестник КазНИТУ
где
i
x
—
i
-я (
1, 2,
,
i
n
) входная лингвистическая переменная,
ij
a
— терм
i
-й перемен-
ной в
j
-м правиле (
1, 2,
,
j
m
),
j
y
— выходная переменная),
0
1
,
,
,
j
j
jn
c
c
c
— действи-
тельные числа,
— логическая операция.
Модель Такаги-Сугено удобно реализовать в виде нейро-нечеткой сети ANFIS (Adaptive Neuro-
Fuzzy Inference System —адаптивная сеть нечеткого вывода) [12]. В ANFIS выводы делаются на ос-
нове аппарата нечеткой логики, а для настройки сети применяются процедуры обучения нейронных
сетей. Сеть ANFIS состоит из пяти слоев. Первый слой реализует приведение к нечеткости входных
данных — фаззификацию (fuzzification). Для этого вычисляются
ij
a
i
x
— значения функций при-
надлежности термов
ij
a
правил (3). Входы сети соединены только с соответствующими термами.
Количество узлов первого слоя равно сумме мощностей терм-множеств входных переменных. Выхо-
дом каждого узла являются степень принадлежности
ij
a
i
x
значения входной переменной
i
x
со-
ответствующему нечеткому терму
ij
a
. Таким образом, выходом первого слоя является нечеткое
множество. Использовалась треугольная функция принадлежности, так как известны диапазоны из-
менений и средние значения для каждой нечеткой переменной. Второй слой производит логические
операции в соответствии с правилами (3) над элементами нечеткого множества, полученного на пер-
вом слое. Количество узлов второго слоя равно количеству нечетких правил. Каждый узел этого слоя
соответствует одному правилу. Базы знаний слоев каскадной сети представлены в таблицах 2–4.
Элементы антецедентов нечетких правил базы знаний первого слоя каскадной сети связаны логиче-
скими операциями И (правила 1-8), ИЛИ (правило 9). Элементы антецедентов правил второго и тре-
тьего слоев связаны логическими операциями И.
Таблица 2. База знаний первого слоя каскадной сети
№
x
5
x
2
y
1,2
x
3
x
4
y
1,1
1
Высокое
Высокое
Болен
Высокое
Высокое
Болен
2
Среднее
Среднее
Здоров
Среднее
Среднее
Здоров
3
Высокое
Низкое
Болен
Высокое
Низкое
Болен
4
Низкое
Низкое
Болен
Низкое
Низкое
Болен
5
Низкое
-
Болен
Низкое
Низкое
Болен
6
Высокое
-
Болен
Высокое
Высокое
Болен
7
-
Низкое
Болен
Низкое
Низкое
Болен
8
-
Высокое
Болен
Высокое
Высокое
Болен
9
Высокое
Высокое
Болен
Низкое
Высокое
Болен
●
Техникалық ғылымдар
ҚазҰТЗУ хабаршысы №1 2017
105
Таблица 3. База знаний второго слоя каскадной сети
№
y
1,1
y
1
,
2
y
2,1
1
Болен
Болен
Болен
2
Здоров
Здоров
Здоров
3
Болен
Здоров
Болен
4
Здоров
Болен
Болен
Таблица 4. База знаний третьего слоя каскадной сети
№
y
2,1
x
1
y
3,1
1
Болен
Высокое
Болен
2
Здоров
Среднее
Здоров
3
Болен
Низкое
Болен
4
Здоров
Высокое
Болен
5
Здоров
Низкое
Болен
Узел второго слоя соединен с теми узлами первого слоя, которые формируют антецеденты (по-
сылки) соответствующего правила. Выходом узла является вес правила
j
w
— степень выполнения
нечеткого правила (вес некоторого правила), которая вычисляется с использованием t-норм в случае
пересечения элементов нечетких множеств и s-норм в случае объединения элементов нечетких мно-
жеств [8]. Примером t-нормы является произведение
,
T x y
x y
, а примером s-нормы — веро-
ятностная сумма
,
S x y
x
y
x y
. Каждый узел третьего слоя определяет нормализованные
веса правил — отношение веса каждого правила к сумме весов всех правил
1
m
j
j
i
i
w
w
w
. Чет-
вертый слой рассчитывает вклад одного нечеткого правила в выход сети как произведение нормали-
зованного веса правила на линейную комбинацию входов, фигурирующих в заключении правила вы-
вода Сугено (3)
0
1 1
j
j
j
j
jn
n
f
w c
c x
c x
. Количество узлов четвертого слоя равно коли-
честву правил. Каждый узел этого слоя соединен с одним узлом третьего слоя, а также со всеми вхо-
дами сети. Единственный узел пятого слоя суммирует вклады всех правил, формируя "четкое" (дефа-
зифицированное) выходное значение сети
1
m
i
j
y
f
.
Разработка каскадной нейро-нечеткой сети произведена средствами пакета Fuzzy Logic Toolbox
системы MATLAB. Для каждого узла сформированы сети ANFIS. Для каждого признака заданы тре-
угольные функции принадлежности, определяемые известными медицинскими показателями, заданы
правила базы знаний (таблицы 2–4) с единичными весовыми коэффициентами.
Так как параметры функций принадлежности задаются установленными медицинскими показа-
телями нормы и патологии, настройке подлежат только весовые коэффициенты правил. Сети ANFIS
обучались независимо друг от друга, так как выходы каждого узла известны. Для настройки весов
правил использовалась функция fmincon пакета оптимизации Optimization Toolbox системы
MATLAB [14]. С помощью этой функции найдены веса правил, обеспечивающие минимум суммы
квадратов разностей между фактическими и целевыми выходами сети при положительных значениях
весов. Последнее ограничение введено для упрощения интерпретации полученных правил.
При выходе из подсистемы диагностики СЭИ с результатом «болен», происходит переход в
подсистему диагностики тяжести ХБП. Критерием тяжести является скорость клубочковой фильтра-
ции (СКФ), он рассчитывается по формулам, справедливым на любой стадии хронической болезни
почек и у представителей всех четырех рас – CKD-EPI (Chronic Kidney Disease Epidemiology Collabo-
ration) [13].
●
Технические науки
106
№1 2017 Вестник КазНИТУ
Таблица 5. Формулы для определения CKD-EPI, модификация 2011 г.
Раса
Пол
S
Cr
*,
мг/100 мл
СКФ
Чернокожие
Женский
0.7
0.328
167
0.993
/ 0.7
t
Cr
S
Чернокожие
Женский
0.7
1.210
167
0.993
/ 0.7
t
Cr
S
Чернокожие
Мужской
0.9
0.412
164
0.993
/ 0.9
t
Cr
S
Чернокожие
Мужской
0.9
1.210
164
0.993
/ 0.9
t
Cr
S
Азиаты
Женский
0.7
0.328
151
0.993
/ 0.7
t
Cr
S
Азиаты
Женский
0.7
1.210
151
0.993
/ 0.7
t
Cr
S
Азиаты
Мужской
0.9
0.412
149
0.993
/ 0.9
t
Cr
S
Азиаты
Мужской
0.9
1.210
149
0.993
/ 0.9
t
Cr
S
Испаноамериканцы и индейцы
Женский
0.7
0.328
145
0.993
/ 0.7
t
Cr
S
Испаноамериканцы и индейцы
Женский
0.7
1.210
145
0.993
/ 0.7
t
Cr
S
Испаноамериканцы и индейцы
Мужской
0.9
0.412
143
0.993
/ 0.9
t
Cr
S
Испаноамериканцы и индейцы
Мужской
0.9
1.210
143
0.993
/ 0.9
t
Cr
S
Белые
Женский
0.7
0.328
144
0.993
/ 0.7
t
Cr
S
Белые
Женский
0.7
1.210
144
0.993
/ 0.7
t
Cr
S
Белые
Мужской
0.9
0.412
141
0.993
/ 0.9
t
Cr
S
Белые
Мужской
0.9
1.210
141
0.993
/ 0.9
t
Cr
S
где
t
–
возраст,
Cr
S
–
концентрация
креатинина
в
сыворотке
крови,
, мг/100 мл
, мкмоль/л
0,0113
Cr
Cr
S
S
.
Стадии заболевания ХБП представлены в таблице 6.
Таблица 6. Стадии заболевания ХБП
Стадия ХБП
Описание
СКФ/1,73
(мл/мин*кв.м)
I
Признаки повреждения почек с нормальной или повы-
шенной СКФ
>90
II
Признаки повреждения почек с начальным снижением
СКФ
89-60
III
Умеренное снижение СКФ
59-30
IV
Выраженное снижение СКФ
29-15
V
Терминальная почечная недостаточность
<15
●
Техникалық ғылымдар
ҚазҰТЗУ хабаршысы №1 2017
107
3. Реализация системы поддержки принятия решений
Для реализации системы поддержки принятия решений выбрана среда разработки Microsoft
Visual Studio с использованием языка программирования C# 4.0. Система состоит из двух модулей:
модуля статистических исследований и модуля диагностической системы. Для этих модулей спроек-
тирована база данных, которая реализована на SQL-сервере и хранит «Медицинскую карту стацио-
нарного больного», параметры настройки сети, базу знаний и параметры учетной политики.
Модуль статистических исследований имеет два основных блока: «Статистика» (вычисляет ко-
эффициенты эксцесса, асимметрии, тест КолмогороваСмирнова) и «Заполнение пропусков». Запол-
нение пропусков в медицинских обучающих данных проводится по предложенному способу, осно-
ванному на интеграции кластеризации k-means и бутстреп-метода. По результатам заполнения про-
пусков формируется обучающая выборка.
Модуль диагностической системы состоит из двух подсистем: подсистемы диагностики син-
дрома эндогенной интоксикации и подсистемы диагностики тяжести хронической болезни почек
(рис. 2).
Рис. 2. Структура системы поддержки принятия решений
Система состоит из двух основных модулей: модуля статистических исследований и модуля
диагностической системы. Для этих модулей спроектирована база данных, которая реализована на
SQL-сервере и хранит «Медицинскую карту стационарного больного», параметры настройки сети,
базу знаний и параметры учетной политики.
Модуль статистических исследований имеет два основных блока: «Статистика» (вычисляет ко-
эффициенты эксцесса, асимметрии, тест КолмогороваСмирнова) и «Заполнение пропусков». Запол-
нение пропусков в медицинских обучающих данных проводится в классе statistics по предложенному
способу, основанному на интеграции кластеризации k-means и бутстреп-метода. По результатам за-
полнения пропусков формируется обучающая выборка.
Модуль диагностической системы состоит из двух подсистем: подсистемы диагностики син-
дрома эндогенной интоксикации и подсистемы диагностики тяжести хронической болезни почек.
Для работы подсистемы диагностики синдрома эндогенной интоксикации реализованы функ-
ции создания лингвистических переменных, функций принадлежности для лингвистических пере-
менных, правил базы знаний, также функции фазификации, дефазификации. Таким образом, после
анализа алгоритмов функционирования разработанной каскадной нейро-нечеткой сети в целом и ра-
боты отдельных ее элементов были реализованы основные классы в пространстве имен
FuzzyLogicController.
●
Технические науки
108
№1 2017 Вестник КазНИТУ
Результатом диагностики данной подсистемы является определение пяти стадий хронической
болезни почек. После диагностики вся информация о пациенте (диагноз, лабораторные показатели
анализа крови) сохраняется в базе данных. Модуль диагностической системы позволяет работать
врачу с ранее созданной структурой диагностической системы, дополняя ее правилами нечетких про-
дукций по ходу работы, а также создавать свою собственную структуру системы с входными и вы-
ходными данными, заполняя базу знаний.
Результаты
Тестирование на данных реальных историй болезни показало, что предложенная система под-
держки принятия решений при диагностике синдрома эндогенной интоксикации на примере хрони-
ческой почечной недостаточности позволяет на сокращенном наборе анализов диагностировать ХПН
в терминальной стадии с ошибкой 1 % и на данных о больных в ранней стадии ХПН с ошибкой 10 %.
Заключение
Разработана система поддержки принятия решений при диагностике синдрома эндогенной ин-
токсикации на примере ХПН, основанная на каскадной нейро-нечеткой сети, позволяющая на сокра-
щенном наборе анализов проводить диагностику на данных о больных в ранней стадии ХПН с ошиб-
кой 10 % и в терминальной стадии с ошибкой 1 %.
ЛИТЕРАТУРА
[1] US Renal Data System. USRDS 2009 Annual Data Report: atlas of end-stage renal disease in the United
States. — National Institutes of Health, National Institutes of Diabetes and Digestive and Kidney Diseases, 2009 //
http://www.usrds.org/atlas09.aspx
[2] Steyerberg E. Clinical Prediction Models: A Practical Approach to Development, Validation, and Updat-
ing. Springer, 2009. 500 p.
[3] Moein S. Medical Diagnosis Using Artificial Neural Networks. IGI Global, 2014. 310 p.
[4] Artificial neural networks in medical diagnosis/ F. Amato, A. López, E. M. Peña-Méndez, P. Vaňhara,
A. Hampl, J. Havel // Journal of Applied Biomedicine, 2013, Vol. 11. No. 2. Pp. 47–58.
[5] Kumar A. V. Fuzzy Expert Systems for Disease Diagnosis. 2014. 401 p.
[6] Кузнецова О. Ю., Горбаченко В. И., Соломаха А. А. Нейросетевые и нейро-нечёткие технологии ди-
агностики синдрома эндогенной интоксикации с почечной дисфункцией. Пенза: Приволжский Дом знаний,
2014. 236 с.
[7] Yager R. R., Filev D. P. Essentials of Fuzzy Modeling and Control. Wiley, 1994. 408 p.
[8] Пегат А. Нечеткое моделирование и управление. М.: БИНОМ. Лаборатория знаний, 2009. 798 с.
[9] Little R. J. A., Rubin D. B. Statistical Analysis with Missing Data. Wiley-Interscience, 2002. 408 p.
[10] Fujikawa Y., Ho T. B. Cluster-based algorithms for dealing with missing values // Proceedings in Advances
in Knowledge Discovery and Data Mining / Proceedings 6th Pacific-Asia Conference, PAKDD 2002 Taipei, Taiwan,
May 6–8, 2002. Pp. 549–554.
[11] Hollander M., Wolf D. A., Chicken E. Nonparametric Statistical Methods. Wiley, 2013. 848 p.
[12] Nauck D., Klawonn F., Kruse R. Foundations of Neuro-Fuzzy Systems. Wiley, 1997. 305 p.
[13] Delanaye, P. MDRD or CKDEPI study equations for estimating prevalence of stage 3 CKD in epidemio-
logical studies: which difference? Is this difference relevant? / P. Delanaye E. Cavalier, C. Mariat // BMC Nephrol,
2010
[14] Optimization Toolbox. User's Guide. — MathWorks, Inc, 2016. — 884 p.
Ахметов Б.С., Горбаченко В.И., Кузнецова О.Ю., Алибиева Ж.М.
15> Достарыңызбен бөлісу: |