ная заболеваемость". Эта характеристика входит в модель Керма-
ка – Мак-Кендрика как интенсивность заражения восприимчивых в
контакте с больными (λ = aN
1
N
2
). В дополнение к ней, введем ха-
рактеристику "суточная выздоравливаемость" (ω = βN
2
). В систем-
ной интерпретации первая есть скорость входного потока в элемент
"больные", вторая — скорость выходного.
Рис. 1. Схема динамики больных
Полагая, что λ и ω — измеряемые величины, приходим к следу-
ющей задаче. Имеется два уравнения и два измерителя:
˙
N
1
= −aN
1
N
2
,
N
2
= aN
1
N
2
− βN
2
,
λ = aN
1
N
2
,
ω = βN
2
.
(1)
205
Требуется по данным измерения λ, ω на промежутке времени
[0; T ] найти неизвестные параметры a, β и начальные значения
N
1
(0), N
2
(0). В такой постановке это есть задача наблюдаемости [2].
Метод решения. Перейдем от задачи (1) к задаче с известными
начальными данными, дифференцируя λ, ω по t в силу (1):
˙λ = a
βλ
aω
−
ω
β
− β λ,
˙ω = β (λ − ω) ,
λ(0) = λ
0
,
ω(0) = ω
0
,
(2)
и требуя
J (a, β) =
T
k=0
λ (a, β, t
k
) − ¯
λ (t
k
)
2
+
+ (ω (a, β, t
k
) − ¯
ω (t
k
))
2
→ min
a,β
,
где ¯
λ (t
k
), ¯
ω (t
k
) – измеренные значения λ, ω на моменты времени
t = t
k
, k = 0, 1, . . . , T . В этом случае задача (2) сводится к отысканию
на плоскости (a, β) такой точки (a
∗
, b
∗
), что
J (a
∗
, β
∗
) = min
a,β
,
a, β > 0.
В качестве начального приближения к β можно взять величину,
обратную некоторой средней продолжительности болезни
T
S
, а
в качестве начального приближения к a – корень приближенного
уравнения ˙λ
0
(a) = ω
0
.
Пример. Пусть наблюдения за развитием сезонного подъема
гриппа и ОРЗ на протяжении 8 недель дали значения λ, ω, ука-
занные в таблице 1 (на первый день каждой недели, в чел/сут).
Таблица. Таблица данных по заболеваемости и выздоравливаемости
t
0
1
2
3
4
5
6
7
8
λ
k
900
1200
2000
3500
3200
4800
6500
9100
11000
ω
k
200
180
300
410
700
650
1500
2000
2600
Имея ввиду, что средняя продолжительность болезни в случае
острой респираторно — вирусной инфекции составляет 7–10 дней,
206
примем T
S
= 7 дней. Тогда β
0
= 1/7. Выбрав a
0
= 4 · 10
−6
, и варьи-
руя параметры a, β в окрестности начальной точки (a
0
, β
0
), найдем:
min J (a, b) при a
∗
= 4, 5 · 10
−6
, β
∗
= 0, 114. Однако, из рис. 2 вид-
но, что запаздывание ω (t) относительно λ (t) увеличилось с 1 недели
до 4 недель. Это вызвано следующей особенностью. При неполном
учете всех выздоровевших (ω меньше действительного) происходит
скрытое удлинение T
S
: ω
0
= 1400/7 = 5600/28 = 200.
Рис. 2. Измеримые значения λ и ω и их аппроксимация
Литература
1. Kermack W.O., Mc Kendrick A.G. A contribution to the
mathematical theory of epidemics // Proceedings of the Royal Society,
1927. Ser. A. V. 115, № A771. P. 700–721.
2. Математические модели систем управления / Под ред. В.Ф. Де-
мьянова. СПб.: Изд-во СПбГУ, 2000.
207
Иванов А.И., Наборщиков В.Г.
Санкт-Петербургский государственный университет
Нахождение границ доверительного интервала
параметра гипергеометрического закона
В работе изложено решение задачи вероятностной оценки границ
доверительного интервала параметра гипергеометрического закона,
результаты по оценке численного значения которого содержатся в
работе «Нахождение параметра гипергеометрического закона» на-
стоящего сборника.
Сформулируем задачу работы. Известны значения параметров
k
1
, k и n гипергеометрического закона. Применением результатов из
упомянутой выше работы найдены значения корней вероятностного
гипергеометрического уравнения
F (k
1
, k, n
1
, n) = 0.
(1)
Обозначим значения корней уравнения (1) через n
1(1)
и n
1(2)
в
случае, в котором уравнение (1) имеет два решения, и через n
1(0)
в
случае единственного решения.
Требуется найти границы доверительных интервалов, с вероят-
ностью γ накрывающих неизвестное значение параметра n
1
.
Приступим к решению задачи. Известно, что одно из решений
найдено Л.Н. Большевым [1]. Вместе с тем известно, что возмож-
ности применения результата из [1] ограничены. Будем развивать
указанный подход. С этой целью нами найдено аналитическое вы-
ражение, использование которого позволяет вычислять вероятности
P (k
1
|n
1
≤ n
1
, k, n) при значениях n
1
, изменяющихся от n
1
= k
1
до
n
1
= n − (k − k
1
). Обозначив через b сумму значений вероятностей
P (k
1
|n
1
≤ n
1
, k, n) при всех возможных ограниченных указанными
равенствами значениях n
1
, запишем
b =
n−(k−k
1
)
n
1
=k
1
P (k
1
|n
1
, k, n).
(2)
Использование (2) позволяет записать аналитическое выражение
для функции распределения F (n
1
) величины n
1
, рассматриваемой
как дискретная случайная величина:
208
F (n
1
) = P (k
1
|n
1
≤ n
1
, k, n) =
=
0,
при n
1
< n
1
= k
1
,
1
b
n−(k−k
1
)
n
1
=k
1
P (k
1
|n
1
, k, n),
не существует,
при n
1
> n − (k − k
1
).
(3)
Нетрудно увидеть, что множитель 1/b в правой части выражения
(3) является нормирующим.
Воспользовавшись выражением (3) нетрудно вычислить значение
вероятности γ, с которой значения корней n
1(1)
и n
1(2)
в случае су-
ществования двух решений уравнения (1) или корня n
1(0)
в случае
существования единственного решения будут накрыты доверитель-
ными интервалами со значениями нижнего и верхнего доверитель-
ного пределов n
1(1)
± m, n
1(2)
± m и n
1(0)
± m, где m — натуральное
число, значения n
1(1)
± m, n
1(2)
± m, n
1(0)
± m принадлежат отрез-
ку [0, n]. Отметим специфическую особенность этого результата —
найдены случаи, в которых доверительный интервал значения оце-
ниваемого параметра при заданном значении надежности γ не яв-
ляется единственным. Неединственность доверительного интервала
неизвестного значения параметра гипергеометрического закона под-
тверждается другим методом, описанном в [3].
Выражения (1)–(3) найдены А.И. Ивановым. Для успешного
их применения потребовалось создание специального программно-
го продукта, так как выражения (2) и (3) содержат значения фак-
ториалов, вычисление большого количества которых при больших
значениях, стоящих под знаком факториала чисел, сопряжено со
значительными трудностями. Проиллюстрируем возникающие вы-
числительные трудности примером.
Пример 1. Известно, что 4 ноября 2005 года в Москве состоялась
санкционированная демонстрация национал-патриотического дви-
жения России. По оценке уполномоченных экспертов в демонстра-
ции участвовало от трех до семи тысяч национал-патриотов. Пред-
положим, что мы хотим оценить количество национал-патриотов в
современной России, готовых выйти по призыву руководства на де-
монстрацию. В рамках примера n = 145 · 10
6
— численность населе-
ния России, k ≈ 10 · 10
6
— население Москвы, k
1
= 3000 ÷ 7000. Тогда
для нахождения функции (3) требуется вычислить 145 · 10
6
− k
1
зна-
чений суммы, стоящей в правой части (3). Несмотря на известность
209
выражения Γ(n + 1) = n! и наличие доступных систем символьной
математики (Derive, Maple и т.д.), нахождение выражений (3) вы-
звало значительные трудности.
В.Г.Наборщиковым создан специализированный программный
модуль, использование возможностей которого позволило находить
решения столь громоздких вычислительных задач. Алгоритмиче-
ская часть модуля построена на известных численных методах,
адаптированных к решению данных узкоспециализированных задач.
Наиболее критичные по времени исполнения участки алгоритма бы-
ли разнесены в параллельные потоки там, где это допускает вычис-
лительный процесс. Отдельные функции реализованы с помощью
средств низкоуровневого программирования.
Найденные результаты прошли успешную апробацию при вы-
полнении государственного заказа по оценке наркоситуации среди
учащейся молодежи в СПб, после чего использованы при написа-
нии учебного пособия [2] для служащих государственного аппарата
управления России.
Интерпретацией найденного результата является новое решение
задачи выборочного контроля качества продукции.
Литература
1. Большев Л.Н., Смирнов Н.В. Таблицы математической статисти-
ки. Изд. 3-е. М.: Наука, 1983. 416 с.
2. Иванов А.И. Методы оценки наркоситуации. Учебное пособие для
служащих государственного аппарата управления / Под ред. Р.С.
Минвалеева. СПб.: НПО им. Кузнецова, 2004. 181 с.
3. Иванов М.А. Применение моделирования статистических игр в
задаче оценивания параметра гипергеометрического распределе-
ния / Автореферат диссертации на соискание ученой степени
к. ф.-м. н. Великий Новгород: Новгородский государственный
университет им. Ярослава Мудрого, 2000. 23 с.
210
Иванов А.И., Наборщиков В.Г.
Санкт-Петербургский государственный университет
Нахождение параметра
гипергеометрического закона
Работа содержит новое решение задачи нахождения неизвестно-
го параметра гипергеометрического закона распределения вероятно-
стей по данным выборки.
Известно, что ряд распределения дискретной случайной величи-
ны с гипергеометрическим законом распределения записывается как
P (X = k
1
) =
C
k
1
n
1
C
k−k
1
n−n
1
C
k
n
,
n
1
≤ n, k
1
≤ n
1
, k ≤ n, k
1
≤ k,
(1)
где n — объем генеральной совокупности, k — объем выборки, n
1
—
количество элементов с интересующим нас признаком, содержащих-
ся в генеральной совокупности, k
1
— количество тех же элементов с
интересующим нас признаком, оказавшихся в выборке.
Сформулируем задачу. Пусть значения параметров n, k и k
1
из-
вестны. Найти оценку неизвестного значения параметра n
1
.
Некоторые из решений задачи известны. Например, см. [1]. Будем
искать новое решение задачи.
Известно [2], что при решении задачи нахождения неизвестного
значения оценки параметра n
1
в начале принято находить значе-
ние левой части выражения (1) применением аппроксимации. Вме-
сте с тем известно, что для успешного применения аппроксимации
для оценки значения вероятности P (X = k
1
) необходимо знание зна-
чения параметра n
1
, в нашем случае неизвестного. В пособии [3] в
качестве приблизительной точечной оценки значения параметра n
1
рекомендовано использовать значение k
1
/k. Воспользовавшись ре-
комендацией, перепишем (1)
C
k
1
n
1
C
k−k
1
n−n
1
C
k
n
=
k
1
k
.
(2)
211
Перенеся правую часть выражения (2) в левую, перепишем (2) в
виде уравнения, которое назовем вероятностным гипергеометриче-
ским
F (k
1
, k, n
1
, n) = 0.
(3)
Очевидно, что при известных значениях k
1
, k и n уравнение (3)
является уравнением с одним неизвестным n
1
. Будем искать решение
уравнения (3).
Вследствие того, что левая часть (2) содержит гамма-функции,
величина n
1
не может быть выражена из (3) в виде элементарных
функций. Применив наиболее простое из выражений Стирлинга
n! ∼
√
2πn(n/e)
n
(4)
для аппроксимации значений факториалов к левой части выраже-
ния (2), нетрудно переписать уравнение (3). В дальнейшем изложе-
нии мы сохраним запись уравнения (3) в прежнем виде, но будем
подразумевать, что в нем выполнена замена факториалов исполь-
зованием правой части (4). Кроме того, будем подразумевать, что
в левой части выражения (2) тоже выполнена замена факториалов
использованием формулы (4).
Оценим ошибку, происходящую вследствие замены факториалов.
Доказана лемма 1.
Лемма 1. Предельная относительная ошибка аппроксимации
вероятностного гипергеометрического уравнения по Стирлингу не
превосходит величины δ, для которой справедливо неравенство
δ < e
1/12k
+ e
1/12n
1
+ e
1/12(n−k)
+
+e
1/12(n−n
1
)
+ e
1/12k
1
+ e
1/12n
+ e
1/12(k−k
1
)
+
+e
1/12(n
1
−k
1
)
+ e
1/12(−k+k
1
+n−n
1
)
− 9.
Продолжим решение задачи работы. Будем рассматривать выраже-
ние F (k
1
, k, n
1
, n) в левой части (3) как функцию и найдем ее область
определения. Доказаны леммы 2, 3, 4.
212
Лемма 2. Функция F (k
1
, k, n
1
, n) определена и непрерывна на
отрезке значений величины n
1
, на котором выполнено условие n
1
∈
[k
1
+ 1, n + k
1
− k − 1].
Лемма 3. Функция F (k
1
, k, n
1
, n) определена и непрерывна вме-
сте со своими частными производными F
n
1
, F
k
1
, F
k
и F
n
на от-
резке значений величины n
1
, на котором выполнено условие n
1
∈
[k
1
+ 1, n + k
1
− k − 1]. На границах интервала, в общем случае,
функция принимает разные значения.
Лемма 4. Функция F (k
1
, k, n
1
, n) существует, непрерывна и
дифференцируема на отрезке n
1
∈ [k
1
+ 1, n + k
1
− k − 1] и имеет
максимум на этом отрезке в точке n
∗
1
со значением n
∗
1
= nk
1
/k.
Продолжим решение задачи работы — нахождение оценки неиз-
вестного значения параметра n
1
. Доказана теорема.
Теорема 1. О существовании и единственности решений веро-
ятностного гипергеометрического уравнения F (k
1
, k, n
1
, n) = 0.
Предположим, что
1. Значения
функции
F (k
1
, k, n
1
, n)
на
концах
интервала
n
1
∈ [k
1
+ 1, n + k
1
− k − 1] возможных значений аргумента n
1
отрицательные;
2. Значение функции F (k
1
, k, n
1
, n) в точке n
∗
1
достижения мак-
симума равно некоторому действительному числу η.
Тогда
• при η < 0 уравнение F (k
1
, k, n
1
, n) = 0 не имеет решений;
• при η = 0 уравнение F (k
1
, k, n
1
, n) = 0 имеет решение
n
1
= n
∗
1
и при том единственное;
• при η > 0 уравнение F (k
1
, k, n
1
, n) = 0 имеет два действи-
тельных решения — корни n
1(1)
и n
1(2)
.
Существование корней уравнения F (k
1
, k, n
1
, n) = 0 не означает,
что фактическое количество элементов n
1
в генеральной совокупно-
сти объемом n равно значению корней n
1(1)
или n
1(2)
. Не существо-
вание корней уравнения F (k
1
, k, n
1
, n) = 0 не означает, что фактиче-
ское значение параметра n
1
равно нулю.
213
В качестве результатов исследования свойств корней вероятност-
ного гипергеометрического уравнения доказана теорема 2.
Теорема 2. Если
1. Вероятностное
гипергеометрическое
уравнение
F (k
1
, k, n
1
, n) = 0 в области n
1
∈ [k
1
+ 1, n + k
1
− k − 1] суще-
ствования и непрерывности функции F (k
1
, k, n
1
, n) = 0 имеет
единственное решение n
1
= n
(∗)
1
,
2. Производная F
k
1
(k
1
, k, n
1
, n) в точке (n
(∗)
1
, k
1(0)
) отлична от
нуля,
тогда
• в некоторой окрестности D
∗
точки (n
(∗)
1
, k
1(0)
) уравнение
F (k
1
, k, n
1
, n) = 0 определяет k
1
как однозначную функцию от
n
1
: k
1
= ϕ(n
1
);
• при
n
1
=
n
(∗)
1
эта
функция
принимает
значение
k
1(0)
: (n
1(∗)
) = k
1(0)
;
• функция ϕ(n
1
) непрерывна;
• функция ϕ(n
1
) имеет непрерывную производную
ϕ
n1
(n
1
) = −
F
n1
(k
1
, k, n
1
, n)
F
k1
(k
1
, k, n
1
, n)
.
Леммы 1–4 и Теоремы 1, 2 сформулированы Ивановым А.И.
Наборщиковым В.Г. написаны программы, применение которых
позволяет выполнять компьютерную имитацию процессов, описыва-
емых вероятностными гипергеометрическими уравнениями, и нахо-
дить корни уравнения в случаях, в которых они существуют. Ин-
терпретацией этих процессов является процесс выборочного контро-
ля качества продукции и выборочного социологического обследова-
ния. В основу имитационных программных алгоритмов положена
иерархия специально разработанных базовых классов, моделирую-
щих некоторые общие ключевые свойства процессов. Использование
абстрактных базовых классов и механизма множественного насле-
дования дает возможность существенно расширить исходную иерар-
хию классов, построив новые производные классы, имитирующие
процессы различной природы, также описываемые вероятностными
214
гипергеометрическими уравнениями. Подобный подход в имитаци-
онном моделировании, использующий развитые средства объектно-
ориентированного программирования, позволяет создавать на ос-
нове сравнительно небольших базовых классов развитую и гибко-
настраиваемую систему объектов, наследующих фундаментальные
свойства и методы базовых классов и обладающих собственными
нетривиальными свойствами и методами. Нахождение корней гипер-
геометрических уравнений осуществляется известными численными
методами, адаптированными для решения данного узкого круга за-
дач.
Применением найденных в работе результатов, по государствен-
ному заказу, на базе Национального института здоровья, успешно
решена задача оценки наркоситуации среди учащейся молодежи в
Санкт-Петербурге. Результаты работы использованы при написа-
нии учебного пособия [4] для служащих государственного аппара-
та управления России. Применение результатов работы к оценке
наркоситуации в Санкт-Петербурге одобрено прокуратурой Санкт-
Петербурга.
Литература
1. Колмогоров А.Н. Статистический приемочный контроль при до-
пустимом числе дефективных изделий, равном нулю. Л.: Изд-во
Всесоюзного общества по распространению политических и науч-
ных знаний, 1951.
2. Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Спра-
вочник по теории вероятностей и математической статистике /
Под ред. В.С. Королюка. Изд. 2-е, перераб. и доп. М.: Наука, 1985.
3. Кретов М.Ф. Теория вероятностей и математическая статистика:
учеб. пособие / М.В. Кретов. Калининград: Янтар. сказ, 2004.
4. Иванов А.И. Методы оценки наркоситуации. Учебное пособие для
служащих государственного аппарата управления / Под ред. Р.С.
Минвалеева. СПб.: НПО им. Кузнецова, 2004. 181 c.
215
Кликунова К.А.
Санкт-Петербургский государственный университет
Математическое моделирование переходного
режима сокращения скелетной мышцы
Рекомендовано к публикации профессором Трегубовым В.П.
Все движения человека осуществляются скелетными мышцами.
Они состоят из большого числа мышечных волокон, организованных
в пучки. Волокно представляет собой одну, необычайно крупную,
многоядерную клетку, образовавшуюся путем слияния множества
отдельных клеток. Около двух третей сухой массы волокна прихо-
дится на миофибриллы – цилиндрические нити, идущие от одного
конца волокна до другого. Миофибрилла состоит из приблизитель-
но 10
4
последовательно расположенных однотипных структур – сар-
комеров. Каждый саркомер состоит из двух поперечных z-дисков,
тонких актиновых и толстых миозиновых нитей, которые при со-
кращении мышцы втягиваются друг в друга.
Причиной втягивания является взаимодействие между актино-
выми и миозиновыми нитями. Толстые и тонкие нити способны кон-
тактировать друг с другом в дискретных точках через миозиновые
отростки – мостики. В невозбужденной мышце эти нити не взаимо-
действуют. При поступлении в мышечное волокно возбуждающего
нервного импульса, химический состав среды меняется. Химические
реакции, происходящие при этом, вызывают перестройку белковых
выступов – мостики замыкаются на актиновых нитях, поворачива-
ются вокруг своего основания, развивают тянущее усилие на некото-
ром участке и размыкаются. Это приводит к взаимному скольжению
толстых и тонких нитей.
В конце 60-х годов советским ученым В.И. Дещеревским была
предложена оригинальная схема работы миозинового мостика [2]. В
соответствии со схемой Дещеревского мостик в процессе сокращения
мышцы может находиться в одном из трех состояний – свободном,
216
тянущем и тормозящем. Мостик замыкается на активном центре ак-
тиновой нити и проталкивает ее на расстояние δ, дальше становится
тормозящим, поскольку уже не развивает усилие, но еще не разо-
мкнулся. После этого он размыкается и «мгновенно» возвращается
в равновесное положение. Этот процесс можно представить следую-
щей схемой переходов из одного состояния в другое (см. рис. 1).
Рис. 1. Схема
переходов для
концентрического
сокращения
мышцы
На этой схеме γ – среднее число мостиков на
1 см
2
поперечного сечения, n – среднее число тя-
нущих мостиков, m – среднее число тормозящих
мостиков. Скорость перехода из одного состояния
в другое характеризуется временем пребывания в
том или ином состоянии, а константа перехода –
величина, обратная времени пребывания в этом со-
стоянии. В данном случае k
1
– константа скоро-
сти замыкания свободных мостиков, k
2
– констан-
та скорости размыкания мостиков. Время пребыва-
ния мостика в тормозящем состоянии t =
δ
v
, следо-
вательно, константа скорости перехода в тормозя-
щее состояние t =
v
δ
. Таким образом, согласно этой схеме переходов,
можно записать два уравнения, описывающие динамику мостиков
при концентрическом сокращении и одно уравнение движения груза
на конце мышцы.
Пусть α – общее число мостиков в слое мышцы длиной в половину
саркомера и площадью 1 см
2
, тогда γ = α − n − m.
В итоге система уравнений выглядит следующим образом:
dn
dt
= k
1
(α − n − m) −
v
δ
n,
dm
dt
=
v
δ
n − k
2
m,
dv
dt
=
1
2N M
(f (n − m) − P ),
217
где f – усилие, развиваемое одним мостиком, 2N – число саркоме-
ров в волокне, M – масса мышцы и присоединенной нагрузки, P –
внешняя сила.
Позднее Дещеревский ввел в рассмотрение «супертянущее» со-
стояние p, в которое переходят тянущие мостики при растяжении
мышцы и в котором мостик развивает усилие в 2 раза большее, чем
в тянущем (2f ). Схема переходов из состояния в состояние в случае
удлинения мышцы изображена на рис. 2.
Исходя из этого, система уравнений, описывающая динамику
данной модели, имеет вид:
dn
dt
= k
1
(α − n − p) +
v
δ
n,
dp
dt
= −
v
δ
n − k
3
p,
dv
dt
=
1
2N M
(f (n + 2p) − P ).
Рис. 2. Схема
переходов для
эксцентрического
сокращения
мышцы
При исследовании поведения математической
модели Дещеревского видно, что приближение к
стационарному режиму происходит колебательным
образом. В тоже время модель Дещеревского не
предусматривает смену направления сокращения.
В тот момент времени, когда количество тор-
мозящих мостиков сравняется с количеством тя-
нущих, мышца перестает вырабатывать силу. Это
значит, что при малых значениях внешней нагруз-
ки мышца начинает двигаться только под действи-
ем силы P . При построении такой схемы переходов
возникает вопрос: что будет происходить с замкну-
тыми мостиками, которые остались в тормозящем и тянущем состо-
яниях?
218
Рис. 3. Схема
переходов для
сокращения
мышцы только
под действие
силы P
Предполагается, что пока мышца сокращается
только под действием силы P , и тянущие, и тормо-
зящие мостики только размыкаются (рис. 3). Зна-
чит, система уравнений, описывающая это движе-
ние, будет выглядеть следующим образом:
dn
dt
= −k
−1
n,
dm
dt
= −k
2
m,
dv
dt
=
−P
2N M
.
В нашем случае скорость несколько раз меняет
знак, следовательно, меняется направление сокращения, а это озна-
чает, что схема работы миозинового мостика должна это предусмат-
ривать. В связи с этим пришлось предположить, что при изменении
знака скорости с плюса на минус, оставшиеся после концентриче-
ского сокращения тормозящие мостики не возвращаются в тянущее
состояние, а продолжают размыкаться со скоростью k
2
, пока их ко-
личество не достигнет нуля (рис. 4). При этом после перемены знака
с плюса на минус тормозящий мостик продолжал развивать усилие
−f .
Рис. 4. Схема переходов для
эксцентрического сокращения
мышцы
Таким образом, система уравне-
ний для концентрического сокращения
мышцы запишется в следующем виде:
dn
dt
= k
1
(α − n − m − p) +
v
δ
n,
dm
dt
= −k
2
m,
dp
dt
= −
v
δ
n − k
3
p,
dv
dt
=
1
2N M
(f (n − m + 2p) − P ).
219
При изменении знака скорости с минуса на плюс оставшиеся по-
сле эксцентрического сокращения супертянущие мостики продолжат
размыкаться со скоростью k
3
, пока их количество не достигнет ну-
ля (рис. 5). При этом усилие, развиваемое супертянущим мостиком,
будет равным +2f :
Рис. 5. Схема переходов для
концентрического сокращения
мышцы
dn
dt
= k
1
(α − n − m − p) +
v
δ
n,
dm
dt
=
v
δ
n − k
2
m,
dp
dt
= −k
3
p,
dv
dt
=
1
2N M
(f (n − m + 2p) − P ).
При численном решении начало дви-
жения по инерции или изменение знака
скорости v служит сигналом для переключения программы с одной
системы дифференциальных уравнений на другую, причем послед-
ние численные значения решения первой системы послужат началь-
ными данными для второй.
В ходе численных экспериментов наиболее правдоподобными ока-
зались результаты для случая, когда усилие тормозящих или супер-
тянущих мостиков не меняло своего знака. В других случаях наблю-
дался резкий скачек в силе, вырабатываемой мышцей, что требует
более детального изучения и уточнения модели.
Литература
1. Хилл А. Механика мышечного сокращения. М.: Мир, 1972.
2. Дещеревский В. И. Математические модели мышечного сокраще-
ния. М.: Наука, 1977.
3. V.Tregoubov, G.Sokoloff, V.Baranov. Kinetic theory and mechanical
models of skeletal muscle // Lecture Notes of ICB Seminars, 2000.
P. 127–144.
220
Коробова Е.Л., Трояножко О.А.
Рссийский государственный педагогический
университет им. А.И. Герцена,
Санкт-Петербургский государственный университет
Применение математических методов
в исследовании особенностей когнитивных стилей
у больных шизофренией
Рекомендовано к публикации доцентом Колесиным И.Д.
Цели работы – изучение возможности использования решающих
функций в задачах психодиагностики и сравнение с результатами
классического статистического подхода.
Введение. Проблематика когнитивных стилей была и остается
одной из самых спорных областей психологии. Ставшее популярным
в 60-е годы, понятие «когнитивный стиль» привлекает внимание в
силу своих особенностей и с точки зрения теории, и как предмет эм-
пирических исследований. Под когнитивным стилем принято пони-
мать присущий человеку индивидуально-своеобразный способ пере-
работки информации о своем окружении. Другими словами, стиле-
вой когнитивный подход — это попытка анализа устройства и форми-
рования индивидуального ума [2]. Проведенный теоретический ана-
лиз позволил сформулировать гипотезу исследования для эмпириче-
ской проверки: когнитивные стили, как характеристики когнитивно-
го опыта человека, участвуют в клинической динамике заболевания,
влияя на его форму и течение. С учетом особенностей когнитивной
сферы должны строиться мероприятия по реабилитации больных.
Это позволит оптимизировать подход как к прогнозу течения за-
болевания, так и к организации адекватных мероприятий в рамках
медико-психологической реабилитации больных. В ходе исследова-
ния примененяются математические методы для повышения эффек-
тивности профилактики и медико-психологической помощи больным
шизофренией [1]. В качестве объекта исследования выступали паци-
енты психоневрологического диспансера, которые образовали основ-
ную группу – 80 человек. Контрольную группу составили здоровые
221
испытуемые – 40 человек. Материалы исследования содержат ре-
зультаты обследования и тестирования 120 человек. Средний возраст
пациентов составил 36,06 лет, от 18 до 50 лет, количество мужчин
– 50 человек, женщин – 30 человек. В контрольной группе сред-
ний возраст составил 27,10 лет, мужчин – 18 человек, женщин – 22
человека. Для статистической обработки полученных данных была
создана таблица, в которой было установлено соответствие между
социально-демографическими характеристиками, результатами те-
стов, показателями течения заболевания и показателями внутренней
картины болезни. Общая матрица данных состояла из 120 строк и
76 столбцов. Переменные были сгруппированы в 4 блока:
1. Блок социально-демографических характеристик;
2. Блок тестовых показателей;
3. Блок показателей течения заболевания;
4. Блок показателей внутренней картины болезни.
В итоге, был возможен сравнительный анализ двух независимых вы-
борок: больных с параноидальной и простой формой шизофрении.
Постановка задачи. Имеется набор из двух независимых вы-
борок. Необходимо с помощью математического метода определить
принадлежность элемента к одной их этих выборок.
Пусть d(x) = w
1
x
1
+w
2
x
2
+w
3
= 0 – уравнение разделяющей пря-
мой, где w
i
– параметры, а x
1
и x
2
– переменные. Очевидно, что под-
становка в d(x) любого образа, принадлежащего классу ω
1
, даст по-
ложительное значение. Отрицательное значение функция d(x) при-
мет при подстановке образа, относящегося к классу ω
2
. Таким об-
разом, функцию d(x) можно использовать в качестве решающей,
или дискриминантной функции, поскольку, рассматривая образ x,
классификация которого неизвестна, можно утверждать, что образ
x принадлежит классу ω
1
, если d(x) > 0, и классу ω
2
, если d(x) < 0.
Если образ лежит на разделяющей границе, имеет место случай,
соответствующий условию неопределенности d(x) = 0 [3]. Простой
пример двумерной линейной решающей функции, можно легко обоб-
щить на n-мерный случай, т.к. в нашем исследовании используется
76 признаков. Каждый признак рассматривается как i–ое измерение.
Общий вид линейной решающей функции задается формулой
222
d(x) = w
1
x
1
+ w
2
x
2
+ · · · + w
n
x
n
+ w
n+1
= w
◦
x + w
n+1
,
(1)
где вектор w
◦
= (ω
1
, . . . , ω
n
) называется весовым или параметриче-
ским. Общепринято во все векторы образов вводить после последней
компоненты единицу и представлять соотношение (1) в виде
d(x) = w x,
где x = (x
1
, . . . , x
n
, 1) и w = (ω
1
, . . . , ω
n
, ω
n+1
) – пополненные век-
торы образов и весов, соответственно.
Рис. 1. Пример простой решающей функции для случая разделения образов
на два класса
Предполагается, что в случае разбиения на два класса решающая
функция d(x) обладает следующим свойством:
d(x) = w x
> 0, если x ∈ ω
1
,
< 0, если x ∈ ω
2
.
Обработка данных и методы анализа результатов. Исполь-
зование решающих функций – только один из подходов к описан-
223
ной задаче разделения больных простой и параноидной формы ши-
зофрении. При обработке полученных результатов с помощью ме-
тодов математической статистики были выявлены некоторые раз-
личия в особенностях когнитивных стилей у больных параноидной
и простой формой шизофрении. Например, достоверные различия
между группами больных с параноидной и простой формой шизо-
френии отмечаются по трем показателям: продуктивности, коэффи-
циенту имплицитной обучаемости и показателю интегрированности
словесно-вербального и сенсорно-перцептивного опыта. У больных с
параноидной формой эти показатели значимо выше, чем у больных
с простой формой. Это позволяет нам утверждать, что в случаях
простой формы шизофрении в большей степени нарушаются инди-
видуальные способы восприятия, оценивания и интерпретации дей-
ствительности, а также в большей степени нарушается сформиро-
ванность непроизвольного интеллектуального контроля. У группы
больных простой формой сильнее изменяются особенности струк-
турирования видимого поля, а именно, они в большей степени за-
трудняются в выделении значимых его элементов, их самообучение
в новых условиях заметно медленнее и страдает в большей степени;
может быть, это связано, в том числе, с большей трудностью инте-
грации словесно-вербальных и сенсорно-перцептивных форм опыта.
Использование разных методов позволяет получить более объектив-
ную информацию о течении заболевания, а также дать прогноз об
эффективности лечения.
Литература
1. Сидоренко Е.В. Методы математической обработки в психологии.
СПб.: Речь, 2004. C. 49–52.
2. Холодная М.А. Когнитивные стили. СПб.: Питер, 2004. C.
161–163.
3. Gonzalez R.C., Tou J.T. Pattern recognition principles. California:
Addison-Wesley, 1974. P. 53–55.
224
Куренной Д.Н.
Санкт-Петербургский государственный университет
Постановка задачи
литодинамического моделирования
Рекомендовано к публикации профессором Токиным И.Б.
В настоящее время в связи с глобальными изменениями климата,
повышением тектонической активности, а также усилением и кон-
центрацией различных проявлений техногенеза, особую остроту при-
обретают вопросы выявления оценки, контроля и прогноза развития
так называемых геологических опасностей эндогенной, экзогенной и
техногенной предопределенности.
Наиболее четко эти опасности проявляются в условиях береговой
зоны, охватывающей сопряженные площади прибрежного морско-
го дна и приморской суши. Причинами такого положения служат
повышенная или высокая геодинамическая активность специфиче-
ского переходного геоблока береговой зоны [1].
Отдельная группа геологических опасностей формируется за
счет взаимовлияния техногенных факторов на геологическую сре-
ду и геологической среды на техногенез именно в береговой зоне.
Такое положение становится понятным, если принять во внимание,
что в береговой зоне сосредоточены около 70% всех процессов жиз-
недеятельности и жизнеобитания человека.
В ряду экзогенных геологических процессов, большинство кото-
рых относится к геологическим опасностям, прежде всего, выделя-
ются абразия (размыв) берегов и подводных береговых склонов, экс-
тремальная заносимость или обмеление, оползни, осыпи, эрозия и
дефляция, а также процессы морского ледового воздействия. В от-
личие от эндогенных процессов, которые происходят внутри земли
(образование разломов, землетрясения), на последствия которых че-
ловек повлиять не в состоянии, разрушительные последствия экзо-
генных геологических процессов во многих случаях человек может
предотвратить.
Все сказанное имеет самое прямое отношение к ситуации в Бал-
тийском море и его береговой зоне.
225
Еще более широкое поле открывается при рассмотрении техно-
генных проявлений в Регионе, что связано со строительством КЗС,
новым портовым строительством, прокладкой коммуникаций, под-
водными карьерами, транспортом и т.д. [3].
Следовательно, экзогенные и техногенные проявления геологи-
ческих процессов наиболее наглядно иллюстрируют динамику изме-
нений береговой зоны в Финском заливе. Для большего понимания
ситуации мы ограничимся следующими примерами.
Пример 1. На северном побережье Финского залива в районе
мыса Дубовской наблюдается размыв берега, причем подобная си-
туация продолжается уже на протяжении длительного времени. На
фотографии, сделанной в начале XX века, можно видеть подмытые
корни дубов – это результат абразии (рис. 1). В данном случае мы
наблюдаем исключительно экзогенный процесс.
Рис. 1. Размыв берега на мысе Дубовской, начало XX века
В 1980-е года берег здесь был укреплен бетонными волноотбой-
ными стенками. Их пологие склоны довольно хорошо гасили энер-
гию волн, однако в проекте была допущена существенная ошибка:
построены гранитные спуски к воде с вертикальными стенками, что
недопустимо. В результате, к настоящему времени спуски оказались
226
практически полностью разрушены волнами и, как «слабое звено»,
провоцируют разрушение всего сооружения (рис. 2).
Немного западнее, около п. Комарово, также происходит процесс
абразии, только не берега, а подводного склона (рис. 3).
Рис. 2. Частичное разрушение берегозащитных укреплений на мысе Дубовской
Рис. 3. Изменение глубин
на подводном береговом
склоне напротив п.
Комарово
В данном случае это экзогенно-техно-
генный процесс. Дело в том, что в 1969
году западнее рассматриваемой области,
у мыса Песчаный, была начата разработ-
ка песчаного месторождения. К 1992 го-
ду было намыто 140–160 млн. м
3
песка.
Причем в непосредственной близости от
берега, хотя разработка подобных карье-
ров должна быть строго ограничена изо-
батами 5–6 м. Принимая во внимание то,
что появился дефицит наносов, питающих
береговой склон около п. Комарово, дела-
ем вывод, что произошел его размыв, и
тем самым возник существенный сдвиг 5-
метровой изобаты в сторону берега.
Пример 2. На южном побережье
Финского залива в районе п. Лебяжье на-
блюдается интенсивное изменение профи-
ля береговой линии. Здесь в течение последних 20 лет на некоторых
участках рассматриваемой территории происходит размыв песчаных
227
тел с транспортом материала на другие участки – следовательно,
происходит рост песчаных кос [3]. Этот процесс хорошо проиллю-
стрирован результатами обработки данных натурных исследований
весны-лета 2005 года (ВСЕГЕИ) и сравнения их с архивными мате-
риалами (рис. 4).
Рис. 4. Изменение береговой линии около п. Лебяжье
На основании представленных примеров становится понятным,
что в Финском заливе активно развиты литодинамические процессы.
А в связи с все более и более развивающейся инфраструктурой ак-
ватории необходимо прогнозирование данных процессов на перспек-
тиву, что обеспечит безопасную эксплуатацию гидротехнических со-
оружений, трубопроводов и различного вида линий связи.
Например, только расширение одного Васильевского острова по
проекту «Морской фасад» может существенно отразиться на про-
цессах, происходящих на берегах залива, в курортных зонах, а в
особенности на тех участках, откуда будет поставляться насыпной
материал.
В соответствии с вышесказанным, для любого гидротехническо-
го строительства на акватории или в береговой зоне Финского за-
лива важной задачей является построение математической модели,
которая бы описывала транспорт донных осадков в пределах задан-
ных участков. Это даст возможность, совместно со своевременным
мониторингом берегов и подводных склонов, до минимума свести
неблагоприятные последствия экзогенных и техногенных процессов,
проходящих в береговой зоне, что, в свою очередь, положительно
скажется на общей экологической обстановке в регионе.
228
За длительный период проведения научно-исследовательских ра-
бот на берегах и акватории Финского залива (ВСЕГЕИ, отдел Реги-
ональной геоэкологии и морской геологии) был накоплен обширный
материал, статистическая обработка которого позволит нам распола-
гать исходными данными для построения литодинамической модели
данного района.
Литература
1. Куренной Д.Н., Спиридонов М.А., Суслов Г.А. Геологические
опасности в Балтийском море и его береговой зоне // Сборник
тезисов VII Международного экологического форума «День Бал-
тийского моря», СПб, 22–23 марта 2006 (в печати).
2. Спиридонов М.А., Рябчук Д.В., Суслов Г.А., Нестерова Е.Н. Ли-
тодинамические аспекты геоэкологии береговой зоны восточной
части Финского залива // Сборник материалов 6-й Международ-
ной конференции «Акватера», СПб, 2003. С. 138–140.
3. Riabtchouk D.V., Nesterova E.N., Spiridonov M.A., Suslov G.A.,
Fedorova E.K. The coastal zone dynamics of the eastern Gulf of
Finland // The Baltic. The eight marine geological conference.
Abstracts, Tartu, 2004. P. 45.
4. Suslov G.A., Riabtchouk D.V., Nesterova E.N., Fedorova E.K.
Southern coastal zone of the eastern Gulf of Finland development
(from Lebyazhye settlement to St. Petersburg flood protective dam)
// The Baltic Sea changing ecosystem. Abstracts, Sopot, Poland,
2005. P. 159–160.
229
Куренной Д.Н.
Санкт-Петербургский государственный университет
Статистическая обработка данных морских
инженерных изысканий для прокладки
межконтинентальной оптической линии связи
в Арктических морях
Рекомендовано к публикации доцентом Корниковым В.В.
В 2004 г. в России в полном объеме стартовало сразу три телеком-
муникационных проекта, масштабы которых превышают даже стро-
ительство национальных сотовых сетей. Речь идет о создании вдоль
всей российской территории магистральных волоконно-оптических
транспортных линий, основной задачей которых является транзит
трафика из Азии в Европу. Стоимость каждого из проектов оцени-
вается более чем в $1 млрд. Реализация хотя бы одного из проектов
внесет значительные коррективы в традиционные маршруты меж-
дународного голосового трафика и данных, а Россию сделает зако-
нодателем моды на рынке евроазиатского телекоммуникационного
транзита.
Новые коммерческие проекты реализуют три компании: FTA
Enterprises Ltd., «Поларнет Проект» и «Евразия Телеком». Каждая
из них избрала свой путь прокладки кабеля.
Например, FTA получила от РАО «ЕЭС России» эксклюзивное
право прокладки волоконно-оптических кабелей вдоль российских
линий электропередач (ЛЭП), но лишь по одному маршруту. Прав-
да, его протяженность составляет 24 тыс. км, что вдвое превышает
размеры России с востока на запад. «Евразия Телеком» также пред-
полагает тянуть кабель по суше.
«Поларнет Проект» пошел по кардинально иному пути. Весь его
магистральный кабель вдоль территории России будет проложен под
водой – по дну российских арктических морей. Протяженность толь-
ко российского участка трассы составит около 6500 км. Компания
намерена связать три континента: Америку, Европу и Азию, про-
ложив кабель по маршруту Лондон – Киркинес – северные моря
в границах экономической зоны России – Дач Харбор (Алеутские
230
острова, США). В Дач Харборе произойдет разветвление кабельной
системы на две трассы: одна пойдет до Чибо (Япония) и Шанхая
(Китай), а вторая – до Портланда (США). Пока все пункты являют-
ся предположительными. Общая протяженность кабельной системы
«Поларнет Проект» составит около 18 тыс. км.
Сеть «Поларнет» создается двумя компаниями: российским ЗАО
«Поларнет Проект» и британской фирмой Polarnet Project Ltd. (Лон-
дон).
Несмотря на разные маршруты и способы прокладки волоконно-
оптического кабеля, идеология всех трансроссийских кабельных про-
ектов схожа: они хотят замкнуть телекоммуникационный транзит
Азия – Европа по кратчайшему пути – через территорию России,
тогда как сейчас весь этот трафик идет через Северную Америку.
Для исследования местоположения, условий и вариантов про-
кладки ВОЛС по проекту «Поларнет» была организована экспеди-
ция, состоящая из высококлассных специалистов. Вся предполагае-
мая трасса кабеля была разбита на 3 участка: Западный, Централь-
ный и Восточный.
В августе–октябре 2002 года одновременно реализуются изыска-
ния на Восточном и Западном участках с помощью двух исследо-
вательских судов. В сентябре того же года оба судна столкнулись
с непреодолимым препятствием – арктическими льдами, в которых
исследования подобного рода не проводились в мире еще никогда.
В 2003 году формируется вторая экспедиция, более сложная и
интересная по своим целям и задачам. Заблаговременный анализ
прогностической ледовой информации вдоль изыскиваемой трассы,
выполненный совместно специалистами ААНИИ и штабом ледовых
операций Западного сектора Арктики, показал, что около 60% марш-
рута изысканий будет проходить во льдах сплоченностью 9–10 бал-
лов.
В июле 2003 года из порта Мурманск в Карское море выходит
караван, состоящий из 2 крупнотоннажных судов усиленного ледо-
вого класса: атомного ледокола «Советский Союз» и транспортного
судна класса СА-15 «Кола».
Изыскания выполнялись с целью определения оптимального
маршрута прокладки кабельной линии «Поларнет» в Центральной
231
зоне (арктические моря), обеспечения ее надежности, сохранности и
последующего обслуживания, а также осуществления сбора данных,
необходимых для принятия взвешенных инженерных и обоснован-
ных проектных решений.
Комплекс изысканий по трассе волоконно-оптической линии свя-
зи «Поларнет» на российском участке в Центральной зоне включал
следующие работы.
Гидрографические и геофизические работы. Наиболее важ-
ными данными для проектирования волоконно-оптической линии
связи являются батиметрическая информация, гидролокационная
картина и геофизический разрез грунтов морского дна. Технология
съемки в условиях чистой воды на глубинах до нескольких сотен
метров в настоящее время доведена до совершенства и не требует от
разработчиков аппаратуры и пользователей каких-либо специаль-
ных мероприятий для ее практического применения. Изыскатель-
ские работы в морях с ледовым покровом под проводкой ледокола
практически до настоящего времени не проводились. Таким образом,
изыскания трассы морского кабеля связи в арктических морях с т/х
«Кола» (обеспечивался специально разработанной ледовой защитой)
и а/л «Советский Союз» вполне могут претендовать на уникаль-
ность. Результатом данного этапа экспедиции явилось составление
по трассе обследования батиметрических карт с шагом изобат 1 м,
карт акустических изображений и планшетов акустического профи-
лирования грунта общей длиной порядка 10 000 км и полосой обзора
примерно от 0,8 до 1,0 км [1].
Геологические работы. Так как волоконно-оптический линия
будет прокладываться непосредственно по поверхности морского
дна, а в некоторых случаях и заглубляться в грунты, то важны-
ми данными являются результаты анализов физико-химических и
физико-механических свойств 178 отобранных по трассе изыска-
ний проб. Что, во-первых, дает возможность определения категорий
грунтов по трудности разработки и, во-вторых, дает представления
об условиях, в которых будет находиться кабель. Также здесь изу-
чаются современные геологические процессы и явления, знание ко-
торых необходимо для правильного проектирования, строительства
и эксплуатации линии связи большой протяженности.
232
Гидрометеорологические работы. В период изысканий про-
водились наблюдения за природными (физико-географическими)
особенностями района. Здесь можно выделить:
• оперативное получение данных о вертикальной структуре тем-
пературы, солености и скорости звука в воде для обеспече-
ния высокоточными поправками производства гидроакустиче-
ских и геофизических измерений. За весь период изысканий
количество измерений скорости звука составило 11885. Изме-
рение температуры и солености воды производилось на гидро-
логических станциях при помощи CTD-зондов 3"Micro CTD и
"Seamon". В общей сложности было выполнено по 5495 изме-
рений каждой характеристики;
• гидрометеорологические и ледовые наблюдения, включая из-
мерение течений. За весь период изысканий было получено 729
мгновенных измерений скорости и направления течений, по ко-
торым рассчитано 258 осредненных значений;
• обеспечение изысканий данными по уровню моря, полученны-
ми при помощи автономных мареографов (общее число изме-
рений 2506), сведениями береговых и островных гидрометео-
рологических станций и постов (всего 3982), а в районах, не
охваченных наблюдениями – путем использования гидродина-
мических и статистических моделей;
• описание природно-климатических характеристик по трассе
для выявления основных особенностей условий прокладки и
эксплуатации подводного кабеля (направления и скорости вет-
ра, ход атмосферного давления, уровни ледовой обстановки,
температура окружающего воздуха).
В результате визуализации данных, полученных на этом этапе
работ, были построены вертикальные разрезы и поля распределения
основных гидрологических характеристик [2].
Для обработки всего объема данных, полученного за время экс-
педиции, были использованы методики расчета стандартных стати-
стических показателей. Производилась фильтрация статистических
рядов. Применялись статистические критерии для оценки соответ-
ствия между эмпирическим и теоретическим законами распреде-
ления величин. Рассчитывались коэффициенты корреляции. Также
233
было проведено сравнение при помощи методов математической ста-
тистики экспедиционных данных с архивными, собранными более
чем за 40 лет изучения северных морей.
В процессе комплексной обработки результатов выявилась труд-
ность совмещения данных, полученных различными набортными ап-
паратурными комплексами. Каждый из них имеет свою методику
и соответствующее программное обеспечение, которые практически
всегда не позволяют вести совместную обработку и учитывать вза-
имное влияние изучаемых параметров, часто находящихся в прямой
зависимости.
Данные сложности показали необходимость перехода от струк-
турного подхода в обработке данных к системному, что, в свою оче-
редь, повысит общее качество и многократно сократит время интер-
претации результатов исследований.
В заключение следует отметить, что за период июль-сентябрь
2003 года было выполнено 5089,6 миль (9426 км) комплексных изыс-
каний во льдах, проведен полный анализ полученного материала и,
основываясь на результатах экспедиции, уже спроектирована и гото-
вится к строительству межконтинентальная волоконно-оптическая
линия связи по проекту “Поларнет”. Однако, в 2005 году было при-
нято решение увеличения общей протяженности трассы. В 2006–2007
годах планируется проведение полного комплекса изысканий для
проектирования “отводов” от основной ветви к северным и восточ-
ным берегам Российской территории.
Литература
1. Инженерные гидрографические изыскания по трассе подводно-
го волоконно-оптического кабеля связи системы «Поларнет». Рос-
сийская часть. Центральный участок. Технический отчет. Часть
I, 2003.
2. Инженерные гидрометеорологические изыскания по трассе под-
водного волоконно-оптического кабеля связи системы «Полар-
нет». Российская часть. Центральный участок. Технический от-
чет. Часть II, 2003.
234
Лещева Ю.В., Орехов А.В.
Санкт-Петербургский государственный университет
О возможном критерии завершения процесса
кластеризации в евклидовом пространстве
Введение. В область многомерных статистических задач иссле-
дователь вступает, как только принимается за изучение как мини-
мум двух случайных признаков. Безразлично, идет ли при этом речь
об аналитических группировках, математических методах корреля-
ции, дисперсионном анализе. Развитие исследований в этом направ-
лении естественным образом приводит к увеличению размерности
изучаемых объектов. В области математико-статистических методов
речь идет о множественной корреляции, дисперсионном анализе и
т.п. На этом пути по мере углубления исследования рассматрива-
ются связи все большего числа признаков, но при этом возникают
трудности технического характера.
С позиции эмпиризма сам переход от частных значений к обоб-
щенным характеристикам есть реализация принципа “экономии мыш-
ления”. Но фатальное возрастание числа изучаемых параметров при
комплексном рассмотрении взаимосвязей многих признаков оказы-
вается в полном противоречии с этим принципом. Исследователь
снова стоит перед лицом огромной массы индивидуальных наблю-
дений. Так возникает задача обратного сведения множества харак-
теристик к небольшому ряду обобщающих итогов, выражающему
действительно существенное, закономерное для изучаемого явления.
Неизбежным становится либо отсечение большинства признаков и
возвращение к малоразмерным классическим задачам, либо объеди-
нение признаков, замена совокупностей значений какой-то одной,
вполне возможно, что искусственной характеристикой. Так появля-
ется направление, получившее название “многомерный анализ”. Его
развитие составляет одну из новых ступеней в математической ста-
тистике.
В многомерном анализе образовались разделы, которые находят-
ся в тесном соприкосновении друг с другом. Наиболее ярко отража-
ет черты многомерного анализа при классификации объектов кла-
стерный анализ. Эти разделы, закономерно обусловленные развити-
ем математико-статистических методов и практики их применения,
несут в себе новые возможности для решения многих прикладных
235
задач, какими не располагают “классические” методы. Задача в том,
чтобы, используя приемы многомерного анализа, согласовать их тео-
ретическую трактовку и применение с основными принципами ста-
тистического исследования.
Кластерный анализ — совокупность методов, позволяющих груп-
пировать и классифицировать «многомерные» случайные экспери-
менты [1]. Результат каждого эксперимента можно описать упоря-
доченным набором вещественных чисел, соответствующих значени-
ям измеряемых в случайном эксперименте параметров. Целью кла-
стерного анализа является образование групп схожих между собой
результатов наблюдений, которые принято называть кластерами.
Рис. 1. Два ясно
выраженных кластера и
три изолированных
точки
Наиболее существенные методические
черты кластерного анализа сводятся к двум:
образование единой меры, охватывающей
ряд признаков, и чисто количественное ре-
шение вопроса о группировке объектов на-
блюдения. Но здесь сразу же возникают за-
труднения. Метрик много – какой отдать
предпочтение [1] ? Кроме того, в евклидо-
вой метрике результат зависит от масштаба
выбранных единиц измерения. Правда, есть
способ выйти из затруднения путем норми-
рования признаков. Но нельзя утверждать в
общем случае, что для всех признаков, на-
пример, квадратичное отклонение одинако-
во значимо. Если речь идет о качестве научного исследования в под-
линном смысле слова, то ни метрики, ни масштабы здесь не произ-
вольны.
Другое дело формально-количественная кластеризация. Ее цели:
представить в сжатом виде массив информации с его многомерно-
стью, но так, чтобы потеря информации не была чрезмерной. Здесь
нет жестких объективных требований, и решение может быть раз-
личным. То же можно сказать по поводу любой “аналитической”
группировки.
Особо важное место кластерный анализ занимает в тех отраслях
науки, где изучаются массовые явления и процессы. Здесь необхо-
димость развития методов кластерного анализа и их использования
продиктованы, прежде всего, тем, что они помогают построить науч-
236
но обоснованные классификации и выявить внутренние связи между
единицами наблюдаемых совокупностей.
Постановка задачи. Пусть множество X = {X
1
, . . . , X
n
} обо-
значает n случайных экспериментов. Каждому случайному экспери-
менту ставится в соответствии ρ-мерный вектор X
i
= {X
i
1
, . . . , X
i
p
},
компонентами которого являются численные значения измеряемых
параметров. По сути, кластерный анализ заключается в разбиении
множества векторов на непересекающиеся классы эквивалентности
– кластеры, которые мы будем обозначать K = {K
1
, . . . , K
m
}, где
m ≤ n. Кластер K
j
состоит из векторов X
h
1
, . . . , X
h
j
(h
j
– количе-
ство векторов в j-ом кластере) [1]. Подчеркнем, что h
1
+. . .+h
m
= n.
Задача кластерного анализа заключается в том, чтобы разбить
множество объектов X на m кластеров так, чтобы каждый объект X
принадлежал одному и только одному подмножеству разбиения. При
этом объекты, принадлежащие одному и тому же кластеру, должны
быть сходными в некотором смысле, в то время как объекты, принад-
лежащие разным кластерам, можно было бы считать разнородными
в том же смысле.
В общем случае, решением задачи кластерного анализа являет-
ся разбиение, удовлетворяющее некоторому критерию оптимально-
сти. Этот критерий может представлять собой некоторый функцио-
нал, выражающий уровни «желательности» различных разбиений и
группировок. Такой функционал часто называют целевой функцией.
Например, в качестве целевой функции можно взять внутригруппо-
вую сумму квадратов отклонений.
Для того, чтобы решить задачу кластерного анализа, необходимо
определить такие понятия, как “сходство” и “разнородность”. Напри-
мер, из выше изложенного следует: i-й и j-й объекты попадают в
один кластер всякий раз, когда расстояние между соответствующи-
ми точками X
i
и X
j
“достаточно мало” в некотором заранее огово-
ренном смысле.
Два наиболее близко расположенных объекта X
i
и X
j
объединя-
ются и рассматриваются как один кластер. Это приводит к тому, что
число объектов на каждом шаге процесса кластеризации уменьша-
ется, и если объектов на предыдущем шаге было n, то на следующем
их число станет равным n − 1. В рассмотренном алгоритме исполь-
зуются интуитивные представления о расстоянии между объектом и
кластером и расстоянии между двумя кластерами.
237
Неотъемлемой частью задачи кластерного анализа является по-
нятие оптимального критерия, которое позволяет установить, когда
достигается желательное разбиение. Для введения подобного кри-
терия необходимо найти меру внутренней однородности кластера и
меру разнородности кластеров между собой.
Несмотря на огромное количество работ, посвященных «матема-
тической теории» кластерного анализа, до сих пор нет исчерпыва-
ющего ответа на вопрос, когда следует заканчивать процесс класте-
ризации данных.
Описание алгоритма. На интуитивном уровне понятно, что во
время кластеризации мы группируем вместе точки, близкие друг от-
носительно друга, согласно выбранной метрике, и прекращаем про-
цесс кластеризации, когда начинаем присоединять либо изолирован-
ные точки (в известном смысле), либо объединять вполне оформлен-
ные (опять же в известном смысле) кластеры.
Можно предположить, что наиболее естественным является объ-
единение в так называемый “динамический” кластер двух точек,
расстояние между которыми минимально. “Динамический” кластер
– кластер, который получается до окончания процесса кластериза-
ции. Заметим, что на первом шаге кластеризации мы имеем дело
действительно только с точками. На следующих шагах кластериза-
ции точки, объединенные в “динамические” кластеры, заменяются
какой-либо обобщенной величиной, например, центром тяжести то-
чек, объединенных в общий “динамический” кластер. Поэтому на
втором и последующих шагах кластеризации под точками понима-
ются собственно точки и центры тяжести уже сформированных “ди-
намических” кластеров.
Также наиболее естественным представляется завершение про-
цесса кластеризации в моменты инцидентного изменения математи-
ческого ожидания квадрата отклонения точек, входящих в “динами-
ческий” кластер от его центра тяжести. Таким образом, если коор-
динаты центра тяжести рассматривать как математическое ожида-
ние координат точек, принадлежащих данному кластеру, то упомя-
нутое выше математическое ожидание квадрата отклонения можно
рассматривать как дисперсию координат точек, входящих в данный
кластер.
В данной работе рассматривается попытка реализации частно-
го случая указанного выше подхода. На плоскости произвольным
238
образом выбираются n точек, которые мы отождествляем с резуль-
татами некоторого набора случайных экспериментов, в которых ис-
следуются два параметра. На этом множестве реализуется следу-
ющий алгоритм процесса кластеризации. При помощи евклидовой
метрики точки на плоскости группируются в кластеры следующим
образом. На первом шаге выбирается пара точек, расстояние меж-
ду которыми минимально. Если таких пар несколько, то выбирается
последняя. Две выбранные точки объединяются в “динамический”
кластер. Обобщенной величиной, характеризующей этот кластер, яв-
ляется центр тяжести для входящих в него точек, при условии, что
все точки из исходной совокупности обладают единичной массой. На
следующем шаге рассматривается n − 1 точка, причем n − 2 точки
являются собственно точками исходной совокупности, а еще одна –
описанный выше центр тяжести. Из n−1 точки выбираются две, рас-
стояние между которыми минимально. Если таких пар несколько,
то вновь выбирается последняя. Точки из этой пары объединяются
в “динамический” кластер и т.д. На каждом шаге точки, принадле-
жащие одному “динамическому” кластеру, заменяются точкой, соот-
ветствующей их центру тяжести. Таким образом, на каждом шаге
рассматриваемых точек становится на единицу меньше.
Очевидно, что за n − 1 шаг точки исходной совокупности будут
объединены в один общий для всех кластер, что является абсур-
дом. Поэтому целью исследования была выработка аналитического
критерия завершения процесса, т.е. поиск аналитических признаков
таких явлений, как присоединение изолированных точек или объ-
единение сформированных кластеров. В качестве рабочей гипотезы
было выдвинуто предположение, что эти явления должны сопровож-
даться резким увеличением дисперсии внутри кластеров.
Численные эксперименты и их результаты. Численные экс-
перименты проводились с набором данных, схематичное изображе-
ние которого приводится на рис. 1. Оцифровка координат точек про-
водилась вручную. Во время численных экспериментов отслежива-
лись следующие величины: номер шага процесса кластеризации, ко-
личество точек в каждом из “динамических” кластеров, координаты
центров тяжести “динамических” кластеров, расстояние, на которое
смещался центр тяжести в каждом из кластеров, значение диспер-
сии внутри кластеров. Было замечено, что на регулярной решетке,
которую можно отождествить с кластером, функция, которая уста-
239
навливала соответствие между номером шага процесса кластериза-
ции и значением дисперсии, близка к линейной, т. е. для регулярной
решетки такая функция должна достаточно точно аппроксимиро-
ваться при помощи линейной регрессии.
Для произвольного набора данных также было замечено, что за-
висимость между номером шага и величиной дисперсии в «динами-
ческих» кластерах также близка к линейной. И, напротив, при сли-
янии “динамических” кластеров или присоединении изолированных
точек происходит резкое увеличение дисперсии.
Можно выдвинуть следующую гипотезу: критерием завершения
процесса кластеризации в евклидовом пространстве может быть рез-
кое увеличение дисперсии во всех “динамических” кластерах од-
новременно. Аналитически это явление можно попытаться обнару-
жить, сравнивая линейную и экспоненциальную регрессию значений
дисперсии на трех последних шагах процесса кластеризации. В этом
случае (резкий скачок дисперсии) экспоненциальное приближение
должно дать меньшую погрешность, нежели линейное. В случае по-
лучения соответствующих формул этот критерий может быть реали-
зован программно. Подтверждение или опровержение этой гипотезы
требует дальнейшего исследования.
Актуальность такой работы вытекает, во-первых, из тех задач,
которые решает прикладная статистика и, во-вторых, недостатков
существующего на данный момент программного продукта. Доста-
точно указать на то, во многих “статистических пакетах” прежде
чем начать процесс кластеризации, программа “просит” пользовате-
ля указать количество кластеров.
Литература
1. Дюран Б., Оделл П. Кластерный анализ. М.: Статистика, 1977.
100 c.
2. Миркин Б.Г. Группировки в социально-экономических исследова-
ниях. Методы построения и анализа. М.: Финансы и статистика,
1985. 223 с.
240
Патракова Е.Ю., Патракова Н.Ю.
Санкт-Петербургский государственный университет
Управление инфекционным процессом
при клиническом и бессимптомном течении
Рекомендовано к публикации доцентом Колесиным И.Д.
Острая респираторно-вирусная инфекция может протекать в
клинической и бессимптомной формах [1, с. 104]. Управление ин-
фекционным процессом в клинической форме состоит в использова-
нии жаропонижающих средств, а в случае бессимптомного течения
имеет превентивный характер и сводится к использованию интерфе-
ронной ингаляции [2, с. 17]. Эти процессы можно наблюдать на ма-
тематической модели. Цель данной статьи – показать возможность
управления по некоторым клиническим критериям.
В работе [3] приведена следующая модель развития инфекции в
организме
·
V = βV −
1
T
V +
1
T
C
V − γ GV ,
·
V =
1
T
V −
1
T
C
V − γAV,
G = G
0
+ k
G
(T − T
H
),
A = A
0
+ k
A
(T − T
H
)
·
N = δV −
1
T
R
N − bM N ,
M = M
0
+ k
M
(T − T
H
),
·
I =
1
T
R
N − bM I,
·
T = cI − c (T − T
H
);
где V и V – концентрации вируса в клетках и крови, N – чис-
ло поврежденных клеток, I – концентрация продуктов распада (их
уровень интоксикации), T – температура тела, T – характерная дли-
тельность пребывания вируса в клетке, а T
C
– в свободном состоя-
нии, (T − T
C
) – характерная длительность инфекционного цикла, T
R
– характерная длительность распада поврежденных клеток. Полага-
ется, что концентрация интерферона (G), макрофагов (M ) и антител
(A) пропорциональны приросту температуры тела (T − T
H
) относи-
тельно нормы (T
H
), G
0
= G
H
0
, A
0
= A
H
0
, M
0
= M
H
0
– концентрации
интерферона, антител и макрофагов в норме.
241
Численные значения параметров этой модели следующие: T
H
=
36, 6, T = 5, T
C
= 2, T
R
= 12, β = 10, γ = 4, γ = 3, δ = 5,
b = 1, 5, c = 10, c = 5, k
G
= 2, k
A
= 0, 8, k
M
= 1, 2. Начальные
значения переменных: V
0
= 0, V
0
= 2, N
0
= 0, I
0
= 0, T
0
= 36, 6,
G
0
≥ G
H
0
= 1, 656, A
0
= 1, M
0
= 0.
В случае бессимптомной формы в качестве клинического крите-
рия принимается температура тела не выше 36, 8
o
C. Требуется найти
множество начальных значений параметра G
0
, при которых темпе-
ратура не перейдет заданного значения. Для бессимптомного тече-
ния процесса требуется выполнение G
0
= G
H
0
+ G
ing
> G
∗
0
, где G
∗
0
–
бифуркационное значение.
Уравнение бифуркации для данной системы имеет вид:
−β −
1
T
+ γ G =
1
T (1 + γT
C
A
0
)
,
откуда G
∗
0
= 2, 456. Тогда ингаляция, повышающая уровень интер-
ферона так, что G
0
> G
∗
0
, обеспечит бессимптомное течение болезни
(рис. 1).
Рис. 1. Динамика без управления и с управлением
В случае G
0
= G
H
0
< G
∗
0
будет наблюдаться клиническое тече-
ние болезни. Пусть в качестве клинического критерия принимается
температура тела не выше 37, 2
o
С. Воздействуя на температурную
реакцию с помощью жаропонижающего средства U требуется до-
242
биться выполнения поставленного критерия. Управляющее воздей-
ствие U включим в коэффициент c, определяющий силу пирогенного
эффекта. Таким образом, последнее уравнение системы примет вид
·
T = (c − u)I − c (T − T
H
),
где u =
0,
при T ≤ 37.2,
−
u, в противном случае .
При данных численных значениях параметров системы управля-
ющее воздействие
−
u = 4, 18 обеспечивает выполнение клинического
критерия T ≤ 37, 2
o
C (рис. 2).
Рис. 2. Динамика без управления и с управлением
Выполненный численный эксперимент показывает возможность
управления инфекционным процессом в соответствии с заданными
критериями.
Литература
1. Букринская А.Г. Вирусология. М.: Медицина, 1986.
2. Смирнов В.С. Современные средства профилактики гриппа и
ОРВИ. СПб: Фарминдекс, 2003.
3. Колесин И.Д. Введение в математическое моделирование острых
респираторно-вирусных инфекций. СПб: "СОЛО"СПбГУ, 2005.
243
Черных А.О.
Санкт-Петербургский государственный университет
Аппроксимация функции массы
биологического объекта
1
Рекомендовано к публикации профессором Поляковой Л.Н.
В работе [1] была предложена математическая модель развития
биологической системы. Согласно этой модели существуют два типа
времени: приведенное биологическое τ и приведенное астрономиче-
ское t, связанные соотношением t = τ
2
. При этом интервал жизни
индивида в обеих временных системах есть отрезок [0; 1]. Если ге-
нетически предписанная продолжительность жизни индивида равна
L, то астрономическое время индивида T
L
= Lt.
В данной работе построена модель изменения веса (массы) ин-
дивида. По этой модели вес индивида m(τ ) при τ ∈ [0; 0, 5] равен
m(τ ) = C f (τ ), где f (τ ) = (τ − τ
2
)
2
, C – некоторая константа.
Цель настоящей работы – выяснить соотношение различных
групп населения по генетически предписанной продолжительности
жизни. Предположим, что вся популяция делится на три группы с
продолжительностью жизни 80, 100 и 120 лет: P
80
, P
100
, P
120
.
Наблюдение над поведением реальных биообъектов показывает,
что организм растет (по массе) от нулевого значения до некоторого
предельного значения и что этот рост постепенно замедляется, а в
некоторый момент (для человека это примерно 25 лет) полностью
прекращается. Известен средний вес человека в разном возрасте.
При этом средний вес, скажем, в m лет есть смесь средних весов раз-
личных (в данном случае трех) групп населения. Например, средний
вес в 10 лет для человека из группы P
100
равен среднему весу в 12
лет для человека из P
120
и 8 лет для P
80
.
Значение массы:
1) для группы P
80
: f
3
(τ ) = f
τ
0, 8
,
2) для группы P
100
: f
2
(τ ) = f (τ ),
3) для группы P
120
: f
1
(τ ) = f
τ
1, 2
.
1
Работа выполнена при финансовой поддержке Российского фонда фунда-
ментальных исследований, проект № 03-01-00668.
244
Образуем функцию:
F (τ, α) = β
1
Cf
1
(τ ) + β
2
Cf
2
(τ ) + β
3
Cf
3
(τ ) =
= α
1
f
1
(τ ) + α
2
f
2
(τ ) + α
3
f
3
(τ ),
α
1
= β
1
C, α
2
= β
2
C, α
3
= β
3
C, τ ∈ R, β ∈ ∆
1
, α ∈ ∆
2
,
∆
1
= β = (β
1
, β
2
, β
3
)
T
∈ R
3
| β
1
+ β
2
+ β
3
= 1; β
1
, β
2
, β
3
≥ 0
,
∆
2
= α = (α
1
, α
2
, α
3
)
T
∈ R
3
| α
1
, α
2
, α
3
≥ 0
.
Рассмотрим интервалы биологического времени τ
1
, . . ., τ
N
∈ [0; 1].
В точках τ
i
заданы значения веса ϕ(τ
i
). Эти значения представляют
собой выпуклую комбинацию средних весов групп населения P
80
,
P
100
, P
120
, соответственно в возрастах
τ
i
0,8
, τ
i
,
τ
i
1,2
.
Задача состоит в том, чтобы аппроксимировать значения ϕ(τ ) с
помощью заданной функции. Рассмотрим возраст до 12 лет.
Разобьем отрезок τ ∈ [0; 0, 12] на конечное число отрезков, при-
своив каждому i = 0, . . ., 12 свое значение τ
i
.
Таким образом, необходимо решить следующую оптимизацион-
ную задачу:
min
α∈∆
2
12
i=0
α
1
f
1
(τ
i
) + α
2
f
2
(τ
i
) + α
3
f
3
(τ
i
) − ϕ(τ
i
)
ϕ(τ
i
)
2
=
= min
α∈∆
2
12
i=0
3
j=1
α
j
f
j
(τ
i
) − ϕ(τ
i
)
ϕ(τ
i
)
2
.
(1)
Значения ϕ(τ
i
) в различные периоды жизни будем брать из [2]
(см. таблица 1).
Таблица. Значение массы организма (от 0 до 5 лет)
i
0
1
2
3
4
5
годы
0
1
2
3
4
5
τ
i
8,66
13,29
16,58
19,37
21,79
23,98
ϕ(τ
i
)
3,5
10,7
13,0
15,0
17,2
19,75
Таблица. Значение массы организма (от 6 до 12 лет)
i
6
7
8
9
10
11
12
годы
6
7
8
9
10
11
12
τ
i
25,98
27,84
29,58
31,22
32,79
34,28
35,71
ϕ(τ
i
)
21,9
24,75
27,7
30,5
34,2
36,5
42,9
245
Задача (1) – это задача квадратичного программирования [3], по-
скольку функция в (1) является квадратичной функцией аргумента
α, множество ∆
2
есть выпуклое многогранное множество. Эта зада-
ча решена с помощью соответствующей программы решения задачи
квадратичного программирования пакета MATLAB с использовани-
ем точных для этой функции операций.
Результатом решения данной задачи есть трехмерный вектор α
∗
:
α
∗
=
337, 3228
302, 6169
255, 9907
∈ R
3
,
C =
3
i=1
α
∗
i
⇒ C = 896.
Оптимальный вектор β находится из формул
β
i
= α
∗
i
/
3
k=1
α
∗
k
, i = 1, 2, 3.
Таким образом, получим оптимальный вектор
β =
0, 3765
0, 3378
0, 2857
∈ R
3
.
Таким образом, около 38% населения людей имеют интервал жизни
в 80 лет, около 34% в 100 лет и около 28% в 120 лет (см. рис. 1).
Более точные результаты можно получить, разбив популяцию не
на три, а на большее количество групп с продолжительностью жиз-
ни в 60, 70, 80, 90, 100, 110 и 120 лет. Решая поставленную задачу,
получим следующий результат: около 5% населения имеют интервал
жизни в 60 лет, около 15% имеют интервал жизни в 70 лет, около
31% в 80 лет, около 28% в 90 лет, около 18% в 100 лет и меньше 1%
в 110 и 120 лет (см. рис. 2).
β =
0, 0506
0, 1518
0, 3098
0, 2845
0, 1828
0, 0121
0, 0084
∈ R
7
.
246
0.8
0.85
0.9
0.95
1
1.05
1.1
1.15
1.2
1.25
0.29
0.3
0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
Рис. 1.
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
Рис. 2.
Литература
1. Демьянов В.Ф. Математическая модель динамического процесса
// Доклады РАН, 2004. Т. 395, № 2. С. 178–182.
2. Популярная медицинская энциклопедия. М.: Советская энцикло-
педия, 1984.
3. Карманов В.Г. Математическое программирование. М.: Наука,
1986.
247
|