Амиргалиева С.Н.
1
1
Д.ф.-м.н.,профессор,Университет имени Сулеймана Демиреля,
Каскелен, Казахстан, e-mail:saltanat.amirgaliyeva@sdu.edu.kz
ИССЛЕДОВАНИЕ ДИНАМИКИ РАЗЛИЧНЫХ ИГРОВЫХ МОДЕЛЕЙ
Abstract. The research examines the different game models and provides conditions
for the differential equations describing dynamics,set of control players, terminal sets, terminal
functionals.
116
Keywords: game models, differential games, terminal sets, terminal functionals,
strategies for players
1. Игровые модели, описываемые обыкновенными дифференциальными
уравнениями
Рассмотрим динамическую систему, задаваемую дифференциальным уравнением
)
,
,
(
v
u
z
f
z
,
(1)
где
n
E
z
,
U
u
,
V
v
,
U
и
V
– компакты в евклидовых пространствах.
Параметрами u и v распоряжаются соответственно игроки
P
(догоняющий) и
E
(убегающий). Под допустимыми управлениями игроков
P
и
E
будут пониматься
измеримые функции
)
(t
u
и
)
(t
v
со значениями в
U
и
V
, соответственно. Множество
всех допустимых управлений игроков
P
и
E
, определенных на отрезке
]
,
[
b
a
(полуинтервале
)
,
[
b
a
), будем соответственно обозначать через
]
,
[
b
a
U
и
]
,
[
b
a
V
(
)
,
[
b
a
U
и
)
,
[
b
a
V
).
Считаем, что в дальнейшем функция
f
и множества
U
и
V
удовлетворяют
следующим предположениям.
Предположение 1. Функция
)
,
,
(
v
u
z
f
– непрерывна по совокупности переменных
и локально Липшицева по
z
(т.е. удовлетворяет условию Липшица по
z
на каждом
компакте
n
E
K
с константой
K
L
, зависящей от
K
).
Предположение 2. Существует константа
0
C
такая, что для всех
n
E
z
,
U
u
,
V
v
)
1
(
)
,
,
(
,
2
z
C
v
u
z
f
z
.
Предположение.3. Множество
)
,
,
(
v
U
z
f
– выпукло для всех
n
E
z
,
V
v
.
Предположения
1
и
2
гарантируют
существование,
единственность
и
продолжимость решения
)
(t
z
уравнения (1) на всю полуось
)
,
0
[
при произвольном
начальном условии
0
)
0
(
z
z
и при подстановке в (1) вместо параметров
u
и
v
любых
допустимых уравнений
)
(t
u
и
)
(t
v
игроков
P
и
E
, соответственно.
Будем обозначать решение
)
(t
z
уравнения (1), соответствующее
)
(t
u
,
)
(t
v
и
начальному условию
0
)
0
(
z
z
через
)
),
(
),
(
|
(
0
z
v
u
t
z
.
Рассмотрим произвольный отрезок
]
,
0
[
,
. Предположение 3 гарантирует
в топологии равномерной сходимости на отрезке
]
,
0
[
компактность множества
решений, соответствующих различным допустимым управлениям
)
(
u
игрока
P
и
начальной позиции
0
z
. Сказанное остается в силе, если начальная позиция
0
z
не
фиксирована и пробегает некоторое компактное множество
n
E
K
.
Из описанного свойства следует, что, если
]
,
0
[
)
(
U
u
k
,
K
x
k
,
,...
2
,
1
k
–
некоторые последовательности, и
)
),
(
),
(
|
(
)
(
k
k
k
x
v
u
t
z
t
z
– последовательность
соответствующих решений уравнения (1), то существует подпоследовательность
)
(
m
k
z
последовательности
)
(
k
z
, которая равномерно на
]
,
0
[
сходится к
функции
)
(
0
z
. Причем существуют такие
]
,
0
[
)
(
U
u
,
K
x
, что
117
)
),
(
),
(
|
(
)
(
0
x
v
u
t
z
t
z
.
Это же утверждение справедливо, если рассматривать не последовательности, а
направленности [2].
Рассмотрим два класса игровых моделей: игровые модели с терминальным
множеством и игровые модели с терминальным функционалом.
В первом случае цели игроков описываются с помощью терминального множества
n
E
M
и множества фазовых ограничений
n
E
N
. Множества
M
и
N
предполагаются замкнутыми, причем
N
M
.
Зафиксируем момент
0
. Цель игрока
P
состоит в том, чтобы добиться
включений
M
z
)
(
,
N
t
z
)
(
, для всех
]
,
0
[
t
, т.е. вывести траекторию
)
(t
z
на
M
в момент
, удержав ее во множестве
N
. Цель игрока
E
– противоположная и
состоит в том, чтобы добиться условий: либо
M
z
)
(
, либо для некоторого
t
N
t
z
)
(
.
В игровых моделях с терминальным функционалом цели игроков описываются с
помощью отображения
1
:
E
E
n
. Цель игрока
P
– минимизировать функционал
))
(
(
z
, зависящий от конца траектории. Цель игрока
E
– противоположная, т.е.
состоит в том, чтобы максимизировать этот функционал.
В игровых моделях с терминальным множеством,
M
и
N
выбираются не
произвольными, а замкнутыми подмножествами в
n
E
. Это делается для удобства
построения соответствующего математического аппарата. В этих же целях наложим
некоторые условия на функцию
)
(z
. Считаем, что
)
(z
удовлетворяет условию
Липшица с константой
K
L
на каждом компакте
K
.
Рассмотренные игровые модели имеют между собой большую связь. Функционал
может представлять собой расстояние до множества
M
. В этом случае цель игрока
P
– приблизиться в момент
как можно ближе к множеству
M
. Формально первую
игру можно свести ко второй полагая
0
)
(
z
,
M
z
и
1
)
(
z
,
M
z
.
Однако, указанная функция не удовлетворяет требуемому выше условию Липшица и
математический аппарат, развитый для исследования этих классов игр во многом
различается.
Характерная особенность дифференциальных игр заключается в том, что игроки не
знают действий противника в будущем. В данном исследований применяются
различные стратегии игроков, использующие ту или иную информацию о текущей
позиции и о действиях противника.
Игрок
E
будет выбирать свое текущее управление, пользуясь в основном знанием
текущей позиции.
Для игрока
P
используются различные стратегии. Это
стратегии[2], в которых
предполагается наибольшая информационная дискриминация противника: игрок
E
сообщает свое управление игроку
P
на некоторое время
0
вперед. Кроме того,
игрок
P
пользуется информацией о текущей позиции. Поскольку параметром
распоряжается игрок
E
, то
стратегии эквивалентны стратегиям, в которых игрок
P
выбирает свое текущее управление, зная начальную позицию и всю предысторию
действий противника. Эти стратегии строятся на основе некоторых вольтеровских
отображений [1]. Частным случаем последних стратегий, являются стратегии, в которых
118
игрок
P
выбирает свое текущее управление, зная начальную позицию и текущее
управление противника. Такую стратегию будем называть контрстратегией [3].
2.Игровые модели с импульсным воздействием
Рассмотрим дифференциальную игру, динамика которой испытывает импульсное
воздействие в фиксированные моменты времени.
)
,
,
(
v
u
z
f
z
,
i
t
,
m
i
,...,
1
,
(2)
z
z
A
z
i
i
t
,
m
i
,...,
1
.(3)
Игру
будем
рассматривать
на
отрезке
]
,
0
[
и
считать,
что
m
...
0
2
1
. Условие (3) означает, что траектория
)
(t
z
терпит в
точках
i
разрыв и из точки
)
(
i
z
переходит в точку
)
(
)
(
i
i
z
A
z
i
. Под
n
n
E
E
A
i
:
понимается непрерывный оператор, имеющий обратный.
Как и в предыдущем пункте,
n
E
z
,
U
u
,
V
v
,
U
и
V
– компакты;
функция
f
и множества
U
и
V
удовлетворяют предположениям 1 3. Допустимые
управления определяются, так же как и выше.
Кроме скачков вида (3) рассмотрим управляемые скачки.
z
z
v
u
A
z
i
i
i
i
t
)
,
(
,
m
i
,...,
1
,
(4)
где
i
i
U
u
,
i
i
V
v
;
i
U
,
i
V
– компакты в евклидовых пространствах.
Относительно операторов
n
n
E
E
v
u
A
i
i
i
:
)
,
(
предполагаем, что для любых
i
i
U
u
,
i
i
V
v
оператор
)
,
(
i
i
i
v
u
A
непрерывный и существует обратный
оператор
)
,
(
1
i
i
i
v
u
A
; при фиксированном
i
i
V
v
функция
z
v
u
A
i
i
i
)
,
(
как
функция от переменных
i
u
и
z
непрерывна по совокупности этих переменных.
Рассматриваются те же задачи, что и в предыдущем пункте, т.е. задача попадания на
множество
M
и удержание при этом траектории на множестве
N
, а также задача
минимизации терминального функционала
))
(
(
z
.
Игроки используют те же стратегии, что и указанные в предыдущем пункте. Что же
касается управления скачками, то
i
v
выбирается на основе информации о
)
(
i
z
, а
i
u
– на основе знания
)
(
i
z
и
i
v
.
3. Игровые модели со случайной помехой
Рассмотрим управляемый объект, динамика которого описывается уравнением
)
,
,
(
v
u
z
f
z
,
(5)
где
n
E
z
,
U
u
,
V
v
;
U
– компакт из евклидового пространства,
V
–
измеримое множество из евклидового пространства.
Считаем, что выполняются предположения 1 и 3. Вместо предположения 2
рассмотрим следующее условие.
Предположение 4. Для фиксированного
V
v
существует
0
)
(
v
C
такое, что
для всех
n
E
z
,
U
u
)
1
)(
(
)
,
,
(
,
2
z
v
C
v
u
z
f
z
.
119
Пусть выполняются предположения 1 и 4, функции
U
t
u
)
(
,
V
t
v
)
(
определены на
]
,
0
[
, причем
)
(t
u
– измерима, а
)
(t
v
– кусочно–постоянная. Тогда,
если в (5) подставить вместо параметров
u
и
v
указанные функции, то решение
)
(t
z
уравнения (5) существует и единственное на всем отрезке
]
,
0
[
.
В рассматриваемой модели догоняющий игрок
P
, как и выше, распоряжается
параметром
u
и его допустимым управлением является измеримая функция
)
(t
u
со
значением в
U
.
Параметр
v
является случайно величиной, ее реализации изменяются в конечные
моменты времени и управляется игроком
P
. Игрок
P
играет в
стратегиях.
Пусть
1
:
E
E
n
– непрерывное отображение,
0
– фиксированный момент
времени. Величина
))
(
(
z
является
случайной величиной и цель игрока
P
–
минимизировать ее математическое ожидание.
Поскольку заранее не известны моменты изменения реализаций помехи, то выбор
этих моментов предоставляется игрокупротивнику
E
.
В игровых моделях исследуются задачи сближенияуклонения, которые
описываются терминальным множеством, множеством фазовых ограничений или
терминальным функционалом.
Достарыңызбен бөлісу: |