(0,09; 0,105; 0,615)
t
2
(0,1142(3); 0,1475(3); 0,3242(3))
(0,0284; 0,097; 0,4606)
t
3
(0,0631(6); 0,0901(6); 0,18(6))
(0,00837; 0,0645; 0,2671)
Таблица. Продолжение таблицы 4
519
EQ
w(r)
(Sh(t))
EQ
w(r)
(M SC(t))
P (M SC, Sh(t))
t
0
0,2303
0,3386
0,7556
t
1
0,1679
0,3091
0,7962
t
2
0,0495
0,3029
0,8312
t
3
0,1352
0,3622
0,8062
Таким образом, в статье вводятся определения динамической
устойчивости и динамического доминирования решений. Также пред-
лагается процедура, обеспечивающая динамическое доминирование
и динамическую устойчивость решений.
Литература
1. Петросян Л.А. Устойчивость решений дифференциальных игр n-
лиц // Вестник ЛГУ. Сер. 1, 1997. № 19. С. 46–52.
2. Хованов Н.В. Анализ и синтез показателей при информационном
дефиците. СПб.: Изд-во СПбГУ, 1996. 136 с.
3. Ганькова А.Б., Захаров В.В. Сравнение решений в моделях сов-
местного осуществления проектов // Устойчивость и процессы
управления: Труды междун. конф., посвященной 75-летию со дня
рождения В.И. Зубова. Россия, СПб, 29 июня – 1 июля 2005 г. /
Под ред. Д.А. Овсянникова, Л.А. Петросяна. – СПб.: СПбГУ, НИИ
ВМ и ПУ, ООО ВВМ, 2005. Т. 1. С. 514–522.
520
Гарнаев А.Ю., Денисова Е.А.
Санкт-Петербургский государственный университет
Игра организации совместного предприятия
1. Постановка задачи. В данной работе рассматривается неан-
тагонистическая игра организации совместного предприятия двумя
игроками, которые хотят создать совместный бизнес в течение неко-
торого конечного промежутка времени. Ситуация моделируется с по-
мощью игры с выбором момента времени на промежутке времени
[0, 1].
Первоначально оба игрока имеют небольшой, но постоянный до-
ход, характеризующийся некоторой постоянной k. Игроки могут ор-
ганизовать совместное предприятия либо одновременно, либо входя
в бизнес последовательно, либо отказаться от вхождения в него, до-
вольствуясь своим постоянным доходом. В случае вхождения в биз-
нес источник постоянного дохода прекращается. Стратегией игрока
является момент времени t ∈ [0, 1) его вступления в бизнес. Выбор
игроком момента времени t = 1 означает, что он отказывается всту-
пать в совместное дело.
Предполагается, что рост доходов и платежей в данной модели
происходит по линейному закону. Начальный платеж за организа-
цию нового предприятия составляет aτ , где a – некоторый положи-
тельный параметр, а τ – момент вступления в дело. Если игрок ре-
шит организовать новое предприятие в одиночку, тогда его прибыль
за промежуток времени τ будет составлять dτ , где d – некоторый
положительный параметр. Если оба игрока решат вступить в дело,
их общий доход составит Dτ , где D > d – некоторый положительный
параметр. Если они войдут в дело одновременно, то общий доход бу-
дет разделен пополам. Если же они будут входить в дело по очереди,
организатор (т.е. тот, кто вошел первым) получит долю q
1
> 0 от об-
щей прибыли, а компаньон (т.е. вошедший вторым) получит долю
q
2
> 0, где q
1
+ q
2
= 1.
521
Данная игра демонстрирует, как с общественными интересами
(созданием общего дела) согласуются личные интересы (желание по-
лучить максимальную выгоду либо путем организации совместного
бизнеса, либо собственными усилиями). Игра является шумной, т.к.
один игрок всегда может узнать, вошел другой игрок в дело или нет.
Пусть x и y – чистые стратегии игроков 1 и 2. Тогда их выигрыши
определяются следующими соотношениями:
M
1
(x, y) =
kx − ax + d(y − x) + Dq
1
(1 − y) при x < y,
kx − ax/2 + D(1 − x)/2
при 1 > x = y,
T (y)
при 1 > x > y,
k
при x = 1,
M
2
(x, y) =
ky − ay + d(x − y) + Dq
1
(1 − x) при y < x,
ky − ay/2 + D(1 − y)/2
при x = y,
T (x)
при y > x,
k
при y = 1,
где
T (y) =
k
при k > Dq
2
,
ky + Dq
2
(1 − y) при k ≤ Dq
2
.
2. Случай q
1
≥ q
2
. В данном разделе рассматривается случай,
когда первый игрок, вступивший в совместный бизнес, будет полу-
чать не меньше второго.
Введем вспомогательные функции, которые будут использовать-
ся при определении оптимальных стратегий:
ξ(x) = 1 − 1 − x 1 −
a
k − Dq
1
−
k − a − d
k − a − Dq
1
.
(1)
522
Теорема 1.
1. Пусть d ≤ D/2. Тогда
a) если k < D/2, то существует единственное равновесие по
Нэшу (0, 0) с вектором выигрыша (D/2, D/2);
b) если k > d, то существует единственное равновесие по Нэшу
(1, 1) с вектором выигрыша (k, k);
c) если k ∈ [d, D/2], то существует два равновесия по Нэшу:
(0, 0) с вектором выигрыша (D/2, D/2) и (1, 1) с вектором вы-
игрыша (k, k). Очевидно, что (0, 0) доминирует (1, 1) по Паре-
то. Следовательно, существует единственное равновесие по
Нэшу (0, 0), равно привлекательное для обоих игроков.
2. Пусть D/2 < d. Тогда
a) если k < D/2, то существует единственное равновесие по
Нэшу (0, 0) с вектором выигрыша (D/2, D/2);
b) если k > d, то существует единственное равновесие по Нэшу
(1, 1) с вектором выигрыша (k, k);
c) если k ∈ [D/2, d], то
1) если D/2 ≤ k ≤ min{Dq
1
, d}, то не существует равновесия
по Нэшу;
2) если Dq
1
≤ k ≤ d, то существует равновесие по Нэшу в
смешанных стратегиях (F, F ) с вектором выигрыша (k, k), где
F (x) =
1 − ξ(1)
при x → +0,
1 − ξ(1) + ξ(x) при x > 0.
3. Случай q
1
< q
2
. В данном разделе рассматривается случай,
когда второй игрок, вступивший в совместный бизнес, будет полу-
чать больше первого.
Введем вспомогательные функции, которые будут использовать-
ся при определении оптимальных стратегий:
523
η(x) = 1 − 1 − x 1 −
a
Dq
2
− Dq
1
−
k − a − d
Dq
2
− a − Dq
1
.
(2)
Теорема 2.
1. Пусть k ≥ d. Тогда существует единственное равновесие по
Нэшу (1, 1) с вектором выигрыша (k, k).
2. Пусть k < d. Тогда
a) если Dq
2
≤ k < d, то существует равновесие по Нэшу в
смешанных стратегиях (F, F ) с вектором выигрыша (k, k), где
F (x) =
1 − ξ(1)
при x → +0,
1 − ξ(1) + ξ(x) при x > 0;
b) если k < Dq
2
, то существует равновесие по Нэшу в сме-
шанных стратегиях (G, G) с вектором выигрыша (ν, ν), где
ν =
[0,1)
((k − Dq
2
)y + Dq
2
) dF (y) ≥ k,
F (x) =
η(x) при x ∈ [0, 1),
1
при x = 1.
Литература
1. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.:
Высш. шк., Книжный дом "Университет", 1998. 304 с.
2. Baston V., Garnaev A. On a Game in Manufacturing // Mathematical
Methods of Operations Research, 2000. Vol 52. P. 237–249.
3. Petrosyan L.A., Zenkevich N.A. Game Theory. Singapore, London:
World Scientific, 1996. 352 p.
524
Гарнаев А.Ю., Сидярто Т.П.
Санкт-Петербургский государственный университет
Одна динамическая игра поиска
1. Постановка задачи. В данной работе исследуется непрерыв-
ная игра поиска n игроками неподвижного объекта, спрятанного в
одной из m ячеек. Игра происходит на промежутке времени [0, ∞).
В начальный момент времени игроки располагают информацией о
возможном расположении объекта, а именно, они знают, что объект
расположен в ячейке i с вероятностью p
i
, где p
i
> 0 для i ∈ [1, m]
и
m
i=1
p
i
= 1. Цель каждого игрока – обнаружить объект до то-
го, как это сделает один из оппонентов. Предполагается, что спо-
собности игроков обнаружить объект заданы экспоненциальным за-
коном, а именно, пусть вероятность того, что игрок j обнаружит
объект в ячейке i, потратив на поиск в этой ячейке время τ , рав-
но 1 − exp(−R
j
i
τ ), где R
j
i
, i ∈ [1, m], j ∈ [1, n] – положительные по-
стоянные, известные всем игрокам. Для данной игры будем искать
равновесие по Нэшу.
2. Математическая формулировка и основной резуль-
тат. Под стратегией j-го игрока будем понимать вектор f
j
(t) =
(f
j
1
(t), . . . , f
j
m
(t)), где f
j
i
(t) ∈ C
∞
(t), f
j
i
(0) = 0,
m
i=1
f
j
i
(t) = t. f
j
i
(t)
равно времени, потраченному на поиск j-м игроком в ячейке i на
интервале времени [0, t].
Если объект находится в ячейке i, и j-й игрок не смог обнару-
жить объект до времени t, а все остальные не обнаружат объект до
времени t + h, вероятность того, что j-й игрок обнаружит объект в
интервале (t, t + h) будет следующей:
R
j
i
df
j
i
(t)
dt
h + o(h)) exp(−R
j
i
f
j
i
(t)
n
k=1,k=j
exp(−R
k
i
f
k
i
(t + h)) =
= exp(−s
i
(t))R
j
i
df
j
i
(t)
dt
h + o(h),
где s
i
(t) =
n
k=1
R
k
i
f
k
i
(t).
Таким образом, выигрыш j-го игрока равен
525
M
j
(f
1
(t), . . . , f
n
(t)) =
m
i=1
p
i
∞
0
R
j
i
df
j
i
(t)
dt
exp(−s
i
(t))dt.
Теорема 1. Пусть (f
1∗
(t), . . . , f
n∗
(t)) равновесие по Нэшу и
пусть
G
j
i
(t) = p
i
R
j
i
exp(−s
∗
i
(t)) − p
i
(R
j
i
)
2
∞
t
df
j∗
i
(τ )
dτ
exp(−s
∗
i
(τ ))dτ.
Тогда существуют n не возрастающих функций ρ
j
(t), j ∈ [1, n],
определенных на [0, ∞), таких, что
G
j
i
(t)
= ρ
j
(t)
для
df
j∗
i
(t)
dt
> 0,
≤ ρ
j
(t)
для
df
j∗
i
(t)
dt
= 0,
причем lim
t→∞
ρ
j
(t) = 0, j ∈ [1, n] .
3. Случай n ≥ 3. В данном пункте рассмотрим случай трех
и более игроков. Если (f
1∗
(t), . . . , f
n∗
(t)) — равновесие по Нэшу, то
справедлива следующая теорема.
Теорема 2. Пусть n ≥ 3. Положим t
j∗
i
= inf{t|
df
j∗
i
(t)
dt
> 0},
тогда оптимальное время начала поиска t
j∗
i
в ячейке i для j-го иг-
рока является решением уравнения
n
k=1,k=j
R
j
i
ρ
k
(t)
(n − 1)R
k
i
p
i
+
((n − 1) − R
j
i
)ρ
j
(t)
(n − 1)R
j
i
p
i
= 1.
Оптимальные стратегии игроков находятся из следующих соот-
ношений:
df
j∗
i
(t)
dt
=
0,
для 0 ≤ t ≤ t
j∗
i
,
(n − 2)C
j
i
ρ
j
(t) −
n
k=1,k=j
C
k
i
ρ
k
(t)
n
k=1
C
k
i
ρ
k
(t)
, для t > t
j∗
i
,
526
где i ∈ [1, m], j ∈ [1, n] и C
j
i
=
n
k=1,k=j
R
k
i
.
Выигрыши игроков
M
j
(f
1∗
(t), . . . , f
n∗
(t)) =
m
i=1
R
j
i
n − 1
n
k=1,k=j
ρ
k
(t
j∗
i
)/R
k
i
− ρ
j
(t
j∗
i
)/R
j
i
.
Функции ρ
j
(t), j ∈ [1, n], являются решением следующей системы
ρ
j
(t)Ω
j
(t) = −1,
Ω
j
(t) =
m
i=1
C
j
i
n
k=1
C
k
i
ρ
k
(t)
,
где C
j
i
определены как выше.
Литература
1. Gal S. A Discrete Search Game. SIAM Journal of Applied
Mathematics, 1974. Vol. 27. P. 641–648.
2. Sakaguchi, M. A Two-Sided Recource Allocation Game in Search for a
Stationary Object. Mathematica Japonica, 1987. Vol. 32. P. 979–991.
3. Petrosjan L.A., Zenkevich N.A. Game Theory. Singapore, London:
World Scientific, 1996. 352 p.
4. Garnaev A.Y. Search Games and Other Applications of Game Theory.
Heidelberg, New York: Springer, 2000. 145 p.
5. Гарнаев А.Ю., Сидярто Т.П. Одна неантагонистическая игра по-
иска с рапределением ресурсов // Вестник СПбГУ. Сер. 10, 2006.
Вып. 1. С. 26–33.
527
Гарнаев А.Ю., Соловьев А.Ю.
Санкт-Петербургский государственный университет
Одна игровая задача экологического мониторинга
Постановка задачи. В данной работе рассматривается одна
неантагонистическая игровая задача мониторинга состояния окру-
жающей среды. В ней имеются два игрока: оператор некоторого
техногенного объекта (завода, электростанции и пр.) и инспектор.
Игра разыгрывается на интервале времени [0, ∞). Задача оператора
заключается в том, чтобы совершить некоторое запрещенное дей-
ствие (например, сбросить отходы производства), в то время как ин-
спектор должен вовремя пресечь вред, который оператор наносит
окружающей среде. Если оператор избавился от отходов, то в каж-
дый момент времени он получает дополнительную прибыль Aδ
t
, где
δ < 1 определяет дискаунтный фактор, A есть начальное значение
прибыли. Одновременно с тем как оператор получает сверхприбыль,
окружающей среде наносится вред, который оценивается так же, как
сверхприбыль оператора, только дискаунтный фактор и начальное
значение ущерба имеют другие значения. Инспектор может засечь
нарушение (если оно было произведено) с вероятностью 1 − β. В то
же время с вероятностью α инспектор вызывает ложную тревогу,
т.е. он заявляет о нарушении, которое еще не имело места. Пред-
полагается, что инспекция тихая в том смысле, что факт проведе-
ния инспекции не известен оператору до тех пор, пока инспектор не
объявит о нарушении. Выигрыш оператора определяется размером
полученной им сверхприбыли, а выигрыш инспектора есть размер
ущерба, нанесенного окружающей среде, со знаком минус. Данный
сценарий игры обобщает сценарий, предложенный Розенштейном и
Замиром [1] на случай дискаунтного фактора и игры на бесконечном
интервале.
Приведем точное математическое описание рассмотренного выше
сценария. Чистые стратегии игроков следующие: оператор должен
выбрать время нарушения x ∈ [0, ∞); инспектор может провести
одну проверку, и его стратегия есть время инспекции y ∈ [0, ∞).
Определим теперь выигрыш оператора в случае, когда инспекция
не проводится. Пусть оператор выбрасывает отходы в момент вре-
мени x, тогда его выигрыш определяется как A(x) =
∞
x
a(t) dt, где
a(t) есть некоторая интегрируемая на всем промежутке [0, ∞) поло-
528
жительная функция. Здесь несколько обобщается сформулирован-
ная выше задача, а именно, раньше предполагалось, что a(t) = Aδ
t
.
Пусть теперь оператор был пойман инспектором в момент времени
y > x, тогда выигрыш оператора равен
y
x
a(t) dt = A(x) − A(y). Ана-
логично определяется выигрыш инспектора. Пусть снова оператор
проводит нарушение в момент времени x, тогда ущерб, нанесенный
окружающей среде, равен
∞
x
b(t) dt = B(x). Соответственно выиг-
рыш инспектора в данном случае равен −B(x).
В дальнейшем будем работать только с функциями A(x) и B(x).
Причем масштаб выигрышей считаем таким, что A(∞) = B(∞) = 0
и A(0) = B(0) = 1. Также отметим, что эти функции строго убывают.
Запишем выражения для функций выигрышей игроков (первый
игрок — оператор, второй — инспектор):
M
1
(x, y) =
A(x) − ¯
βA(y),
x ≤ y,
¯
αA(x) + αA(y), x > y;
M
2
(x, y) =
−B(x) + ¯
βB(y),
x ≤ y,
−¯
αB(x) − αB(y), x > y.
Здесь ¯
α = 1 − α, ¯
β = 1 − β.
Решение игры. Смешанными стратегиями игроков являются
функции распределения F
1
(x) и F
2
(y). Считаем, что они непрерыв-
ны справа. Если стратегии F
1
(x) и F
2
(y) образуют ситуацию равно-
весия по Нэшу, тогда для всех x ∈ [0, ∞) и для всех y ∈ [0, ∞) долж-
ны выполняться неравенства M
1
(x, F
2
) ≤ M
1
(F
1
, F
2
) и M
2
(F
1
, y) ≤
M
2
(F
1
, F
2
). Сформулируем теорему, которая устанавливает вид рав-
новесных стратегий в данной игре.
Теорема 1. Пусть (F
1
, F
2
) — ситуация равновесия по Нэшу в
рассматриваемой игре, причем функции распределения F
1
и F
2
не
имеют сингулярной компоненты, тогда эти функции обладают пе-
речисленными ниже свойствами.
1. Функция F
1
(x) имеет единственный скачок при x = 0.
2. Функция F
2
(y) не имеет скачков при всех x ∈ [0, ∞).
3. Существует число T ∈ (0, ∞) такое, что F
1
(T ) = F
2
(T ) = 1.
При этом F
1
(x) и F
2
(x) строго возрастают при x ∈ (0, T ).
Опираясь на результаты этой теоремы, легко составить уравне-
ния для определения равновесных стратегий и найти эти стратегии.
529
Теорема 2. Если рассматриваются функции F
1
и F
2
, не име-
ющие сингулярной компоненты, тогда в игре существует един-
ственная ситуация равновесия по Нэшу (F
1
, F
2
), в которой стра-
тегии игроков имеют следующий вид:
F
1
(x) =
α
α + ¯
β
+
¯
β
α + ¯
β
B(T )
B(x)
( ¯
β+α)/ ¯
β
,
F
2
(y) =
1
α
−
1
α
A(y)
α/ ¯
β
,
где число T определяется из равенства A(T ) = ¯
α
¯
β/α
. Выигрыши
игроков в ситуации равновесия определяются по формулам:
v
1
= M
1
(0, F
2
) =
α
α + ¯
β
+
¯
β
α + ¯
β
¯
α
(α+ ¯
β)/α
,
v
2
= M
2
(F
1
, 0) = −
α
α + ¯
β
−
¯
α ¯
β
α
B(T ) +
¯
β
2
α(α + ¯
β)
B(T )
(α+ ¯
β)/ ¯
β
,
из которых следует, что выигрыш первого игрока не зависит от
функции A(x).
Теперь вернемся к первоначальной формулировке задачи, когда
функции A(x) и B(x) были явно заданы, а именно, пусть a(t) =
ln(1/a)a
t
, где 0 < a < 1, b(t) = ln(1/b)b
t
. Тогда A(x) = a
x
, B(x) = b
x
,
Достарыңызбен бөлісу: |