Процессы управления и устойчивость



Pdf көрінісі
бет47/57
Дата27.12.2016
өлшемі30,48 Mb.
#549
1   ...   43   44   45   46   47   48   49   50   ...   57


(0,09; 0,105; 0,615)

t

2



(0,1142(3); 0,1475(3); 0,3242(3))

(0,0284; 0,097; 0,4606)

t

3

(0,0631(6); 0,0901(6); 0,18(6))



(0,00837; 0,0645; 0,2671)

Таблица. Продолжение таблицы 4

519


EQ

w(r)


(Sh(t))

EQ

w(r)



(M SC(t))

P (M SC, Sh(t))

t

0

0,2303



0,3386

0,7556


t

1

0,1679



0,3091

0,7962


t

2

0,0495



0,3029

0,8312


t

3

0,1352



0,3622

0,8062


Таким образом, в статье вводятся определения динамической

устойчивости и динамического доминирования решений. Также пред-

лагается процедура, обеспечивающая динамическое доминирование

и динамическую устойчивость решений.

Литература

1. Петросян Л.А. Устойчивость решений дифференциальных игр n-

лиц // Вестник ЛГУ. Сер. 1, 1997. № 19. С. 46–52.

2. Хованов Н.В. Анализ и синтез показателей при информационном

дефиците. СПб.: Изд-во СПбГУ, 1996. 136 с.

3. Ганькова А.Б., Захаров В.В. Сравнение решений в моделях сов-

местного осуществления проектов // Устойчивость и процессы

управления: Труды междун. конф., посвященной 75-летию со дня

рождения В.И. Зубова. Россия, СПб, 29 июня – 1 июля 2005 г. /

Под ред. Д.А. Овсянникова, Л.А. Петросяна. – СПб.: СПбГУ, НИИ

ВМ и ПУ, ООО ВВМ, 2005. Т. 1. С. 514–522.

520


Гарнаев А.Ю., Денисова Е.А.

Санкт-Петербургский государственный университет

Игра организации совместного предприятия

1. Постановка задачи. В данной работе рассматривается неан-

тагонистическая игра организации совместного предприятия двумя

игроками, которые хотят создать совместный бизнес в течение неко-

торого конечного промежутка времени. Ситуация моделируется с по-

мощью игры с выбором момента времени на промежутке времени

[0, 1].

Первоначально оба игрока имеют небольшой, но постоянный до-



ход, характеризующийся некоторой постоянной k. Игроки могут ор-

ганизовать совместное предприятия либо одновременно, либо входя

в бизнес последовательно, либо отказаться от вхождения в него, до-

вольствуясь своим постоянным доходом. В случае вхождения в биз-

нес источник постоянного дохода прекращается. Стратегией игрока

является момент времени t ∈ [0, 1) его вступления в бизнес. Выбор

игроком момента времени t = 1 означает, что он отказывается всту-

пать в совместное дело.

Предполагается, что рост доходов и платежей в данной модели

происходит по линейному закону. Начальный платеж за организа-

цию нового предприятия составляет aτ , где a – некоторый положи-

тельный параметр, а τ – момент вступления в дело. Если игрок ре-

шит организовать новое предприятие в одиночку, тогда его прибыль

за промежуток времени τ будет составлять dτ , где d – некоторый

положительный параметр. Если оба игрока решат вступить в дело,

их общий доход составит Dτ , где D > d – некоторый положительный

параметр. Если они войдут в дело одновременно, то общий доход бу-

дет разделен пополам. Если же они будут входить в дело по очереди,

организатор (т.е. тот, кто вошел первым) получит долю q

1

> 0 от об-



щей прибыли, а компаньон (т.е. вошедший вторым) получит долю

q

2



> 0, где q

1

+ q



2

= 1.


521

Данная игра демонстрирует, как с общественными интересами

(созданием общего дела) согласуются личные интересы (желание по-

лучить максимальную выгоду либо путем организации совместного

бизнеса, либо собственными усилиями). Игра является шумной, т.к.

один игрок всегда может узнать, вошел другой игрок в дело или нет.

Пусть x и y – чистые стратегии игроков 1 и 2. Тогда их выигрыши

определяются следующими соотношениями:

M

1



(x, y) =







kx − ax + d(y − x) + Dq

1

(1 − y) при x < y,



kx − ax/2 + D(1 − x)/2

при 1 > x = y,

T (y)

при 1 > x > y,



k

при x = 1,

M

2

(x, y) =









ky − ay + d(x − y) + Dq

1

(1 − x) при y < x,



ky − ay/2 + D(1 − y)/2

при x = y,

T (x)

при y > x,



k

при y = 1,

где

T (y) =


k

при k > Dq

2

,

ky + Dq



2

(1 − y) при k ≤ Dq

2

.

2. Случай q



1

≥ q


2

. В данном разделе рассматривается случай,

когда первый игрок, вступивший в совместный бизнес, будет полу-

чать не меньше второго.

Введем вспомогательные функции, которые будут использовать-

ся при определении оптимальных стратегий:

ξ(x) = 1 − 1 − x 1 −

a

k − Dq



1

k − a − d



k − a − Dq

1

.



(1)

522


Теорема 1.

1. Пусть d ≤ D/2. Тогда

a) если k < D/2, то существует единственное равновесие по

Нэшу (0, 0) с вектором выигрыша (D/2, D/2);

b) если k > d, то существует единственное равновесие по Нэшу

(1, 1) с вектором выигрыша (k, k);

c) если k ∈ [d, D/2], то существует два равновесия по Нэшу:

(0, 0) с вектором выигрыша (D/2, D/2) и (1, 1) с вектором вы-

игрыша (k, k). Очевидно, что (0, 0) доминирует (1, 1) по Паре-

то. Следовательно, существует единственное равновесие по

Нэшу (0, 0), равно привлекательное для обоих игроков.

2. Пусть D/2 < d. Тогда

a) если k < D/2, то существует единственное равновесие по

Нэшу (0, 0) с вектором выигрыша (D/2, D/2);

b) если k > d, то существует единственное равновесие по Нэшу

(1, 1) с вектором выигрыша (k, k);

c) если k ∈ [D/2, d], то

1) если D/2 ≤ k ≤ min{Dq

1

, d}, то не существует равновесия



по Нэшу;

2) если Dq

1

≤ k ≤ d, то существует равновесие по Нэшу в



смешанных стратегиях (F, F ) с вектором выигрыша (k, k), где

F (x) =


1 − ξ(1)

при x → +0,

1 − ξ(1) + ξ(x) при x > 0.

3. Случай q

1

< q

2

. В данном разделе рассматривается случай,



когда второй игрок, вступивший в совместный бизнес, будет полу-

чать больше первого.

Введем вспомогательные функции, которые будут использовать-

ся при определении оптимальных стратегий:

523


η(x) = 1 − 1 − x 1 −

a

Dq



2

− Dq


1

k − a − d



Dq

2

− a − Dq



1

.

(2)



Теорема 2.

1. Пусть k ≥ d. Тогда существует единственное равновесие по

Нэшу (1, 1) с вектором выигрыша (k, k).

2. Пусть k < d. Тогда

a) если Dq

2

≤ k < d, то существует равновесие по Нэшу в



смешанных стратегиях (F, F ) с вектором выигрыша (k, k), где

F (x) =


1 − ξ(1)

при x → +0,

1 − ξ(1) + ξ(x) при x > 0;

b) если k < Dq

2

, то существует равновесие по Нэшу в сме-



шанных стратегиях (G, G) с вектором выигрыша (ν, ν), где

ν =


[0,1)

((k − Dq


2

)y + Dq


2

) dF (y) ≥ k,

F (x) =

η(x) при x ∈ [0, 1),



1

при x = 1.

Литература

1. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.:

Высш. шк., Книжный дом "Университет", 1998. 304 с.

2. Baston V., Garnaev A. On a Game in Manufacturing // Mathematical

Methods of Operations Research, 2000. Vol 52. P. 237–249.

3. Petrosyan L.A., Zenkevich N.A. Game Theory. Singapore, London:

World Scientific, 1996. 352 p.

524


Гарнаев А.Ю., Сидярто Т.П.

Санкт-Петербургский государственный университет

Одна динамическая игра поиска

1. Постановка задачи. В данной работе исследуется непрерыв-

ная игра поиска n игроками неподвижного объекта, спрятанного в

одной из m ячеек. Игра происходит на промежутке времени [0, ∞).

В начальный момент времени игроки располагают информацией о

возможном расположении объекта, а именно, они знают, что объект

расположен в ячейке i с вероятностью p

i

, где p



i

> 0 для i ∈ [1, m]

и

m

i=1



p

i

= 1. Цель каждого игрока – обнаружить объект до то-



го, как это сделает один из оппонентов. Предполагается, что спо-

собности игроков обнаружить объект заданы экспоненциальным за-

коном, а именно, пусть вероятность того, что игрок j обнаружит

объект в ячейке i, потратив на поиск в этой ячейке время τ , рав-

но 1 − exp(−R

j

i



τ ), где R

j

i



, i ∈ [1, m], j ∈ [1, n] – положительные по-

стоянные, известные всем игрокам. Для данной игры будем искать

равновесие по Нэшу.

2. Математическая формулировка и основной резуль-

тат. Под стратегией j-го игрока будем понимать вектор f

j

(t) =



(f

j

1



(t), . . . , f

j

m



(t)), где f

j

i



(t) ∈ C

(t), f



j

i

(0) = 0,



m

i=1


f

j

i



(t) = t. f

j

i



(t)

равно времени, потраченному на поиск j-м игроком в ячейке i на

интервале времени [0, t].

Если объект находится в ячейке i, и j-й игрок не смог обнару-

жить объект до времени t, а все остальные не обнаружат объект до

времени t + h, вероятность того, что j-й игрок обнаружит объект в

интервале (t, t + h) будет следующей:

R

j



i

df

j



i

(t)


dt

h + o(h)) exp(−R

j

i

f



j

i

(t)



n

k=1,k=j


exp(−R

k

i



f

k

i



(t + h)) =

= exp(−s


i

(t))R


j

i

df



j

i

(t)



dt

h + o(h),

где s

i

(t) =



n

k=1


R

k

i



f

k

i



(t).

Таким образом, выигрыш j-го игрока равен

525


M

j

(f



1

(t), . . . , f

n

(t)) =


m

i=1


p

i



0

R

j



i

df

j



i

(t)


dt

exp(−s


i

(t))dt.


Теорема 1. Пусть (f

1∗

(t), . . . , f



n∗

(t)) равновесие по Нэшу и

пусть

G

j



i

(t) = p


i

R

j



i

exp(−s


i

(t)) − p



i

(R

j



i

)

2



t

df



j∗

i

(τ )



exp(−s


i

(τ ))dτ.



Тогда существуют n не возрастающих функций ρ

j

(t), j ∈ [1, n],



определенных на [0, ∞), таких, что

G

j



i

(t)




= ρ



j

(t)


для

df

j∗



i

(t)


dt

> 0,


≤ ρ

j

(t)



для

df

j∗



i

(t)


dt

= 0,


причем lim

t→∞


ρ

j

(t) = 0, j ∈ [1, n] .



3. Случай n ≥ 3. В данном пункте рассмотрим случай трех

и более игроков. Если (f

1∗

(t), . . . , f



n∗

(t)) — равновесие по Нэшу, то

справедлива следующая теорема.

Теорема 2. Пусть n ≥ 3. Положим t

j∗

i

= inf{t|



df

j∗

i



(t)

dt

> 0},



тогда оптимальное время начала поиска t

j∗

i



в ячейке i для j-го иг-

рока является решением уравнения

n

k=1,k=j


R

j

i



ρ

k

(t)



(n − 1)R

k

i



p

i

+



((n − 1) − R

j

i



j

(t)



(n − 1)R

j

i



p

i

= 1.



Оптимальные стратегии игроков находятся из следующих соот-

ношений:


df

j∗

i



(t)

dt

=













0,

для 0 ≤ t ≤ t

j∗

i

,



(n − 2)C

j

i



ρ

j

(t) −



n

k=1,k=j


C

k

i



ρ

k

(t)



n

k=1


C

k

i



ρ

k

(t)



, для t > t

j∗

i



,

526


где i ∈ [1, m], j ∈ [1, n] и C

j

i



=

n

k=1,k=j



R

k

i



.

Выигрыши игроков

M

j

(f



1∗

(t), . . . , f

n∗

(t)) =


m

i=1


R

j

i



n − 1



n

k=1,k=j


ρ

k

(t



j∗

i

)/R



k

i

− ρ



j

(t

j∗



i

)/R


j

i



 .

Функции ρ

j

(t), j ∈ [1, n], являются решением следующей системы









ρ

j

(t)Ω



j

(t) = −1,

j

(t) =



m

i=1


C

j

i



n

k=1


C

k

i



ρ

k

(t)



,

где C


j

i

определены как выше.



Литература

1. Gal S. A Discrete Search Game. SIAM Journal of Applied

Mathematics, 1974. Vol. 27. P. 641–648.

2. Sakaguchi, M. A Two-Sided Recource Allocation Game in Search for a

Stationary Object. Mathematica Japonica, 1987. Vol. 32. P. 979–991.

3. Petrosjan L.A., Zenkevich N.A. Game Theory. Singapore, London:

World Scientific, 1996. 352 p.

4. Garnaev A.Y. Search Games and Other Applications of Game Theory.

Heidelberg, New York: Springer, 2000. 145 p.

5. Гарнаев А.Ю., Сидярто Т.П. Одна неантагонистическая игра по-

иска с рапределением ресурсов // Вестник СПбГУ. Сер. 10, 2006.

Вып. 1. С. 26–33.

527


Гарнаев А.Ю., Соловьев А.Ю.

Санкт-Петербургский государственный университет

Одна игровая задача экологического мониторинга

Постановка задачи. В данной работе рассматривается одна

неантагонистическая игровая задача мониторинга состояния окру-

жающей среды. В ней имеются два игрока: оператор некоторого

техногенного объекта (завода, электростанции и пр.) и инспектор.

Игра разыгрывается на интервале времени [0, ∞). Задача оператора

заключается в том, чтобы совершить некоторое запрещенное дей-

ствие (например, сбросить отходы производства), в то время как ин-

спектор должен вовремя пресечь вред, который оператор наносит

окружающей среде. Если оператор избавился от отходов, то в каж-

дый момент времени он получает дополнительную прибыль Aδ

t

, где



δ < 1 определяет дискаунтный фактор, A есть начальное значение

прибыли. Одновременно с тем как оператор получает сверхприбыль,

окружающей среде наносится вред, который оценивается так же, как

сверхприбыль оператора, только дискаунтный фактор и начальное

значение ущерба имеют другие значения. Инспектор может засечь

нарушение (если оно было произведено) с вероятностью 1 − β. В то

же время с вероятностью α инспектор вызывает ложную тревогу,

т.е. он заявляет о нарушении, которое еще не имело места. Пред-

полагается, что инспекция тихая в том смысле, что факт проведе-

ния инспекции не известен оператору до тех пор, пока инспектор не

объявит о нарушении. Выигрыш оператора определяется размером

полученной им сверхприбыли, а выигрыш инспектора есть размер

ущерба, нанесенного окружающей среде, со знаком минус. Данный

сценарий игры обобщает сценарий, предложенный Розенштейном и

Замиром [1] на случай дискаунтного фактора и игры на бесконечном

интервале.

Приведем точное математическое описание рассмотренного выше

сценария. Чистые стратегии игроков следующие: оператор должен

выбрать время нарушения x ∈ [0, ∞); инспектор может провести

одну проверку, и его стратегия есть время инспекции y ∈ [0, ∞).

Определим теперь выигрыш оператора в случае, когда инспекция

не проводится. Пусть оператор выбрасывает отходы в момент вре-

мени x, тогда его выигрыш определяется как A(x) =

x



a(t) dt, где

a(t) есть некоторая интегрируемая на всем промежутке [0, ∞) поло-

528


жительная функция. Здесь несколько обобщается сформулирован-

ная выше задача, а именно, раньше предполагалось, что a(t) = Aδ

t

.

Пусть теперь оператор был пойман инспектором в момент времени



y > x, тогда выигрыш оператора равен

y

x



a(t) dt = A(x) − A(y). Ана-

логично определяется выигрыш инспектора. Пусть снова оператор

проводит нарушение в момент времени x, тогда ущерб, нанесенный

окружающей среде, равен

x

b(t) dt = B(x). Соответственно выиг-



рыш инспектора в данном случае равен −B(x).

В дальнейшем будем работать только с функциями A(x) и B(x).

Причем масштаб выигрышей считаем таким, что A(∞) = B(∞) = 0

и A(0) = B(0) = 1. Также отметим, что эти функции строго убывают.

Запишем выражения для функций выигрышей игроков (первый

игрок — оператор, второй — инспектор):

M

1

(x, y) =



A(x) − ¯

βA(y),


x ≤ y,

¯

αA(x) + αA(y), x > y;



M

2

(x, y) =



−B(x) + ¯

βB(y),


x ≤ y,

−¯

αB(x) − αB(y), x > y.



Здесь ¯

α = 1 − α, ¯

β = 1 − β.

Решение игры. Смешанными стратегиями игроков являются

функции распределения F

1

(x) и F



2

(y). Считаем, что они непрерыв-

ны справа. Если стратегии F

1

(x) и F



2

(y) образуют ситуацию равно-

весия по Нэшу, тогда для всех x ∈ [0, ∞) и для всех y ∈ [0, ∞) долж-

ны выполняться неравенства M

1

(x, F


2

) ≤ M


1

(F

1



, F

2

) и M



2

(F

1



, y) ≤

M

2



(F

1

, F



2

). Сформулируем теорему, которая устанавливает вид рав-

новесных стратегий в данной игре.

Теорема 1. Пусть (F

1

, F


2

) — ситуация равновесия по Нэшу в

рассматриваемой игре, причем функции распределения F

1

и F



2

не

имеют сингулярной компоненты, тогда эти функции обладают пе-



речисленными ниже свойствами.

1. Функция F

1

(x) имеет единственный скачок при x = 0.



2. Функция F

2

(y) не имеет скачков при всех x ∈ [0, ∞).



3. Существует число T ∈ (0, ∞) такое, что F

1

(T ) = F



2

(T ) = 1.

При этом F

1

(x) и F



2

(x) строго возрастают при x ∈ (0, T ).

Опираясь на результаты этой теоремы, легко составить уравне-

ния для определения равновесных стратегий и найти эти стратегии.

529


Теорема 2. Если рассматриваются функции F

1

и F



2

, не име-

ющие сингулярной компоненты, тогда в игре существует един-

ственная ситуация равновесия по Нэшу (F

1

, F


2

), в которой стра-

тегии игроков имеют следующий вид:

F

1



(x) =

α

α + ¯



β

+

¯



β

α + ¯


β

B(T )


B(x)

( ¯


β+α)/ ¯

β

,



F

2

(y) =



1

α



1

α

A(y)



α/ ¯

β

,



где число T определяется из равенства A(T ) = ¯

α

¯



β/α

. Выигрыши

игроков в ситуации равновесия определяются по формулам:

v

1



= M

1

(0, F



2

) =


α

α + ¯


β

+

¯



β

α + ¯


β

¯

α



(α+ ¯

β)/α


,

v

2



= M

2

(F



1

, 0) = −


α

α + ¯


β

¯



α ¯

β

α



B(T ) +

¯

β



2

α(α + ¯


β)

B(T )


(α+ ¯

β)/ ¯


β

,

из которых следует, что выигрыш первого игрока не зависит от



функции A(x).

Теперь вернемся к первоначальной формулировке задачи, когда

функции A(x) и B(x) были явно заданы, а именно, пусть a(t) =

ln(1/a)a


t

, где 0 < a < 1, b(t) = ln(1/b)b

t

. Тогда A(x) = a



x

, B(x) = b

x

,



Достарыңызбен бөлісу:
1   ...   43   44   45   46   47   48   49   50   ...   57




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет