Процессы управления и устойчивость



Pdf көрінісі
бет54/57
Дата27.12.2016
өлшемі30,48 Mb.
#549
1   ...   49   50   51   52   53   54   55   56   57

• S

i−1


закончил обслуживание клиента k[l

k

+ 1] (для i = 1 это



условие не применяется).

Формализуя эти условия, запишем уравнение в терминах идем-

потентного анализа [3], которому удовлетворяет вектор x, состоящий

из четырех компонент:

x(k[l

k

+ 1]) =



=



ε



ε

ε

ε



τ

1

(k[l



k

+ 1])


ε

ε

ε



ε

τ

2



(k[l

k

+ 1])



ε

ε

ε



ε

τ

3



(k[l

k

+ 1]) ε





 x(k[l

k

+ 1])⊕



586



τ



1

(k[l


k

])

e



ε

ε

ε



τ

2

(k[l



k

])

e



ε

ε

ε



τ

3

(k[l



k

])

e



ε

ε

ε



τ

4

(k[l



k

])



 x(k[l



k

]).


(1)

Здесь символ ⊕ обозначает идемпотентное сложение. Формула

(1), которую можно кратко записать

x(k[l


k

+1]) = A


2

(k[l


k

+1], k[l


k

+1])x(k[l

k

+1])⊕A


1

(k[l


k

+1], k[l


k

])x(k[l


k

]),


является неявным уравнением относительно x(k[l

k

+ 1]), решение ко-



торого имеет вид

x(k[l


k

+ 1]) = (A

2

(k[l


k

+ 1], k[l

k

+ 1]))


(A

1



(k[l

k

+ 1], k[l



k

])x(k[l


k

]),


где (A

2

(k[l



k

+ 1], k[l

k

+ 1]))


соответствует матрице:





e

τ



1

(k[l


k

+ 1])


τ

1

(k[l



k

+ 1])τ


2

(k[l


k

+ 1])


τ

1

(k[l



k

+ 1])τ


2

(k[l


k

+ 1])τ


3

(k[l


k

+ 1])


· · ·

· · ·


ε

ε

ε



e

ε

ε



τ

2

(k[l



k

+ 1])


e

ε

τ



2

(k[l


k

+ 1])τ


3

(k[l


k

+ 1]) τ


3

(k[l


k

+ 1]) e




 .

Предположим теперь, что клиент k несет убытки (издержки) h

0

k

за такт времени ожидания в буфере. Также предположим, что во



время обслуживания серверами клиенты терпят убытки h

1

k



, h

2

k



, h

3

k



и

h

4



k

за такт времени.

Прибывая в буфер, клиенты формируют очередь σ

j

= (l



1

, . . . , l

N

)

на обслуживание серверами на основе одного из принципов опти-



мальности (здесь l

k

— номер в очереди клиента k).



Убытки клиента k при сформированной очереди σ

j

расcчитыва-



ются по формуле:

F

σ



j

k

= x



1

(k[l


k

])h


0

k

+



3

i=1


(x

i+1


(k[l

k

]) − x



i

(k[l


k

]))h


i

k

+ τ



i

(k[l


k

])h


4

k

.



587

Введя переменные x

0

(k[l



k

]) и x


5

(k[l


k

]) и положив x

0

(k[l


k

]) ≡ 0,


x

5

(k[l



k

]) = x


4

(k[l


k

]) + τ


4

(k[l


k

]), можно записать выражение для F

σ

j

k



компактнее:

F

σ



j

k

=



4

i=0


(x

i+1


(k[l

k

]) − x



i

(k[l


k

]))h


i

k

.



Издержки каждого клиента принимаются за функционалы, для

которых могут быть найдены компромиссная точка, вектор Шепли

и т.д. [2]. Для приводимого ниже примера построен алгоритм нахож-

дения компромиссного решения.

2. Численный пример. Для рассматриваемой модели запро-

граммирован алгоритм нахождения компромиссного решения при

любом количестве серверов и количестве клиентов не более 9. Это

ограничение обусловлено тем, что при количестве клиентов равном

10 для вычислений требуется 290,3 МБ памяти, а при количестве

клиентов равном 11 – 3,5 ГБ памяти.

Для 4 серверов и 6 клиентов при заданных времени обслужива-

ния клиента k сервером i и убытках за такт времени:

τ

i

(k) =





2 3 4 2 5 1

4 1 1 3 1 7

3 5 7 4 2 8

6 7 3 4 9 3



 , h


i

k

=







3 2 3 5 1 9

5 2 1 3 3 1

4 7 2 2 3 4

2 2 8 9 8 5

9 5 3 2 4 2





компромиссная точка достигается при 311-м порядке очереди (σ

j

=

(4, 3, 1, 6, 2, 5)), при этом вычисления требуют 4,3462 сек. (в среднем



для 6 запусков программы) процессорного времени и 34,6 КБ памяти

на персональном компьютере Intel PentiumIII-650 MHz.

Литература

1. Baccelli F., Cohen G., Olsder G.J. Quadrat J.-P. Synchronization

and Linearity: an algebra for discrete event systems. New-York: John

Wiley & Sons, 1992.

2. Малафеев О.А. Управляемые конфликтные системы: Учеб. посо-

бие. СПб.: Изд-во СПбГУ, 2000. 280 с.

3. Маслов В.П., Колокольцов В.Н. Идемпотентный анализ и его при-

менение в оптимальном управлении. М.: ФИМЛ, 1994. 142 с.

588


Оглоблин Я.В.

Санкт-Петербургский государственный университет

Об оптимальности радиальной стратегии

Рекомендовано к публикации профессором Петросяном Л.А.

Введение. В этой работе рассмотрена игра простого преследо-

вания в круге, которая является одним из вариантов игры простого

преследования. Данная задача на полуплоскости была решена Пет-

росяном Л.А. Им была предложена стратегия параллельного сбли-

жения, которая решает игру для догоняющего игрока и сводит за-

дачу к задаче теории управления. Эта же стратегия является оп-

тимальной и для игры на плоскости. Впервые эта стратегия была

рассмотрена в [1].

В статье вводится понятие радиальной стратегии, которая явля-

ется аналогом стратегии параллельного сближения, но для случая

круговой границы. Будет показана ее оптимальность для радиаль-

ной исходной ситуации.

В игре простого преследования есть два игрока: догоняющий

(P ) и убегающий (E). Игра рассматривается на плоскости. Игроки

управляют поведением точек p и e, соответственно. В каждый мо-

мент времени игроки выбирают управляющие векторы u (игрок P ) и

v (игрок Е) и система дифференциальных уравнений, описывающая

игру, имеет вид:

˙p = u(p, e, v),

˙e = v(p, e),

||u|| ≤ α, ||v|| ≤ β, α < β.

После наступления момента поимки (совпадения точек игро-

ков) игра заканчивается. Выигрышем игрока E называется время

от момента начала игры до момента поимки. Выигрыш P равен вы-

игрышу E со знаком минус. Игра происходит в круге, следовательно:

ρ(O, p) ≤ R,

ρ(O, e) ≤ R,

где R – радиус круга, в котором происходит игра, а точка O – центр

этого круга. Этот круг в дальнейшем будет называться игровым

кругом. Граница его – ограничение игры.

Радиальная ситуация – ситуация, в которой точки игроков на-

ходятся на одном радиусе и точка p находится ближе к центру, чем

точка e, или точки игроков совпадают.

589


Невырожденная ситуация – ситуация, в которой если игроки

применяют погонную стратегию, то точка e достигнет границы игро-

вой области (границы круга) до того как наступит момент поимки.

Будем рассматривать игру, в которой начальная ситуация обла-

дает свойством невырожденности и радиальности. В этой работе бу-

дет показано, что оптимальной стратегией игрока P будет сохране-

ние радиальности в течении всей игры (радиальная стратегия), при

условии, что игрок E придерживается оптимальной стратегии.

Замечание 1. Игра заканчивается на границе, если оба игро-

ка пользуются оптимальными стратегиями. Это было доказано в [2]

для игры без дискриминации игрока E, но то же доказательство без

изменений проходит и для данного случая.

Замечание 2. В дальнейшем, для простоты игрок будет ассоци-

ироваться с точкой, которой он управляет, так как это не приведет к

неоднозначности. Например, вместо слов "Игрок P перемещает свою

точку из . . . в . . . ", будет написано "Игрок P переместился из . . . в

. . . ". Вместо слов "Наступил момент поимки" — "Игрок P поймал

игрока E".

Упрощение. В дальнейшем будет изучаться упрощенный вари-

ант игры. Будем предполагать, что выбор игроками направления

вектора скорости происходит не непрерывно, а через некоторые ин-

тервалы времени. В начале интервала оба игрока выбирают свои

скорости (при этом игрок P знает выбор противника) и потом в те-

чение всего интервала двигаются с этими скоростями. По оконча-

нии интервала игроки снова выбирают свои скорости на следующий

интервал. При этом поимка может произойти и внутри интервала.

Длины интервалов могут быть сколь угодно малыми и неравными

между собой. При этом также считаем, что в множестве точек вы-

бора нет точек сгущения. Эти интервалы будем называть шагами.

1 этап. Игрок P совершает обгон по радиусу, если из радиаль-

ной ситуации за шаг он смещается так, что угол между радиусами,

проходящими через исходное и конечное его положение больше, чем

у противника.

Игрок P отстает по радиусу, если из радиальной ситуации за

шаг он смещается так, что угол между радиусами, проходящими

через исходное и конечное его положение меньше, чем у противника.

Допустим, что в некоторый момент времени игрок P решил со-

вершить обгон по радиусу (см. рис. 1) и перешел из положения p

0

в

590



положение p

1

, в это же время игрок E перешел из положения e



0

в

положение e



1

. Построим точку p

1

так, что отрезок p



1

p

1



ортогонален

радиусу Oe

1

и точка F пересечения отрезков p



1

p

1



и Oe

1

делит отре-



зок p

1

p



1

пополам. Тогда ситуация (p

1

, e


1

) ничем, кроме симметрии,

не отличается от (p

1

, e



1

). Но положения p

1

игрок P может достичь



за тот же шаг, не используя всех своих возможностей, так как от-

резок p


0

p

1



короче, чем p

0

p



1

. А следовательно, это не оптимально.

Очевидно, что такая ситуация будет верна для любого положения в

игре, когда начальная ситуация радиальная. Таким образом доказа-

на следующая лемма.

Рис. 1.


Лемма 1. Когда игрок P начинает отклоняться от радиальной

стратегии, то оптимальным может быть только отклонение с

отставанием по радиусу.

В радиальной ситуации игроку E неважно, в какую сторону от

радиуса смещаться. Поэтому для простоты рассуждений будем счи-

тать, что игрок E будет выбирать движение в ту же сторону от теку-

щего радиуса, что и на предыдущем промежутке времени, если игрок

P использует радиальную стратегию или движется с отставанием по

радиусу. В момент, когда игрок P начинает обгонять по радиусу (си-

туация (p

1

e

1



)), продолжит двигаться по ранее выбранной стратегии,

но по траектории симметричной относительно радиуса Oe. В итоге

результат обгона по радиусу становится эквивалентен отставанию,

но P продвигается на меньшее расстояние, чем мог бы.

2 этап. Предположим, что игрок P отклонился от радиальной

стратегии на предпоследнем шаге. Точку, в которой происходит по-

591


имка, обозначим K.

Траектория будет локально центральновыпуклой на отрезке тра-

ектории, если для каждой угловой точки этого отрезка выполняет-

ся условие: меньший из углов, образованных линейными отрезками

траектории, сходящимися в этой точке, содержит в себе центр игро-

вого круга. Если на отрезке траектории все окончания шагов явля-

ются угловыми точками, тогда будем говорить о локальной строгой

центральновыпуклости.

Лемма 2. Оптимальная траектория движения игрока P ло-

кально строго центральновыпукла, если игрок E смещается по оп-

тимальной траектории.

Рис. 2.


Доказательство. Допустим, что игрок E смещается на двух по-

следних шагах по выбранной стратегии так, что траектория смеще-

ния не центральновыпуклая (см. рис. 2).

Тогда, если игрок E вместо такого поведения переместится из

положения e

0

в точку K по прямой, то он достигнет точки K быст-



рее, чем по выбранной стратегии. Очевидно, что если игрок P не

мог поймать игрока E до точки K, то не сможет и при таком из-

менении стратегии. При подобном смещении игрок E оказывается в

точке K до конца последнего шага. Таким образом, получаем, что

игрок E может улучшить свою стратегию. Эти рассуждения прохо-

дят и для большего числа шагов, на которых траектория E будет

внешневыпуклой. Следовательно, стратегия игрока E, не дающая

центральновыпуклую траекторию, неоптимальна.

Теперь предположим, что игрок E смещался на двух последних

шагах по прямой, т.е. точка e

1

лежит на отрезке e



0

K. Следовательно,

592


так как скорость игрока P выше и сам игрок ближе к центру игро-

вого круга, то радиальная стратегия игрока P будет давать строго

центральновыпуклую траекторию. Если сместить точку e

1

дальше



от центра игрового круга, чтобы траектория стала центральновы-

пуклой, то траектория игрока P станет тем более центральновыпук-

лой. Лемма доказана.

Рис. 3.


Рассмотрим отклонение на 3-х шагах (см. рис. 3). Предположим

что игрок P отклоняется с отставанием по радиусу. Строим окруж-

ность L

k

, с центром в точке K и проходящую через точку p



1

и L


p

, с


центром в точке p

0

и проходящую через точку p



1

. Дуги этих окруж-

ностей можно увидеть на рисунке. Пересечение кругов, ограничен-

ных этими окружностями, достигается игроком P только при обгоне

по радиусу, так как траектория игрока P строго центральновыпукла.

Построим точку p

1

на дуге окружности L



p

с отставанием по радиусу.

Отрезок p

1

K больше, чем p



1

K, а значит игрок P не успеет добежать

до точки K на последнем шаге.

Заменим окружности L

p

и L


k

на касательные, проходящие через

узлы траектории Р. Это не даст ошибки в результате.

Лемма 3. На последнем шаге игрок P , двигаясь из положения

p

1

, не сможет догнать игрока Е.



Доказательство. Построим прямую L

p

, ограничивающую мно-



жество, которое может достичь игрок Р на предпоследнем шаге из

точки p


0

(см. рис. 4). Построим прямую L

k

, ограничивающую множе-



ство точек, из которых игрок P может достичь точку K на последнем

шаге. Так как радиальная траектория игрока P центральновыпук-

593


ла, то точка p

1

(отклоненная) и точка K будут по разные стороны



от прямой L

k

. Следовательно, для ситуации (p



1

, e


1

), точка K лежит

Рис. 4.

в круге Апполония. Тогда весь отрезок e



1

K содержится в круге Ап-

полония. Следовательно, какую бы точку на отрезке e

1

K не выбрал



игрок Р, он достигнет ее позже, чем игрок Е. Лемма доказана.

Построим множество, ограниченное прямой L

k

, радиусом, про-



ходящим через e

1

, и границей игрового круга. Назовем его прибли-



женным множеством достигаемости (S

k

) точки K для игрока P



на последнем шаге (см. рис. 4) (для построения точного множества

надо использовать не прямую, а дугу L

k

как на рис. 3).



Из доказательства леммы 3 видно, что если игрок P отклонится и

к началу последнего шага не окажется в одной из точек множества

S

k

, то он не сможет догнать игрока E на последнем шаге. Такое



отклонение игроку P не выгодно.

Лемма 4. При отклонении на двух последних шагах игрок P не

сможет догнать игрока E на предпоследнем шаге.

Дoказательство. Так как игрок P не может достичь точки e

1

из

точки p



0

за шаг, следовательно, эта точка находится внутри окруж-

ности Апполония для ситуации (p

0

, e



0

) . Следовательно, и все точки

отрезка e

0

e



1

находятся внутри окружности Апполония для ситуа-

ции (p

0

, e



0

). Т.е. поимка в них невозможна, если игрок E не будет

отклоняться от своей стратегии. Лемма доказана.

3 этап. Рассмотрим отклонение на трех последних шагах.

Лемма 5. На первом шаге игрок P не сможет поймать игрока

Е.

594



Рассуждения ничем не отличаются от леммы 4, только другие

обозначения.

Лемма 6. Если игрок P на первом шаге отклонится от радиаль-

ной стратегии, то он не сможет на втором шаге догнать игрока

Е.

Рассуждения полностью аналогичны рассуждениям леммы 3 (с



изменениями в обозначениях), при этом точка e

2

находится не на



окружности Апполония, а внутри. Откуда следует, что и весь от-

резок e


1

e

2



находится внутри окружности Апполония для ситуации

(p

1



, e

1

) и для ситуации (p



1

, e


1

). Лемма доказана.

Лемма 7. Если игрок P отклонился на первом шаге, то вне

зависимости от того, как он двигался на втором шаге, он не смо-

жет догнать игрока E на последнем шаге. В том числе, и в точке

K.

Доказательство этой леммы приведем лишь схематично. Как и в



лемме 3 строится множество S

k

. Затем, для этого множества также



строится приближенное множество достигаемости S

k

за предпослед-



ний шаг. Игрок P , отклонившись на первом шаге с отставанием по

радиусу, не может попасть в множество S

k

, соответственно, на вто-



ром шаге он не попадает в S

k

и в итоге, к концу третьего шага, он



не попадает в точку K. Это означает, что выигрыш игрока E увели-

чивается.

Замечание 1. Точно также, при отклонении за n шагов до конца

игры, строится система множеств достигаемости, и получается, что

игрок P не попадает в соответствующие множества вовремя, даже

если он через несколько шагов вернется на общий с E радиус. Что

приводит к уменьшению выигрыша.

Замечание 2. При построении доказательства предполагалось,

что игрок E не меняет своей траектории, кроме случая обгона по

радиусу. Из доказательства легко увидеть, что если игрок E будет

рационально реагировать на отклонение игрока P от радиальной

стратегии, то он выиграет не меньше.

Если игрок E движется строго по радиусу к границе игрового

круга, то смысла уходить с радиуса у игрока P нет, так как это при-

ведет лишь к потерям. А значит, и в этом случае игроку P выгодно

придерживаться радиальной стратегии.

Таким образом, доказана следующая теорема.

Теорема. Если игроки оказались на одном радиусе, причем иг-

рок P ближе к центру игрового круга и E использует централь-

595


новыпуклую траекторию, то оптимальным поведением для игрока

P будет сохранять радиальную ситуацию до момента поимки, а

оставшуюся часть скорости тратить на сближение с игроком Е.

Замечание 1. В формулировке теоремы не упоминается условие

невырожденности исходной ситуации, так как в случае вырожденной

игры оптимальной стратегией для обоих игроков будет погонная, а

она при радиальной исходной ситуации для игрока P совпадает с

радиальной стратегией.

Замечание 2. При доказательстве теоремы везде использова-

лось предположение, что игрок E на каждом шаге, когда исходная

ситуация радиальная, при выборе направления движения всегда вы-

бирает одно и то же. Это не является ограничением стратегий игрока

Е, так как радиальная ситуация симметрична относительно радиу-

са, на котором находятся игроки. И в случае, если E выбрал другое

направление, можно его дальнейшую траекторию симметрично отра-

зить от этого радиуса и для стратегий игроков ничего не изменится.

Заключение. В этой работе было показано, что при достаточно



Достарыңызбен бөлісу:
1   ...   49   50   51   52   53   54   55   56   57




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет