Процессы управления и устойчивость



Pdf көрінісі
бет49/57
Дата27.12.2016
өлшемі30,48 Mb.
#549
1   ...   45   46   47   48   49   50   51   52   ...   57

x



ji

− r


i

,

если существует j такое, что



x

ji

≥ y



i

,

h



ji

= max


s∈S

j

(h



js

),

где



j = 1, . . . , m и

i = 1, . . . , n,

0,

если для любого j



x

ji

< y

i

,

h



ji

= max


s∈S

j

(h



js

),

где



j = 1, . . . , m и

i = 1, . . . , n.

Рассматривается k-й шаг игры. Пусть после (k − 1)-го шага игры

продавцами было продано p лотов покупателям. На k-ом шаге игры

в результате выбора покупателями и продавцами своих стратегий

x

ji



∈ X

j

и y



i

∈ Y


i

, где i = 1, . . . , (n − p) и j = 1, . . . , (m − p), реализу-

ется ситуация

z

k



= x

11

, x



12

, . . . , x

(m−p)(n−1−p)

, x


(m−p)(n−p)

; y


1

, . . . , y

(n−p)

) ,


после чего, соответственно, определяются выигрыши покупателей и

продавцов: H

j

z

k



) = v

ij

− x



ij

— для игрока, купившего лот на k-ом

шаге игры, и K

i

z



k

) = x


ij

− r


i

— для игрока, продавшего лот на k-ом

шаге игры, где i = 1, . . . , (n − p) и j = 1, . . . , (m − p). На k-ом шаге

игры для любой реализовавшейся ситуации z

k

∈ X


1

× . . . × X

(m−p)

×

539



Y

1

×. . .×Y



(n−p)

= Z


k

получаем следующую подыгру аукциона первой

цены в нормальной форме:

Γ

k



f

= M = {1, . . . , (m − p) }, N = {1, . . . , (n − p) }, X

j

, Y


i

, H


j

, K


i

,

где



H

j

(z



k

) =












v



ij

− x


ij

,

если h



ji

= max


s∈S

j

(h



js

),

S



j

= ∅ и


x

ji

≥ y



i

,

где



j = 1, . . . , (m − p) и

i = 1, . . . , (n − p),

0,

если S


j

= ∅,


x

ji

< y

i

,

где



j = 1, . . . , (m − p) и

i = 1, . . . , (n − p).

K

i

(z



k

) =
















x



ji

− r


i

,

если существует j такое, что



x

ji

≥ y



i

,

h



ji

= max


s∈S

j

(h



js

),

где



j = 1, . . . , (m − p) и

i = 1, . . . , (n − p),

0,

если для любого j



x

ji

< y

i

,

h



ji

= max


s∈S

j

(h



js

),

где



j = 1, . . . , (m − p) и

i = 1, . . . , (n − p).

Из вышеизложенного вытекает, что в соответствии с правилами иг-

ры в аукционе Γ

k

f

j-й покупатель выигрывает лот i-го продавца в



ситуации z

k

, если назначенная им цена за лот является самой высо-



кой среди всех цен, назначенных другими покупателями за этот лот

и не меньше цены, назначенной продавцом за лот. В случае, если по-

купатель выигрывает более одного лота, то он получает только один

лот, доходность от выигрыша которого была самой высокой среди

всех доходностей по другим выигранным им лотам. В аукционе Γ

k

f



i-й продавец реализует свой лот в ситуации z

k

, если назначенная им



цена за лот не выше хотя бы одной из объявленных цен за этот лот

покупателями. В случае, если покупатель, объявивший максималь-

ную цену по этому лоту, получает другой лот, то продавец продает

этот лот покупателю, цена которого за этот лот была второй по ве-

личине, не меньше цены продавца, а доходность покупателя от вы-

игрыша этого лота была самой высокой среди всех его доходностей

от выигранных им лотов.

540


2. Компромиссное решение игры Γ

k

f



. В этом пункте описы-

вается алгоритм нахождения компромиссного решения для игры Γ

k

f

.



ШАГ 1. Строится идеальный вектор M

= [M


1

, . . . , M

m

,

M



m+1

, . . . , M

m+n

], где M


j

= max{H


j

(z

k



) z

k

∈ Z



k

} , j = 1, . . . , m

(M

j

– максимальное значение функции выигрыша j-го покупате-



ля) и M

i

= max{K



i

(z

k



) z

k

∈ Z



k

} , i = (m + 1), . . . , (m + n) (M

i



максимальное значение функции выигрыша i-го продавца).



ШАГ 2. Находится в каждой точке z

k

для всех игроков откло-



нение от максимума (M

j

и M



i

) для остальных значений функции

выигрыша игроков (M

j

− H



j

(z

k



) и (M

i

− K



i

(z

k



)).

ШАГ 3. Из найденных отклонений (M

j

−H

j



(z

k

)) и (M



i

−K

i



(z

k

))



для каждой точки z

k

выбирается максимальное:



max

j∈M


i∈N

M

j



− H

j

z



k

, M


i

− K


i

z

k



.

ШАГ 4. Выбирается минимальное из этих максимальных от-

клонений min

z

k



∈Z

k



max

j∈M


i∈N

M

j



− H

j

z



k

, M


i

− K


i

z

k



 . Ситуация

z

k

, в которой достигается минимум, является компромиссным реше-



нием игры Γ

k

f



.

Литература

1. Paul R. Milgrom, Robert J. Weber // Econometrica, 1982. Vol. 50,

issue 5. P. 1089–1123.

2. Малафеев О.А. Управляемые конфликтные системы. СПб: Изд-

во СПбГУ, 2000.

3. Малафеев О.А., Грицай К.Н. Оптимальное управление в динами-

ческих играх аукциона // Теория управления и теория обобщен-

ных решений уравнений Гамильтона–Якоби: Тез. докл. Между-

нар. семинара, посв. 60-летию акад. А.И. Субботина / Под ред.

В.С. Пацко. Екатеринбург: Изд-во Урал. ун-та, 2005. С. 101–102.

4. Петросян Л.А., Зенкевич Н.А. Теория игр. М.: Высш. шк., 1998.

304 с.

541


Зенкевич Н.А., Сырова А.К.

Санкт-Петербургский государственный университет

Ценовое поведение дилера на валютном рынке

при условии дифференциации потребителей

Введение. В условиях рыночной экономики актуально исследо-

вание различных рынков, в том числе финансовых. В данной работе

построена и исследована модель ценового поведения дилера на ва-

лютном рынке. Предполагается, что на рынке есть две валюты –

национальная и иностранная, и, что весь валютный рынок – внеш-

ний рынок, разбит на большое число внутренних рынков, в каждом

из которых работает только один дилер. Дилеры могут совершать

операции друг с другом. Считается, что дилер устанавливает курсы

покупки и продажи валюты на своем внутреннем рынке в начале

короткого периода, и эти курсы остаются неизменными на протя-

жении всего этого периода, такой период будем называть торговой

сессией. Примем временную продолжительность торговой сессии за

единицу. Результаты, полученные при сделанных предположениях,

могут быть использованы при моделировании ситуаций, близких к

реальным.

Предположим, что внешний рынок разбит на N внутренних рын-

ков, и потребители равномерно распределены между внутренними

рынками.


1. Рассмотрим сначала случай, когда дилер полностью контро-

лирует свой внутренний рынок, устанавливая курсы покупки и про-

дажи валюты, то есть потребители, совершающие сделки на j -ом

внутреннем рынке, не могут работать с каким-либо другим диле-

ром. Тогда функции спроса и предложения, характеризующие j -й

рынок, выглядят следующим образом:

p

j

(t) = a



j

(t) − cs


a

j

(t),



q

j

(t) = b



j

(t) + cs


b

j

(t),



где s

a

j



(t) – курс покупки валюты на j -ом рынке, s

b

j



(t) – курс продажи

валюты на j -ом рынке, a

j

(t), b


j

(t) – характеристики j -го рынка; с –

параметр, описывающий чувствительность потребителей к измене-

нию цены на рынке.

Сделаем замену переменных:

s

j



(t) = (s

a

j



(t) + s

b

j



(t))/2,

z

j



(t) = (s

a

j



(t) − s

b

j



(t))/2.

542


Обозначим

x

j



(t) – количество иностранной валюты, имеющееся

у дилера в данный момент времени – начальная позиция диле-

ра. Определим размер возможных операций на внешнем рынке как

P

j



(t) − Q

j

(t), где P



j

(t) – размер продаж на внешнем рынке, Q

j

(t) –


размер покупок на внешнем рынке. Хотя дилер может не знать точ-

но, какую цену назначают другие дилеры, однако предполагается,

что он знает средний курс покупки S

a

(t) и средний курс продажи



S

b

(t) на внешнем рынке. Эту информацию он принимает во внима-



ние, когда осуществляет сделку.

Функция дохода дилера будет иметь вид

R

j

(t) = p



j

s

a



j

(t) − q


j

s

b



j

(t) + P


j

(t)S


b

(t) − Q


j

(t)S


a

(t).


Введем новые обозначения: α

j

(t) = a



j

(t) − b


j

(t), β


j

(t) = a


j

(t) + b


j

(t),


δ = 2c. Тогда функцию дохода можно записать в следующем виде:

R

j



(t) = α

j

(t)s



j

(t)+β


j

(t)z


j

(t)−δ[s


2

j

(t)+z



2

j

(t)]+P



j

(t)S


a

(t)−Q


j

(t)S


b

(t).


Дилер стремится максимизировать свой доход к концу определенно-

го периода при условии, что в конце это периода его запас валюты

будет равен нулю: x

j

(t) − p



j

(t) + q


j

(t) − P


j

(t) + Q


j

(t) = x


j

(t + 1) = 0.

Получаем задачу максимизации:

max


s

j

(t),z



j

(t),P


j

(t),Q


j

(t)


R

j

(t)



при условии

x

j



(t) − α

j

(t) + δs



j

(t) − P


j

(t) + Q


j

(t) = 0.


Для решения задачи строим функцию Лагранжа:

L

j



(t) = R

j

(t) + µ



j

(t)[x


j

(t) − α


j

(t) + δs


j

(t) − P


j

(t) + Q


j

(t)].


Решая задачу методом множителей Лагранжа, получаем:

α

j



(t) + 2δs

j

(t) + δµ



j

(t) = 0,


β

j

(t) − 2δz



j

(t) = 0,


µ

j

(t) = S



b

(t) ⇐ P


j

(t) > 0, Q

j

(t) = 0,


µ

j

(t) = S



a

(t) ⇐ P


j

(t) = 0, Q

j

(t) > 0,


S

b

(t) < µ



j

(t) < S


a

(t) ⇐ P


j

(t) = Q


j

(t) = 0.


Из решения следует, что средний курс зависит и от операций на

внешнем рынке, и от начальной позиции, а на полуразность влияют

только характеристики внутреннего рынка:

543


s

j

(t) = s



0

j

(t) − (1/δ)[x



j

(t) − P


j

(t) + Q


j

(t)],


z

j

(t) = β



j

(t)/2δ,


µ

j

(t) = s



0

j

(t) − (2/δ)[x



j

(t) − P


j

(t) + Q


j

(t)],


где s

0

j



(t) = α

j

(t)/δ.



Операции на внешнем рынке зависят от начальной позиции и

внешних курсов следующим образом:

P

j

(t) > 0, Q



j

(t) = 0 ⇐ x

j

(t) > (2/δ)[s



0

j

(t) − S



b

(t)] ≡ x


u

j

(t),



P

j

(t) = 0, Q



j

(t) > 0 ⇐ x

j

(t) < (2/δ)[s



0

j

(t) − S



a

(t)] ≡ x


l

j

(t),



P

j

(t) = Q



j

(t) = 0 ⇐ x

l

j

(t) < x



j

(t) < x


u

j

(t).



С учетом указанных неравенств получаем:

[s

0



j

(t) + S


b

(t)]/2 ≤ s

j

(t) ≤ [s


0

j

(t) + S



a

(t)]/2].


Таким образом, получили интервал, из которого дилер может вы-

брать средний курс в целях максимизации своего дохода.

2. Рассмотрим теперь случай, когда потребители, находящиеся на

рынке, делятся на две группы. С одной стороны, это хорошо инфор-

мированные потребители, которые имеют возможность совершать

сделки на внешнем рынке как только замечают, что на внутреннем

рынке цена менее выгодна. С другой стороны, это потребители, для

которых не представляется возможным совершать сделки на внеш-

нем рынке. В этом случае функции спроса и предложения будут

выглядеть следующим образом:

p

j

(t) = a



j

(t) − cs


a

j

(t) − d[s



a

j

(t) − S



a

(t)],


q

j

(t) = b



j

(t) + cs


b

j

(t) + d[s



b

j

(t) − S



b

(t)],


где d – параметр, показывающий насколько чувствительны потре-

бители к небольшому различию цен.

Введем обозначения: α

j

(t) = a



j

(t) − b


j

(t), β


j

(t) = a


j

(t) + b


j

(t),


δ = 2c, η = 2d, S

j

(t) = (S



a

j

(t) + S



b

j

(t))/2, Z



j

(t) = (S


a

j

(t) − S



b

j

(t))/2.



Тогда функция дохода будет иметь вид:

R

j



(t) = [α

j

(t) + ηS(t)]s



j

(t) + [β


j

(t) + ηZ(t)]z

j

(t)−


−(δ + η)[s

2

j



(t) + z

2

j



(t)] + P

j

(t)[S(t) − Z(t)] − Q



j

(t)[S(t) + Z(t)].

544


Опять ставим задачу максимизации, при условии, что в конце

периода количество валюты у дилера будет равно 0:

max

s

j



(t),z

j

(t),P



j

(t)−Q


j

(t)


R

j

(t),



x

j

(t) − [α



j

(t) − (δ + η)s

j

(t) + ηS(t)] − [P



j

(t) − Q


j

(t)] = 0.

Решая задачу условной оптимизации методом множителей Лагран-

жа, получаем:

s

j

(t) = [α



j

(t) + ηS(t)]/2(δ + η) + (1/2)µ

j

(t),


z

j

(t) = [β



j

(t) + ηZ(t)]/2(δ + η),

µ

j

(t) = S



b

(t) ⇐ P


j

(t) > 0,


µ

j

(t) = S



a

(t) ⇐ Q


j

(t) > 0,


S

b

(t) < µ



j

(t) < S


a

(t) ⇐ P


j

(t) = Q


j

(t) = 0.


Если P

j

(t) = Q



j

(t) = 0, то средний курс выражается из гранич-

ного условия

s

j



(t) = [α

j

(t) + ηS(t)x



j

(t)]/(δ + η).

Выражения для курсов на внутреннем рынке показывают их за-

висимость от курсов на внешнем рынке. Следует обратить внимание,

что полуразность курсов зависит теперь не только от характеристик

конкретного внутреннего рынка, но и от курсов на внешнем рынке.

Литература

1. Suvanto A. Foreign exchange dealing // The Research Institute of the

Finnish Economy. 1993.

2. Salo S., Suvanto A. Consistency of Cross Exchange Rates Across

Market Makers // Helsinki School of Economics Working Papers F-

306. 1993.

3. Hagerty K. Equilibrium Bid-Ask Spreads in Markets with Multiple

Assets // Review of Economic Studies 58. 1991. P. 237–257.

545


Зятчин А.В.

Санкт-Петербургский государственный университет

Народная теорема в одной стохастической игре

Рекомендовано к публикации доцентом Зенкевичем Н.А.

1. Постановка задачи. Рассмотрим статическую игру в нор-

мальной форме G(x) = (N, {q

i

}

i∈N



, {Π

i

(·)}



i∈N

), где x – некий пара-

метр, Π

i

(·) = Π



i

(q

1



, . . . , q

n

, x) – непрерывная функция по x. Предпо-



ложим, что в игре G(x) существует ситуация равновесия по Нэшу в

чистых стратегиях q

(x) = (q


1

(x), . . . , q



n

(x)) для каждого значения



x, q

i



(x) – непрерывны по x.

Предположим, что параметр x эволюционирует в соответствии со

стохастическим процессом вида dx = µxdt + σxdz,

x(t


0

) = x


0

, где


µ – параметр, характеризующий средний ожидаемый темп роста, σ

– параметр, характеризующий величину неопределенности.

В [2] решена следующая задача: для любой вероятности мень-

ше единицы определить начальное состояние x

0

, где dx = µxdt +



σxdz,

x(t


0

) = x


0

, так, чтобы значения x(t), при t > 0, превосходи-

ли значения заданного параметра A с заданной вероятностью. Для

вероятности 0,95 было определено минимальное из таких значений,

x

min


0

:

x



min

0

= Ae



2σ2

2µ−σ2


,

при 2µ − σ > 0.

Значения x

0

> x



min

0

будем называть допустимыми. Определим



динамическую повторяющуюся стохастическую игру Γ(t, x). Пусть

игра G(x) повторяется в каждый момент времени t. Выигрыш в игре

Γ(t, x) определяется следующим образом:

W

i



(t, x(t), q

i

(x(t))) = max



q

i



t

e

−rt



Π

i

(q(x(t)), x(t))dt,



t ≥ 0.

Обозначим H(t) = {q

1

(τ ), . . . , q



n

(τ )}, τ ∈ [0, t], историю процесса.

Будем предполагать, что игроки обладают полной информацией об

игре. Необходимо построить абсолютное равновесие в игре Γ(t, x(t)).

546


2. Народная теорема. Пусть существует такая ситуация

q(x(t)) = (q

1

(x(τ )), . . . , q



n

(x(τ ))), τ ∈ [0, t], при которой в каждой

игре G(x) Π

i

(q(x(t))) > Π



i

(q



(x(t))). Введем обозначение соответ-

ствующей истории: H(t) = {q

1

(t), . . . , q



n

(t)}. Построим функцию

q



(H(t), x(t)) =



q(x(t)),

H(t) = H(t),

q



(x(t)),



H(t) = H(t),

которую будем называть стратегией наказания.

Теорема. Пусть для некоторой вероятности p > 0 существует

допустимое начальное значение x

0

и параметр δ



> 0 такие, что

Π

i

(q(x(t)), x(t)) − Π



i

(q



(x(t)), x(t)) > δ

, dx = µxdt + σxdz. Тогда с



вероятностью p существует такое значение r

> 0, что для всех



0 < r ≤ r

, q





Достарыңызбен бөлісу:
1   ...   45   46   47   48   49   50   51   52   ...   57




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет