x
ji
− r
i
,
если существует j такое, что
x
ji
≥ y
i
,
h
ji
= max
s∈S
j
(h
js
),
где
j = 1, . . . , m и
i = 1, . . . , n,
0,
если для любого j
x
ji
< y
i
,
h
ji
= max
s∈S
j
(h
js
),
где
j = 1, . . . , m и
i = 1, . . . , n.
Рассматривается k-й шаг игры. Пусть после (k − 1)-го шага игры
продавцами было продано p лотов покупателям. На k-ом шаге игры
в результате выбора покупателями и продавцами своих стратегий
x
ji
∈ X
j
и y
i
∈ Y
i
, где i = 1, . . . , (n − p) и j = 1, . . . , (m − p), реализу-
ется ситуация
z
k
= x
11
, x
12
, . . . , x
(m−p)(n−1−p)
, x
(m−p)(n−p)
; y
1
, . . . , y
(n−p)
) ,
после чего, соответственно, определяются выигрыши покупателей и
продавцов: H
j
z
k
) = v
ij
− x
ij
— для игрока, купившего лот на k-ом
шаге игры, и K
i
z
k
) = x
ij
− r
i
— для игрока, продавшего лот на k-ом
шаге игры, где i = 1, . . . , (n − p) и j = 1, . . . , (m − p). На k-ом шаге
игры для любой реализовавшейся ситуации z
k
∈ X
1
× . . . × X
(m−p)
×
539
Y
1
×. . .×Y
(n−p)
= Z
k
получаем следующую подыгру аукциона первой
цены в нормальной форме:
Γ
k
f
= M = {1, . . . , (m − p) }, N = {1, . . . , (n − p) }, X
j
, Y
i
, H
j
, K
i
,
где
H
j
(z
k
) =
v
ij
− x
ij
,
если h
ji
= max
s∈S
j
(h
js
),
S
j
= ∅ и
x
ji
≥ y
i
,
где
j = 1, . . . , (m − p) и
i = 1, . . . , (n − p),
0,
если S
j
= ∅,
x
ji
< y
i
,
где
j = 1, . . . , (m − p) и
i = 1, . . . , (n − p).
K
i
(z
k
) =
x
ji
− r
i
,
если существует j такое, что
x
ji
≥ y
i
,
h
ji
= max
s∈S
j
(h
js
),
где
j = 1, . . . , (m − p) и
i = 1, . . . , (n − p),
0,
если для любого j
x
ji
< y
i
,
h
ji
= max
s∈S
j
(h
js
),
где
j = 1, . . . , (m − p) и
i = 1, . . . , (n − p).
Из вышеизложенного вытекает, что в соответствии с правилами иг-
ры в аукционе Γ
k
f
j-й покупатель выигрывает лот i-го продавца в
ситуации z
k
, если назначенная им цена за лот является самой высо-
кой среди всех цен, назначенных другими покупателями за этот лот
и не меньше цены, назначенной продавцом за лот. В случае, если по-
купатель выигрывает более одного лота, то он получает только один
лот, доходность от выигрыша которого была самой высокой среди
всех доходностей по другим выигранным им лотам. В аукционе Γ
k
f
i-й продавец реализует свой лот в ситуации z
k
, если назначенная им
цена за лот не выше хотя бы одной из объявленных цен за этот лот
покупателями. В случае, если покупатель, объявивший максималь-
ную цену по этому лоту, получает другой лот, то продавец продает
этот лот покупателю, цена которого за этот лот была второй по ве-
личине, не меньше цены продавца, а доходность покупателя от вы-
игрыша этого лота была самой высокой среди всех его доходностей
от выигранных им лотов.
540
2. Компромиссное решение игры Γ
k
f
. В этом пункте описы-
вается алгоритм нахождения компромиссного решения для игры Γ
k
f
.
ШАГ 1. Строится идеальный вектор M
= [M
1
, . . . , M
m
,
M
m+1
, . . . , M
m+n
], где M
j
= max{H
j
(z
k
) z
k
∈ Z
k
} , j = 1, . . . , m
(M
j
– максимальное значение функции выигрыша j-го покупате-
ля) и M
i
= max{K
i
(z
k
) z
k
∈ Z
k
} , i = (m + 1), . . . , (m + n) (M
i
–
максимальное значение функции выигрыша i-го продавца).
ШАГ 2. Находится в каждой точке z
k
для всех игроков откло-
нение от максимума (M
j
и M
i
) для остальных значений функции
выигрыша игроков (M
j
− H
j
(z
k
) и (M
i
− K
i
(z
k
)).
ШАГ 3. Из найденных отклонений (M
j
−H
j
(z
k
)) и (M
i
−K
i
(z
k
))
для каждой точки z
k
выбирается максимальное:
max
j∈M
i∈N
M
j
− H
j
z
k
, M
i
− K
i
z
k
.
ШАГ 4. Выбирается минимальное из этих максимальных от-
клонений min
z
k
∈Z
k
max
j∈M
i∈N
M
j
− H
j
z
k
, M
i
− K
i
z
k
. Ситуация
z
k
, в которой достигается минимум, является компромиссным реше-
нием игры Γ
k
f
.
Литература
1. Paul R. Milgrom, Robert J. Weber // Econometrica, 1982. Vol. 50,
issue 5. P. 1089–1123.
2. Малафеев О.А. Управляемые конфликтные системы. СПб: Изд-
во СПбГУ, 2000.
3. Малафеев О.А., Грицай К.Н. Оптимальное управление в динами-
ческих играх аукциона // Теория управления и теория обобщен-
ных решений уравнений Гамильтона–Якоби: Тез. докл. Между-
нар. семинара, посв. 60-летию акад. А.И. Субботина / Под ред.
В.С. Пацко. Екатеринбург: Изд-во Урал. ун-та, 2005. С. 101–102.
4. Петросян Л.А., Зенкевич Н.А. Теория игр. М.: Высш. шк., 1998.
304 с.
541
Зенкевич Н.А., Сырова А.К.
Санкт-Петербургский государственный университет
Ценовое поведение дилера на валютном рынке
при условии дифференциации потребителей
Введение. В условиях рыночной экономики актуально исследо-
вание различных рынков, в том числе финансовых. В данной работе
построена и исследована модель ценового поведения дилера на ва-
лютном рынке. Предполагается, что на рынке есть две валюты –
национальная и иностранная, и, что весь валютный рынок – внеш-
ний рынок, разбит на большое число внутренних рынков, в каждом
из которых работает только один дилер. Дилеры могут совершать
операции друг с другом. Считается, что дилер устанавливает курсы
покупки и продажи валюты на своем внутреннем рынке в начале
короткого периода, и эти курсы остаются неизменными на протя-
жении всего этого периода, такой период будем называть торговой
сессией. Примем временную продолжительность торговой сессии за
единицу. Результаты, полученные при сделанных предположениях,
могут быть использованы при моделировании ситуаций, близких к
реальным.
Предположим, что внешний рынок разбит на N внутренних рын-
ков, и потребители равномерно распределены между внутренними
рынками.
1. Рассмотрим сначала случай, когда дилер полностью контро-
лирует свой внутренний рынок, устанавливая курсы покупки и про-
дажи валюты, то есть потребители, совершающие сделки на j -ом
внутреннем рынке, не могут работать с каким-либо другим диле-
ром. Тогда функции спроса и предложения, характеризующие j -й
рынок, выглядят следующим образом:
p
j
(t) = a
j
(t) − cs
a
j
(t),
q
j
(t) = b
j
(t) + cs
b
j
(t),
где s
a
j
(t) – курс покупки валюты на j -ом рынке, s
b
j
(t) – курс продажи
валюты на j -ом рынке, a
j
(t), b
j
(t) – характеристики j -го рынка; с –
параметр, описывающий чувствительность потребителей к измене-
нию цены на рынке.
Сделаем замену переменных:
s
j
(t) = (s
a
j
(t) + s
b
j
(t))/2,
z
j
(t) = (s
a
j
(t) − s
b
j
(t))/2.
542
Обозначим
x
j
(t) – количество иностранной валюты, имеющееся
у дилера в данный момент времени – начальная позиция диле-
ра. Определим размер возможных операций на внешнем рынке как
P
j
(t) − Q
j
(t), где P
j
(t) – размер продаж на внешнем рынке, Q
j
(t) –
размер покупок на внешнем рынке. Хотя дилер может не знать точ-
но, какую цену назначают другие дилеры, однако предполагается,
что он знает средний курс покупки S
a
(t) и средний курс продажи
S
b
(t) на внешнем рынке. Эту информацию он принимает во внима-
ние, когда осуществляет сделку.
Функция дохода дилера будет иметь вид
R
j
(t) = p
j
s
a
j
(t) − q
j
s
b
j
(t) + P
j
(t)S
b
(t) − Q
j
(t)S
a
(t).
Введем новые обозначения: α
j
(t) = a
j
(t) − b
j
(t), β
j
(t) = a
j
(t) + b
j
(t),
δ = 2c. Тогда функцию дохода можно записать в следующем виде:
R
j
(t) = α
j
(t)s
j
(t)+β
j
(t)z
j
(t)−δ[s
2
j
(t)+z
2
j
(t)]+P
j
(t)S
a
(t)−Q
j
(t)S
b
(t).
Дилер стремится максимизировать свой доход к концу определенно-
го периода при условии, что в конце это периода его запас валюты
будет равен нулю: x
j
(t) − p
j
(t) + q
j
(t) − P
j
(t) + Q
j
(t) = x
j
(t + 1) = 0.
Получаем задачу максимизации:
max
s
j
(t),z
j
(t),P
j
(t),Q
j
(t)
R
j
(t)
при условии
x
j
(t) − α
j
(t) + δs
j
(t) − P
j
(t) + Q
j
(t) = 0.
Для решения задачи строим функцию Лагранжа:
L
j
(t) = R
j
(t) + µ
j
(t)[x
j
(t) − α
j
(t) + δs
j
(t) − P
j
(t) + Q
j
(t)].
Решая задачу методом множителей Лагранжа, получаем:
α
j
(t) + 2δs
j
(t) + δµ
j
(t) = 0,
β
j
(t) − 2δz
j
(t) = 0,
µ
j
(t) = S
b
(t) ⇐ P
j
(t) > 0, Q
j
(t) = 0,
µ
j
(t) = S
a
(t) ⇐ P
j
(t) = 0, Q
j
(t) > 0,
S
b
(t) < µ
j
(t) < S
a
(t) ⇐ P
j
(t) = Q
j
(t) = 0.
Из решения следует, что средний курс зависит и от операций на
внешнем рынке, и от начальной позиции, а на полуразность влияют
только характеристики внутреннего рынка:
543
s
j
(t) = s
0
j
(t) − (1/δ)[x
j
(t) − P
j
(t) + Q
j
(t)],
z
j
(t) = β
j
(t)/2δ,
µ
j
(t) = s
0
j
(t) − (2/δ)[x
j
(t) − P
j
(t) + Q
j
(t)],
где s
0
j
(t) = α
j
(t)/δ.
Операции на внешнем рынке зависят от начальной позиции и
внешних курсов следующим образом:
P
j
(t) > 0, Q
j
(t) = 0 ⇐ x
j
(t) > (2/δ)[s
0
j
(t) − S
b
(t)] ≡ x
u
j
(t),
P
j
(t) = 0, Q
j
(t) > 0 ⇐ x
j
(t) < (2/δ)[s
0
j
(t) − S
a
(t)] ≡ x
l
j
(t),
P
j
(t) = Q
j
(t) = 0 ⇐ x
l
j
(t) < x
j
(t) < x
u
j
(t).
С учетом указанных неравенств получаем:
[s
0
j
(t) + S
b
(t)]/2 ≤ s
j
(t) ≤ [s
0
j
(t) + S
a
(t)]/2].
Таким образом, получили интервал, из которого дилер может вы-
брать средний курс в целях максимизации своего дохода.
2. Рассмотрим теперь случай, когда потребители, находящиеся на
рынке, делятся на две группы. С одной стороны, это хорошо инфор-
мированные потребители, которые имеют возможность совершать
сделки на внешнем рынке как только замечают, что на внутреннем
рынке цена менее выгодна. С другой стороны, это потребители, для
которых не представляется возможным совершать сделки на внеш-
нем рынке. В этом случае функции спроса и предложения будут
выглядеть следующим образом:
p
j
(t) = a
j
(t) − cs
a
j
(t) − d[s
a
j
(t) − S
a
(t)],
q
j
(t) = b
j
(t) + cs
b
j
(t) + d[s
b
j
(t) − S
b
(t)],
где d – параметр, показывающий насколько чувствительны потре-
бители к небольшому различию цен.
Введем обозначения: α
j
(t) = a
j
(t) − b
j
(t), β
j
(t) = a
j
(t) + b
j
(t),
δ = 2c, η = 2d, S
j
(t) = (S
a
j
(t) + S
b
j
(t))/2, Z
j
(t) = (S
a
j
(t) − S
b
j
(t))/2.
Тогда функция дохода будет иметь вид:
R
j
(t) = [α
j
(t) + ηS(t)]s
j
(t) + [β
j
(t) + ηZ(t)]z
j
(t)−
−(δ + η)[s
2
j
(t) + z
2
j
(t)] + P
j
(t)[S(t) − Z(t)] − Q
j
(t)[S(t) + Z(t)].
544
Опять ставим задачу максимизации, при условии, что в конце
периода количество валюты у дилера будет равно 0:
max
s
j
(t),z
j
(t),P
j
(t)−Q
j
(t)
R
j
(t),
x
j
(t) − [α
j
(t) − (δ + η)s
j
(t) + ηS(t)] − [P
j
(t) − Q
j
(t)] = 0.
Решая задачу условной оптимизации методом множителей Лагран-
жа, получаем:
s
j
(t) = [α
j
(t) + ηS(t)]/2(δ + η) + (1/2)µ
j
(t),
z
j
(t) = [β
j
(t) + ηZ(t)]/2(δ + η),
µ
j
(t) = S
b
(t) ⇐ P
j
(t) > 0,
µ
j
(t) = S
a
(t) ⇐ Q
j
(t) > 0,
S
b
(t) < µ
j
(t) < S
a
(t) ⇐ P
j
(t) = Q
j
(t) = 0.
Если P
j
(t) = Q
j
(t) = 0, то средний курс выражается из гранич-
ного условия
s
j
(t) = [α
j
(t) + ηS(t)x
j
(t)]/(δ + η).
Выражения для курсов на внутреннем рынке показывают их за-
висимость от курсов на внешнем рынке. Следует обратить внимание,
что полуразность курсов зависит теперь не только от характеристик
конкретного внутреннего рынка, но и от курсов на внешнем рынке.
Литература
1. Suvanto A. Foreign exchange dealing // The Research Institute of the
Finnish Economy. 1993.
2. Salo S., Suvanto A. Consistency of Cross Exchange Rates Across
Market Makers // Helsinki School of Economics Working Papers F-
306. 1993.
3. Hagerty K. Equilibrium Bid-Ask Spreads in Markets with Multiple
Assets // Review of Economic Studies 58. 1991. P. 237–257.
545
Зятчин А.В.
Санкт-Петербургский государственный университет
Народная теорема в одной стохастической игре
Рекомендовано к публикации доцентом Зенкевичем Н.А.
1. Постановка задачи. Рассмотрим статическую игру в нор-
мальной форме G(x) = (N, {q
i
}
i∈N
, {Π
i
(·)}
i∈N
), где x – некий пара-
метр, Π
i
(·) = Π
i
(q
1
, . . . , q
n
, x) – непрерывная функция по x. Предпо-
ложим, что в игре G(x) существует ситуация равновесия по Нэшу в
чистых стратегиях q
∗
(x) = (q
∗
1
(x), . . . , q
∗
n
(x)) для каждого значения
x, q
∗
i
(x) – непрерывны по x.
Предположим, что параметр x эволюционирует в соответствии со
стохастическим процессом вида dx = µxdt + σxdz,
x(t
0
) = x
0
, где
µ – параметр, характеризующий средний ожидаемый темп роста, σ
– параметр, характеризующий величину неопределенности.
В [2] решена следующая задача: для любой вероятности мень-
ше единицы определить начальное состояние x
0
, где dx = µxdt +
σxdz,
x(t
0
) = x
0
, так, чтобы значения x(t), при t > 0, превосходи-
ли значения заданного параметра A с заданной вероятностью. Для
вероятности 0,95 было определено минимальное из таких значений,
x
min
0
:
x
min
0
= Ae
2σ2
2µ−σ2
,
при 2µ − σ > 0.
Значения x
0
> x
min
0
будем называть допустимыми. Определим
динамическую повторяющуюся стохастическую игру Γ(t, x). Пусть
игра G(x) повторяется в каждый момент времени t. Выигрыш в игре
Γ(t, x) определяется следующим образом:
W
i
(t, x(t), q
i
(x(t))) = max
q
i
∞
t
e
−rt
Π
i
(q(x(t)), x(t))dt,
t ≥ 0.
Обозначим H(t) = {q
1
(τ ), . . . , q
n
(τ )}, τ ∈ [0, t], историю процесса.
Будем предполагать, что игроки обладают полной информацией об
игре. Необходимо построить абсолютное равновесие в игре Γ(t, x(t)).
546
2. Народная теорема. Пусть существует такая ситуация
q(x(t)) = (q
1
(x(τ )), . . . , q
n
(x(τ ))), τ ∈ [0, t], при которой в каждой
игре G(x) Π
i
(q(x(t))) > Π
i
(q
∗
(x(t))). Введем обозначение соответ-
ствующей истории: H(t) = {q
1
(t), . . . , q
n
(t)}. Построим функцию
q
∗
(H(t), x(t)) =
q(x(t)),
H(t) = H(t),
q
∗
(x(t)),
H(t) = H(t),
которую будем называть стратегией наказания.
Теорема. Пусть для некоторой вероятности p > 0 существует
допустимое начальное значение x
0
и параметр δ
∗
> 0 такие, что
Π
i
(q(x(t)), x(t)) − Π
i
(q
∗
(x(t)), x(t)) > δ
∗
, dx = µxdt + σxdz. Тогда с
вероятностью p существует такое значение r
∗
> 0, что для всех
0 < r ≤ r
∗
, q
Достарыңызбен бөлісу: |