Процессы управления и устойчивость



Pdf көрінісі
бет50/57
Дата27.12.2016
өлшемі30,48 Mb.
#549
1   ...   46   47   48   49   50   51   52   53   ...   57

(H(t), x(t)) – абсолютное равновесие в игре Γ(t

0

, x(t


0

)).


Доказательство. Пусть игрок i отклоняется в любой момент

времени t

1

от принятого соглашения q



i

(x(t)). Рассмотрим потери иг-

рока i при условии, что остальные используют стратегию наказания

t



1

e

−rt



Π

i

(q, x(t))dt −



t

1



e

−rt


Π

i

(q



, x(t))dt =

=



t



1

e

−rt



i

(q, x(t)) − Π



i

(q



, x(t))dt.

По условию теоремы, существует допустимое значение x

0

и параметр



δ

> 0 такие, что Π



i

q(x(t)), x(t))−Π

i

(q



(x(t)), x(t)) > δ

, следователь-



но,

t



1

e

−rt



(v

i

(x(t)) − Π



i

(x(t)))dt >δ



t



1

e

−rt



dt =

δ



re

rt

1



−→

r→0


∞.

Таким образом, при стремлении r → 0 потери игрока неограниченно

возрастают. Это обеспечивает существование равновесия в стратеги-

ях наказания.

3. Пример. Рассмотрим модель симметричной стохастической

дуополии Курно. В ней исследуется поведение двух игроков, страте-

гией которых является объем выпуска продукции в единицу времени

q

i



,

q

j



= Q, рыночная цена единицы продукции определяется как

547


произведение обратной функции спроса D(Q) = a − bQ на функцию

x(t): P (Q, x) = D(Q)x(t), где dx = µxdt + σxdB

t

. Выигрыш игрока i



определяется функционалом

W

i



(t, x(t)) = e

−rt


t

e



−r(τ −t)

q

i



(P (Q, x) − C)dτ ,

где C – удельные затраты игрока i. Уравнение Беллмана имеет вид:

rV − V

t

= max



q

i

{µxV



x

+

1



2

σ

2



x

2

V



xx

+ q


i

(P (Q, x) − C)},

где V

i

(t, x(t)) =



t

e



−r(τ −t)

q

i



(P (Q, x) − C)dτ . Максимизация правой

части позволяет определить стратегии поведения и соответствую-

щий выигрыш в ситуации равновесия по Нэшу :

q



i

=

ax − C



3bx

,

Π



i

=



(ax − C)

2

9bx



.

Проведем теперь максимизацию, предполагая, что игроки дей-

ствуют совместно:

Π = max


q

1

,...,q



n

i

q



i

((a − bQ)x − C) = max

Q

{Q((a − bQ)x − C)} ,



следовательно, соответствующий отраслевой выпуск, стратегия по-

ведения и выигрыш имеют вид:

Q =

a − C


2bx

,

q



i

=

a − C



4bx

,

Π



i

=

(ax − C)



2

8bx


.

Очевидно, что для любого положительного значения состояния сто-

хастического процесса выигрыш в последней ситуации у каждого иг-

рока больше. С другой стороны, такая ситуация не является равно-

весием. Исследуем, выполнены ли условия Народной теоремы. Рас-

смотрим разность

Π

i

− Π



i

=



(ax − C)

2

8bx



(ax − C)


2

9bx


=

(ax − C)


2

72bx


.

Очевидно, что дробь

(ax−C)

2

72bx



> 0 для положительных состояний сто-

хастического процесса. Таким образом, предположим, что

(ax−C)

2

72bx



δ



> 0, где δ

– некий параметр. Имеем



a

2

x



2

− (2aC + 72bδ

)x + C


2

≥ 0.


548

Это позволяет поставить задачу определения допустимого значе-

ния начального состояния стохастического процесса

x >

(2aC + 72δ



b) +


(2aC + 72δ

b)



2

− 4a


2

C

2



2a

2

,



что позволяет построить функцию допустимого начального состоя-

ния относительно параметра δ

: x(δ


)

min



0

. Учитывая ограничения на

существование допустимого начального состояния для бесконечной

игры 2µ−δ > 0, получаем выполнимость условий Народной теоремы

для рассматриваемой игры.

Литература

1. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.:

Высш. шк., Книжный дом "Университет", 1998. 304 с.

2. Зенкевич Н.А., Зятчин А.В. Равновесие по Нэшу в стохастиче-

ской дифференциальной игре в случае полной, неполной и асим-

метричной информации //Устойчивость и процессы управления:

Труды междун. конф., посвященной 75-летию со дня рождения

В.И. Зубова. Россия, СПб, 29 июня – 1 июля 2005 г. / Под ред.

Д.А. Овсянникова, Л.А. Петросяна. – СПб.: СПбГУ, НИИ ВМ и

ПУ, ООО ВВМ, 2005. Т. 1. С. 543–552.

3. Yeng D.W.K., Petrosyan L.A. Cooperative stochastic differential

games // Springer series in operation research and financing

ingenering / Ed. by Mikosch T.V., Resnick S.I., Robinson S.M., 2006.

P. 242.

549


Климова О.Н.

Санкт-Петербургский государственный университет

Выбор оптимального химического состава

свариваемой судостроительной стали

повышенной прочности

Рекомендовано к публикации профессором Ногиным В.Д.

Задача выбора оптимального химического состава свари-

ваемой судостроительной стали повышенной прочности. Рас-

смотрим следующую задачу, имеющую практическую значимость в

области металловедения: из некоторой совокупности наборов хими-

ческих составов для судостроительной стали с пределом текучести

не менее 355 МПа необходимо выбрать такой, которому соответство-

вали бы наилучшая свариваемость и наиболее высокая хладостой-

кость.


Предел текучести представляет собой растягивающее напряже-

ние, при котором деформация материала начинает расти без увели-

чения нагрузки. Следовательно, чем больше значение предела теку-

чести, тем большую нагрузку необходимо приложить к конструкции

для того, чтобы она начала деформироваться. Свариваемость (иначе

отсутствие дефектов в сварном шве) характеризуется несколькими

параметрами. Один из них – коэффициент трещиностойкости, ко-

торый оценивает чувствительность стали к образованию холодных

трещин при сварке в области низких температур. Чем меньше зна-

чение коэффициента трещиностойкости, тем лучше свариваемость.

Если данный коэффициент составляет не более 0,23 %, то сталь с

пределом текучести не менее 355 МПа будет относиться к катего-

рии сталей улучшенной свариваемости. Хладостойкость — способ-

ность материала противостоять разрушению при низких темпера-

турах. Критерием хладостойкости стали является значение работы

удара, полученное во время испытаний на ударный изгиб образцов

при пониженных температурах. Чем больше значение работы удара,

тем большую ударную нагрузку необходимо приложить для разру-

шения материала.

550


Специалисты в области металловедения на практике подобные

задачи решают изучением предыдущего опыта производства этой и

близких по назначению марок стали, а именно, анализом и сопо-

ставлением значений химического состава, технологических режи-

мов производства, параметров структуры, механических свойств и

др. Подобный подход к выбору решения может потребовать много

времени, учитывая, что зачастую оптимальный вариант необходи-

мо выбрать из достаточно большого множества возможных альтер-

натив. В то время как использование методов решения задач мно-

гокритериального выбора с набором информации об относительной

важности критериев значительно облегчает процесс поиска наилуч-

шего решения.

Построение математической модели задачи многокрите-

риального выбора. Множество возможных решений X представ-

лено девятью наборами различных значений определенного хими-

ческого состава. В данной задаче рассмотрены лишь те химиче-

ские элементы, которые оказывают наибольшее влияние на меха-

нические свойства исследуемой стали. В качестве критериев высту-

пают: f

1

– коэффициент трещиностойкости (Pcm , %), f



2

– рабо-


та удара при t = −20

(Дж) и f



3

– предел текучести (МПа). Лицо,

принимающее решение (ЛПР), заинтересовано в максимизации зна-

чений по второму и третьему критерию и в получении минималь-

ного значения по первому критерию. Для того чтобы свести зада-

чу к общему виду, т.е. когда все критерии желательно максимизи-

ровать, значения критерия f

1

будем рассматривать со знаком ми-



нус. Рассмотренные выше критерии образуют векторный критерий

f (X) = (f

1

(X), f


2

(X), f


3

(X)).


Множество возможных векторов Y = f (X), соответствующее

множеству возможных решений X, представлено в таблице 1. В

качестве исходных данных были взяты фактические значения со-

держания химических элементов в промышленных плавках и сред-

ние значения фактических величин механических свойств листово-

го проката, полученного из этих плавок [2, 3]. Лицом, принимаю-

щим решение в данной задаче, выступил ведущий инженер научно-

исследовательского института конструкционных материалов. В ре-

551


зультате консультаций с ЛПР было установлено принятие им аксиом

"разумного" выбора [1].

Таблица 1. Множество возможных векторов исходной задачи

Критерии


Y = f (X)

f

1



f

2

f



3

y

1



-0,228

225


360

y

2



-0,210

224


385

y

3



-0,238

218


400

y

4



-0,247

173


395

y

5



-0,248

209


385

y

6



-0,253

175


425

y

7



-0,256

146


440

y

8



-0,266

166


440

y

9



-0,263

154


445

Выбор оптимального химического состава стали с учетом

набора информации об относительной важности критериев.

Анализируя значения критериев в таблице 1, приходим к выводу,

что максимальным значениям по третьему критерию соответству-

ют минимальные значения по первому и второму, и наоборот. Тогда,

стремясь максимизировать значения по третьему критерию, ЛПР

будет вынуждено идти на уступки по первому и второму критерию,

а чтобы получить максимальные значения по первому и второму

критерию, ЛПР необходимо нести потери по третьему критерию.

Этот факт дает основание разделить три критерия на две группы

A = {f


1

, f


2

} и B = {f

3

} , причем первая группа важнее второй, а вто-



рая группа, в свою очередь, важнее первой. На первом этапе исследо-

вания задачи, используя принцип Парето, из множества возможных

решений X выделим множество парето-оптимальных решений P (X).

Множеству P (X) соответствует множество парето-оптимальных век-

торов P (Y ) = {y

1

, y



2

, y


3

, y


6

, y


7

, y


8

, y


9

}

Далее, ознакомив ЛПР с определением относительной важности



критериев, путем прямого опроса была получена следующая инфор-

мация.


1. Всякий раз, ради увеличения значений по первому и второму

критериям на 0,01 % и 21 Дж соответственно, ЛПР согласно

понести потери в размере 20 МПа по третьему критерию;

552


2. Всякий раз, ради увеличения значения по пределу текучести

на 30 МПа, ЛПР готово пойти на уступки в размере 0,03 % и

30 Дж по первому и второму критерию соответственно.

В терминах теории относительной важности критериев [1] это

означает, что группа критериев A = {f

1

, f



2

} важнее группы кри-

териев B = {f

3

} с двумя наборами положительных параметров



{w

1

, w



2

} = {0, 01; 21}, {w

3

} = {20} соответственно, а группа кри-



териев B = {f

3

} важнее группы критериев A = {f



1

, f


2

} с наборами

положительных параметров {γ

3

} = {30} и {γ



1

, γ


2

} = {0, 03; 30}.

На следующем этапе для проверки непротиворечивости набо-

ра информации, указанного выше типа, воспользуемся критерием

непротиворечивости [1]. Для этого необходимо сравнить величины

w

1



w

3

и



γ

1

γ



3

,

w



2

w

3



и

γ

2



γ

3

. Подставляя вместо параметров соответствующие



значения, получим неравенства

0, 01


20

<

0, 03


30

,

21



20

>

30



30

,

что эквивалентно символьной записи



w

1

w



3

<

γ

1



γ

3

,



w

2

w



3

>

γ



2

γ

3



.

Согласно упомянутому выше критерию непротиворечивости, пред-

ставленный набор взаимно зависимой информации непротиворечив.

Теперь построим новую задачу многокритериального выбора, ис-

пользуя формулы для пересчета значений нового векторного кри-

терия через старые. Множество возможных векторов новой задачи

представлены в таблице 2.

Таблица 2. Множество возможных векторов в новой задаче

многокритериального выбора

Новые критерии

Y

g

1



g

2

g



3

y

1



12565

18270


187,936

y

2



12060

17550


179,454

y

3



12760

18540


190,251

y

4



12425

18000


185,165

y

5



12160

17580


181,315

y

6



12425

17970


185,154

y

7



12560

18180


187,02

553


На последнем этапе найдем множество парето-оптимальных век-

торов в новой задаче многокритериального выбора. Оно состоит все-

го лишь из одного элемента: ˆ

P (Y ) = {y

3

}. Вектору y



3

соответствует

оптимальное сочетание значений предела текучести, свариваемости

и хладостойкости стали, полученное с учетом тех уступок и компен-

саций, на которые готово было пойти ЛПР в ходе принятия решения

в задаче многокритериального выбора.

Таким образом, была решена научно-производственная задача

выбора оптимального химического состава для свариваемой судо-

строительной стали повышенной прочности. При этом выборе было

обеспечено получение сочетания высокой свариваемости и вязкости

стали при одновременном сохранении высоких прочностных свойств.

Выплавка стали в электросталеплавильных печах в промышленных

условиях (в объеме более 100 плавок по 100 тонн каждая) и после-

дующий контроль характеристик, выбранных для оптимизации, под-

твердили правильность принятого решения.

Литература

1. Ногин В.Д. Принятие решений в многокритериальной среде: ко-

личественный подход. М.: Физматлит, 2002. 176 с.

2. Российский Морской Регистр судоходства. Правила классифика-

ции, постройки и оборудования плавучих буровых установок и

морских стационарных платформ. СПб., 2001. 423 с.

3. Морской Регистр судоходства. Правила классификации и по-

стройки морских судов. СПб.: Издательство Морского Регистра

судоходства, 1999. 536 с.

554


Климова О.Н.

Санкт-Петербургский государственный университет

Многокритериальный выбор на основе некоторых

наборов взаимно зависимой информации

об относительной важности критериев

Рекомендовано к публикации профессором Ногиным В.Д.

Постановка задачи многокритериального выбора. В зада-

чах принятия решений чаще всего приходится иметь дело с выбо-

ром решений при наличии нескольких критериев. Особый интерес

представляет случай, когда лицо, принимающее решение (ЛПР), вы-

нуждено идти на взаимные уступки по нескольким критериям, ради

получения прибыли по каждому из них. Одна из таких задач будет

рассмотрена ниже.

Обозначим через X — (произвольное) множество возможных

решений, из которого следует осуществлять выбор. Предпочте-

ния ЛПР выражаются при помощи числовых функций (критери-

ев) f

1

, . . . , f



m

(m ≥ 2), образующих векторный критерий f (x) =

(f

1

(x), . . . , f



m

(x)), и бинарного отношения строгого предпочтения

X

, заданного на X. Запись x



1

X

x



2

для x


1

, x


2

∈ X означает,

что решение x

1

для ЛПР предпочтительнее решения x



2

. Возмож-

ные решения, которые должны быть найдены в результате решения

задачи многокритериального выбора, будем называть выбираемыми

решениями. Они образуют множество выбираемых решений, обозна-

чаемое далее Sel(X).

Наряду с множествами X и Sel(X) будем использовать множе-

ства возможных Y = f (X) ⊂ R

m

и выбираемых Sel(Y ) = f (Sel(X))



векторов.

Ограничим рассмотрение задач многокритериального выбора

только тем классом задач, в которых ЛПР руководствуется «ра-

зумным» выбором. «Разумность» выбора характеризуется опреде-

ленным набором аксиом, требований к отношению предпочтения и

множеству выбираемых векторов [1].

555


На первом этапе решения задачи многокритериального выбора

для сужения области возможных решений применяется принцип Па-

рето, а именно: из множества возможных решений исключаются те

варианты, которые могут быть улучшены, по крайней мере, по од-

ному критерию, при условии, что значения остальных критериев не

ухудшатся. Выделенное таким образом множество Парето P (X) ча-

сто оказывается достаточно широким для того, чтобы сделать окон-

чательный выбор, и поэтому требуется получить дополнительную

информацию от ЛПР для сокращения множества выбираемых ре-

шений.


В данной работе в качестве дополнительной информации, полу-

чаемой от ЛПР, выступает информация об относительной важности

критериев [1]. Эта информация заключается в том, что выделяются

две группы критериев, причем одна из них для ЛПР оказывается

более важной, чем другая. Количественно важность одной группы

критериев по отношению к другой выражается при помощи двух

наборов числовых параметров. Первый набор содержит максималь-

ные величины выигрышей по каждому из критериев более важной

группы, в том случае, если ЛПР сделает уступки (величины уступок

содержит второй набор параметров) по каждому из критериев менее

важной группы.

Пусть дополнительная информация состоит из следующих двух

сообщений: группа критериев A важнее группы критериев B, а груп-

па критериев B, в свою очередь, важнее A. Информация такого рода

является взаимно зависимой [1].

На первый взгляд, указанные выше два сообщения взаимно про-

тиворечивы. Тем не менее, подобные ситуации возникают довольно

часто и при определенных условиях не являются противоречивыми.

Приведем простой пример. Допустим, человек, приобретая билеты в

театр, руководствуется двумя пожеланиями: во-первых, чтобы цена

была относительно невысокая, а во-вторых, чтобы место располага-

лось достаточно близко к сцене. Таким образом, в качестве критери-

ев выступают цена билета и удаленность места относительно сцены.

Говоря, что первый критерий важнее второго, человек исключает из

рассмотрения первые l рядов. Но в то же время, заявляя о важности

556


второго критерия по сравнению с первым, он удаляет из рассмот-

рения последние k рядов. В итоге учет подобного типа информации

приводит к ограничению выбора с l-го по k-й ряд.

Учет взаимно зависимой информации об относительной

важности критериев. В ходе анализа задач с взаимно зависимой

информацией преследовались следующие цели:

1. Получить условия непротиворечивости [1] данной информации,

т.е. найти критерий, который позволял бы проверить, не нарушаются

ли аксиомы «разумного» выбора.

2. Произвести учет набора взаимно зависимой информации; ины-

ми словами, научиться выполнять сужение исходного множества Па-

рето на основе имеющейся дополнительной взаимно зависимой ин-

формации, полученной от ЛПР.

Учет набора информации об относительной важности критери-

ев заключается в построении новой многокритериальной задачи, где

множество решений остается прежним, а новые критерии получают-

ся путем определенного пересчета старых. Множество Парето новой

задачи оказывается уже, чем множество Парето исходной задачи. В

результате происходит сужение области поиска наилучших решений.



Достарыңызбен бөлісу:
1   ...   46   47   48   49   50   51   52   53   ...   57




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет