ҚОСЫНДЫСЫ НӨЛ БОЛАТЫН ЕКІ ЖАҚТЫҢ ОЙЫНЫ
Ойын теориясында ерекше дамыған әдістердің бірі қосындысы нөл болатын екі жақтың ойыны, яғни ойыншылардың ұтыстарыныңқосындысы нөлге тең (бір ойыншының ұтысы екінші ойыншының ұтысына тең, әрбір ойыншы өзге ойыншының есебінен ұтады). Бұндай ойындар антогонистік деп аталады. Қосындысы нӛл болатын екі жақтың ойынын қарастырайық.Ойынға қатысушыларды А және В деп белгілейміз. Бұл ойынды төлем матрицасы немесе (mxn) ретті ойын матрицасы түрінде сипаттауға болады. Бұл матрицаның жолдары (A1,A2,…,Am) A ойыншысының таза стратегиясы, ал бағаналары (В1,В2,...,Вn) B ойыншысының таза стратегиясы болып табылады.
Әрбір ойыншыға төлем матрицасының барлық элементтері белгілі деп есептелінеді. Aij элементі ойын қорытындысын анықтайды, дәлірек айтқанда A ойыншының ұтысын, егер A және B ойыншылары сәйкес Ai(i=1,m) және Вj(j=1,n) стратегиясын таңдайтын болса. Ойыншылардың ұтыстарының қосындысы нӛлге тең болатындықтан, B ойыншының төлем матрицасы A ойыншының тӛлем матрицасын (-1)-ге көбейткенге тең. Сондықтан A ойыншының төлем матрицасын зерттеу жеткілікті. Бұл матрицаның оң элементтері A ойыншының ұтысын және B ойыншының ұтылысын, ал теріс элементтері A ойыншының ұтылысын және B ойыншының ұтысын көрсетеді. Екі жақтың біржүрісті ойыны былай жүргізіледі. A ойыншы төлем матрицасының i - жолын таңдайды (Ai таза стратегиясы), ал B ойыншы матрицаның j - бағанын (Bj таза стратегиясы) таңдайды. Таңдалған жол мен бағанның қиылысындағы элементі A ойыншының ұтысын көрсетеді. B ойыншының ұтысы(-aij) -ге тең. Бұл ойында A ойыншысы өз ұтысын максималдайтын жолды таңдайды, ал B ойыншысы өз ұтылысын минималдайтын бағананы таңдайды. Қосындысы нөл болатын екі жақтың ойынының мысалы ретінде шартты әскери «полковник Блотто ойыны» атты ойынды қарастырайық. Екі армия екі халық тұратын пункт үшін соғыс жүргізуде. Полковник Блоттоның армиясы (A ойыннан) төрт жасақтан, ал қарсыластар армиясы (A ойыншы) - үшеуден тұрады. Ойын ережесін келтірейік. Қай жақтың армиясы кез-келген пунктке қарсыласынан артық жасақ жіберсе сол пунктті алады және қарсыласын жойып, пунктті алғаны үшін бір ұпай, қарсыласын жойғаны үшін бір ұпай алады. Егер әр пунктте қарсыластардың күштері тең болса, онда ұпай алмайды. Жалпы ұтыс екі пункттегі ұтыстардың қосындысы бойынша анықталады. Қарсыластар қарсы жақтың әрекетін білмей-ақ, өз күштерін дұрыс таратып, максималды ұпай жинау керек. Ойыншылар ең көп ұтысқа ұмтылғандықтан барлық жасақтарын қолданады. Полковник Блоттоның бес стратегиясы бар: (4,0);(0,4);)(3,1);(1,3);(2,2) , ал қарсыласының төрт стратегиясы (3,0);(0,3);(2,1);(1,2) бар. Әрбір стратегиядағы бірінші сан бірінші пунктке жіберілген жасақтар санын, ал екіншісі – екінші пунктке жіберілген жасақтар санын көрсетеді. 1 кестеде төлем матрицасын құрамыз.
1 кесте
В
А
|
0,3
|
3,0
|
2,1
|
1,2
|
4,0
|
4
|
0
|
2
|
1
|
0,4
|
0
|
4
|
1
|
2
|
1,3
|
1
|
-1
|
3
|
0
|
3,1
|
-1
|
1
|
0
|
3
|
2,2
|
-2
|
-2
|
2
|
2
|
Төлем матрицасындағы бір элементтің есептелуін көрсетейік, мысалы а51=-2 (A және B ойыншылары A5 және B1 өздерінің таза стратегиясын қолданады). A ойыншысы бірінші пункте (екі) екінші B ойыншысынан (үш) кем жасақ жібереді. Ойын ережесі бойынша A ойыншысы екі жасағынан және бірінші пункттен айрылады және оларға сәйкес 2 және 1 ұпайға ұтылады. A ойыншысы бірінші пунктте - 3 ұпайға ұтылады. Екінші пунктте A ойыншысы екі жасағын жібереді, ал B жібермейді. Сондықтан A бір ұпайға ұтады. Қорытындысында A ойыншысы 2 ұпайға ұтылады, ал B ойыншысы 2 ұпай ұтады. Ойынның шешуі. Ойын теориясының есебі ойынның шешуін табу, яғни әрбір
ойыншы үшін оның оптималды стратегиясы мен ойын бағасын табу. Оптималды стратегия дегеніміз ойын бірнеше рет қайталанғанда қарсыласынан тәуелсіз, берілген ойыншы максималды орташа ұтыспен қамтамасыз ету. Ойынның бағасы дегеніміз ойыншылардың оптималды стратегиясына сәйкес ұтысы (ұтылысы). Стратегияны таңдағанда әртүрлі принциптерге сүйенуге болады. Ойын теориясын өзінен кем көрмесе, онда ойыншылардың тәртібін ең жақсы деп есептеуге болады. Осыған сәйкес ең тамаша стратегия ретінле қарсыласының әректінен тәуелсіз, ең жоғары ұтысты қаматмасыз ететін стратегияны алуға болады. Егер A ойыншы i стратегиясын таңдап алса, онда оның ұтысы min аij →j , мұндағы минимум B ойыншысының барлық стратегиясы бойынша (төлем матрицасының i нөмірлі жолы бойынша). A ойыншысы өзінің әрбір стратегиясы бойынша кепілді ұтыстарды таңдағандықтан, өзінің барлық стратегиясының арасынан өзіне максималды кепілді ұтысты қамтамасыз ететін стратегияны таңдап алады:
V1=max min aij
Жолдардың минимумдарының максималды мәніне сәйкес стратегия максимин стратегиясы деп, ал V1 шамасы – ойынның төменгі бағасы немес максимин деп аталады. B ойыншысы да өзінің барлық стратегиясының ішінен өзіне кепілді минималды ұтысты қамтамасыз ететін стратегияны таңдайды:
V1= min max aij
Бағаналардың максимумдарының мәніне сәйкес минималды стратегия, минимакс стратегиясы деп, ал V2 шамасы – ойынның жоғарғы бағасы немесе минимакс деп аталады. Егер A ойыншысы максимин стратегиясын ұстаса, онда оның ұтысы максимин мәнінен кем болмайды, яғни aij ≥ max min aij. Егер B ойыншысы минимакс стратегиясын ұстаса, онда оның ұтылысы минимакс мәнінен артық болмайды, яғни aij ≥ min max aij. Жалпы жағдайда ойынның тӛменгі және жоғарғы бағасының ара қатынасы теңсіздікпен көрсетіледі:
V1≤ V2 V1= V2
болатын ойындар да кездеседі.A және B ойыншыларының бұл мәндерге сәйкес стратегиясы оптималды деп, ал бұл стратегияға сәйкес төлем матрицасының элементі шешу нүктесі деп аталады. Төлем матрицасының шешуші нүктесіне сәйкес элемент ойын бағасы деп есептеледі. Оны v деп белгілейік. Сонда, егер шешущі нүктесі болатын болса v=v1=v2. Егер V>0 болса, А ойыншысы ұтады. Ал, V=0 болса, онда екі ойыншыға бірдей, тең деп аталады.Мынадай мысал келтірейік. Екі ойыншының әрқайсысында тӛрт стратегиядан бар және бір-бірінің қандай стратегияны қолданылатынын білмейді. Мәліметтер 2 кестеде берілген.
2 кесте
В
А
|
В1
|
В2
|
В3
|
В4
|
Maxij
|
А1
|
6
|
4
|
3
|
4
|
3
|
А2
|
12
|
7
|
10
|
9
|
7
|
А3
|
6
|
6
|
4
|
9
|
4
|
А4
|
12
|
3
|
12
|
7
|
3
|
maxij
|
12
|
7
|
12
|
9
|
7
7
|
Бірінші төлем матрицасының әрбір жолы бойынша минимумдарын (min aij), соңғы бағанаға, ал бағана бойынша максимумдарын (max aij) кестенің соңғы жолына жазамыз. Ары қарай ойынның тӛменгі және жоғарғы бағасы табылып соңғы жол мен соңғы бағананың қиылысқан жеріне жазылады. Берілген мысалда V1=V2=7. Төлем матрицасының шешуші нүктесі бар, ойыншылар үшін оптималды таза стратегиялар А2 және В2 болып табылады. Ойын бағасы V=7. Бұл дегеніміз, егер А ойыншысы өзінің А2 оптималды стратегиясын ұстаса, 7-ден кем ұтпайды, бірақ егер В ойыншысы В2 стратегиясынан ауытқыса онда ол кӛп ұтуы да мүмкін. Осы сияқты В ойыншысы да өзінің оптималды В2 стратегиясын ұстаса, онда 7 артық ұтылмайды, бірақ, егер А, А1, А2, А3 стратегияларының бірін таңдаса, онда ол 7-ден кем ұтылуы мүмкүн.
Шешуші нүктесі бар ойындар таза стратегиямен шешіледі және шешілу процесі күрделі емес. Ал кейбір төлем матрицасында шешуші нүкте біреуден артық болуы да мүмкін. Егер төлем матрицасының шешуші нүктесі болмаса, онда ол аралас стратегиямен шешіледі.
Достарыңызбен бөлісу: |