Wolf: Тоглоомын онолын тухай бага сага зүйлс

Тоглоомын онол нь өнгөрсөн зууны хагаст үүссэн хэрэглээний математикийн том салбар юм.Энэ онолд хэрэглэгддэг стратеги, тэнцвэрт төлөв, хуйвалдаан, хожил хуваах зэрэг ойлголтууд нийгэм болон байгалийн төрөл бүрийн үзэгдэл юмсыг судлаж танин мэдэхэд маш их ач тусаа өгч байна.

Уг онолд "Тоглоом гэдэг нь төрөл бүрийн зөрчил тэмцэлт байдалд байгаа оролцогчдын, тодорхой дүрэмд захирагдсан, зорилго бүхий үйл хөдлөл бөгөөд эцэстээ ямар нэг хожил авдаг, бодит байдлыг хялбарчилсан загвар" гэж авч үздэг байна.
Oролцогчид буюу тоглогчид бие биенээ рационал* буюу гэж үзнэ. Өөрөөр хэлбэл, тоглоомын онолын зарчим нь өрсөлдөгчөө дутуу үнэлэхгүй, түүнийг алдаа гаргана гэж найдах, гэнэдүүлэх болон мартуулах стратеги баримтлахгүйгээр баталгаат хожлын утгыг олох зорилготой.

Nash**-ийн тэнцвэр , Pareto*** -ын үр дүнт байдал.

Хоригдлын дилемма

Цагдаа нар Арзгар ,Сэгсгэр хэмээх хоёр этгээдийг хам хэрэгт сэжиглэн баривчлаад тэдэнд үгсэн хуйвалдах боломж гаргахгүйн тулд тус тусд нь байцааж байна . Хэрвээ нэг нь улайвал шоронд суухгүй боловч нөгөө нь 9 сар сууна. Харин хоёулаа хэргээ хүлээвэл 6, 6 сар, эсрэг тохиолдолд буюу хоёулаа хэргээ хүлээхгүй бол 1 сар мөрдөнд сууцгаана гэж төсөөлье. Хамyyд ямар, ямар стратегийг сонгох вэ?
Хоёр тоглогчийн хожлын матриц

                                                             Сэгсгэр

                                             Улайна              Улайхгүй

                       Улайна         (-6,-6)                       (0, -9)

Арзгар

                    Улайхгүй       (-9,0)                         (-1,-1)

Тоглоомонд оролцогчдын хожлын утгыг стратеги тус бүрд дээрх шиг нарийвчлан харуулсныг хожлын матриц гэнэ.Тоглоомонд оролцогч бүрийн хувьд стратегээ өөрчлөх нь өөрт нь л хохиролтой байгаа тэр төлөвийг Nash-ийн тэнцвэр гэж нэрлэдэг.Өөрөөр хэлбэл тухайн тоглоомонд оролцогчид хоорондоо тохиролцох ямар ч боломжгүй бөгөөд өрсөлдөгчдийнхөө боломжит стратегийг мэдэж байгаа үед байж болох хамгийн баталгаатай хожлын төлөө эрмэлзсэний дүнд уг тоглоомонд үүсэх тэнцвэрт төлөв байдал юм.

Дээрх тоглоомын Nash-ийн тэнцвэр буюу тоглогч бүрийн хувьд оновчтой байх төлөвийг тодорхойлъё.

1) Хоёулаа улайх стратегийн хувьд Сэгсгэр стратегээ өөрчлөөгүй үед Арзгар өөрчлөвөл 6 сар шоронд суух байснаа 9 сар суухаар болж хохироx тул тэр улайх стратегийг сонгоно.Мөн Сэгсгэрийн хувьд стратегиэ өөрчлөх юм бол дээрхтэй адил нөхцөл байдал үүснэ.

Тиймээс энэ нь Nash-ийн тэнцвэрт төлөв.

2) Хоёр тоглогч хэргээ хүлээхгүй байх стратеги сонгох төлөвийн хувьд нэг нь стратегиэ өөрчлөөгүй үед нөгөө нь стртегиэ өөрчлөн хэргээ хүлээхэд хожлын утга буюу хоригдох хугацаа нь -1 ээс 0 болон сайжирч байгаа учир энд Nash-ийн тэнцвэр тогтохгүй . Учир нь энд аль ч тоглогчийн хувьд стратегиэ өөрчлөх сонирхол бий.

3) (-9,0) буюу Арзгар хэргээ хүлээхгүй ба Сэгсгэр хүлээх төлөвийн хувьд Арзгар адилхан хэргээ хүлээснээр -9 биш -1 гэсэн хожил авах боломжтой байгаа учраас тэр энэ төлөвийг сонгохгүй. Иймд энэ төлөв Nash-ийн тэнцвэр биш.

4) (0,-9) төлөвийн хувьд мөн дээрхтэй ижил шалтгаанаар тэнцвэргүй төлөв болж байна. Энэ тоглоомын хувьд нэг л Nash-ийн тэнцвэр байна.

Одоо уг тоглоомын оролцогчид нь хоорондоо тохиролцох боломжтой гэж үзээд Pareto-ийн үр дүнт байдлыг нь олъё.

Хэрвээ тоглоомонд оролцогчид сонгосон төлөв байдлаа өөрчлөхөд ядаж нэг тоглогчийнхоо хожлын утгыг бууруулахад хүрч байвал тэр төлөв байдлыг Pareto үр дүнт байдал гэнэ.Энэ байдал нь тухайн тоглоомонд оролцогчид хоорондоо тохиролцох боломжтой үед бий болно

(-1, -1) төлөв байдлыг авч үзье. Хэрвээ эндээс өөр аль нэг төлөв рүү шилжихэд хүрвэл аль нэг оролцогчийнх нь хожлын утга буурах учраас энэ нь Pareto үр дүнт байдал мөн .

(-6,-6) хувилбарын хувьд бусад аль нэг тєлєв рүү шилжихэд, тухайлбал (-1,-1) рүү шилжвэл хоёр тоглогчийн аль алиных нь хожлын утга өсөж байна. Тиймээс (-6,-6) төлөв нь Pareto байдал биш.

(-9,0), (0,-9) төлөвүүдийн хувьд өөр аль нэг төлөв байдал руу шилжихэд аль нэг тоглогчийнх нь хожлын утга 0-ээс -1 буюу -6 болж буурах учир энэ бол Pareto үр дүнт байдал.

Тайлбар:

*рационал- сэтгэлийн хөдөлгөөн, мэргэ төлөг зэрэгт бус оюун ухаан дээрээ тулгуурлах чанар

**John Forbes Nash Jr (1928 оны 6 сарын 13) – Америкийн математикч, Принцетоны их сургуулийн проффессор.1994 онд эдийн засгийн салбарт Нобелийн шагнал хүртсэн.Nash шизофренээр өвчилж байсан ба 2001 онд Холливүүд түүний амьдралаас сэдэвлэж "A Beautiful Mind" киног бүтээсэн.

***Marcas Vilfredo Federico Damaso Pareto (1848 оны 7 сарын 15) - Италийн эдийн засагч,нийгэм судлаач. Лозаннийн эдийн засгийн сургуулийг үндэслэгчдийн нэг. Тус сургуулийн проффессор.

Ингээд яг одоо Монголд болж буй сонгуулийн үйл явц мөн улс төрийн намууд "Хоригдлын дилемма" -гаар яаж дүрслэгдэх вэ? гэдгийг хийсвэрлэж үзье

Сонгогчид АН, МАХН хэмээх хоёр улс төрийн намуудыг авилгал, албан тушаалын наймаа гх мтэд сэжиглэж байгаа боловч тэдэнд нотлох баримт алга.Өөрөөр хэлбэл тоглоом бол сонгууль, тоглогчид нь АН, МАХН , хожлын утга нь УИХ-ын суудлууд.Tоглогчдын стратеги нь бие, биенийхээ булайг илчлэх юмаа гэж төсөөлцгөөе.

Хоёр тоглогчийн хожлын матриц

                                                                    АН

                                       Илчлэнэ                               Илчлэхгүй

                  Илчлэнэ      (25, 25)                                      (76, 0)

МАХН

                 Илчлэхгүй (0, 76)                                         (38,38)

а) (0,76) болон (76,0) тохиолдлууд хоёр намынхан хэдий тэнэг ч гэсэн өөрсдийг илчилж байхад дуугай сууж байх тэнэгүүд биш тул энэ хувилбарууд ерөөс боломжгүй .

б) (38,38) бие биенээ илчлэхгүй буюу тэдний хувьд хоёуланд нь ашигтай "ЭВ НЭГДЭЛ" .

в) (25,25) бол 2 тоглогчийн хувьд хамгийн ашиггүй муу хувилбар.Хэрэв хоёулаа бие биенийхээ булайг дэлгээд хайр найргүй тэмцэлдэх юм бол.УИХ-д суудлуудаа алдахаас гадна хараахан төлөвшиж , хуч чадлаа авч амжаагүй байгаа улс төрийн гуравдах хүчнийг амьдруулчихна.

Нэгэнт муу муухай юмаар холбогдсон талууд нэг нэгнийхээ өмнө нээнтэгт ордог болон нээнтэг нь тэр хоёрыг бие биедээ дургүй болгох авч яах аргагүй мөнхөд холбодог тул АН, МАХН хоёр б) (38,38) бие биенээ илчлэхгүй буюу тэдний хувьд хоёуланд нь ашигтай "ЭВ НЭГДЭЛ" стратегийг сонгоx бx гэж би таамаглаж байна.Яагаад гэвэл тус тусдаа байцаагдаж байгаа хоригдлууд биш учир үгсэн хуйвалдах боломжтой.Үүнийгээ далдлахын тулд ТВ , хэвлэлээр баахан хоорондоо тэмцэлдсэн жүжиг тавих болов уу.

*Хэрэв "Хоригдлын дилемма" нь тоглогчдын бүрэлдхүүн өөрчлөгдөхгүй хэвээрээ олон дахин давтагдан үргэлжлэх юм бол тоглогч нарт хамтран ажиллах нь ашигтай болдог байна.Жишээн дээрээ буулгавал АН, МАХН нарын дунд сонгууль явагдаад байх юм бол тэр хоёр нам эвтэй найртай хуйвалдаад байнаа гэсэн үг.

1984 онд **Robert Axelrod энэ тоглоомд ялах стратеги зохиох уралдаан зарласан байна.Тэмцээнд оролцогчид өөрсдийнхөө стратегийг компьютерийн программын хэлбэрээр явуулaxaд Anatol Rapoport BASIC хэл дээр бичсэн (еng. tit for tat) программаараа уг уралдаанд түрүүлжээ.Түүний стратегийг Axelrod задлан шинжлээд дөрвөн мөрдлөгийг тодорхойлж.

Үүнд :

Найрсаг бай- Хамтран ажиллахаасаа эхэлж битгий татгалз

Хариутай бай- Хамтарч ажиллахгүй байгаа бол мөн адилхан тэгж хариугий нь барь

Өршөөж бай- Хэрэв эсрэг тоглогч дайсагнасан стратегээ өөрчлөн хамтархаар шийдвэл түүнтэй хамтар.

Бүү атаарх- Эсрэг тоглогчоосоо илүү үр дүнд хүрэх гэж бүү эрмэлз.Жишээлбэл МАХН юмуу АH бие биенээ далан зургаа нойлоор ялах гэж зүтгэсний хэрэггүй байхнээ.

Тайлбар:

* Eng. The iterated prisoner's dilemma

**University of Michigan-ийн улс төр судлалын проффессор

5 comments:

Jess B said...: uneheer oilgomjtoi ih sn tailbarlasan bnaa bayarlalaa; September 7, 2012 at 10:57 PM
Nomio said...: Жищээ нь их таалагдлаа. Баярлалаа :); October 8, 2012 at 2:17 AM
Anonymous said...: Hello. And Bye. Thank you very much.; February 22, 2013 at 8:00 PM
Unknown said...: sonirholtoi bailaa tanii 76 deer awsan jishee 2015 ond batlagdaj bhbshiwdee; November 25, 2015 at 4:52 AM
Unknown said...: bayrlalaa oilgomjtoi sn tailbarlasan bna; April 19, 2020 at 6:16 PM

Friday, June 6, 2008

Тоглоомын онолын тухай бага сага зүйлс

5 comments: