Minimax - kas tai, apibrėžimas ir sąvoka

Žaidimų teorijoje „minimumx“ yra metodas, kuriuo siekiama sumažinti numatomą nuostolį. Norėdami tai padaryti, žaidėjas daro prielaidą, kad jo oponento sprendimas bus nepalankus. Tai yra, prieš priešininko judėjimą tikimasi blogiausio scenarijaus.

Kitaip tariant, minimumx metodas susideda iš to, kaip priimti geriausią sprendimą, darant prielaidą, kad kitas žaidėjas pasirinks jums blogiausią scenarijų.

Turime atsižvelgti į tai, kad šis metodas yra taikomas dviejų asmenų žaidime (du žaidėjai) ir kad tai nėra kooperatyvinis, o nulinės sumos žaidimas. Tai reiškia, kad tai, ką laimi vienas žaidėjas, praranda kitas ir atvirkščiai. Taigi kiekvienas agentas bus suinteresuotas maksimaliai išnaudoti savo naudingumą, net jei tai kenkia kitam.

Šiuo metu taip pat turime prisiminti, kad žaidimų teorija yra matematikos ir ekonomikos šaka, tirianti pasirinkimą, kuris optimizuoja asmens situaciją, kai išlaidos ir nauda nėra iš anksto nustatyti, bet priklauso nuo kitų sprendimų.

Minimax algoritmas sprendimų medyje

Mes galime pamatyti, kaip minimumx metodas taikomas sprendimų medyje su keliais mazgais. Žaidimas prasideda apačioje ir baigiasi rezultatu aukščiausiu lygiu.

Medžio pagrinde varžovas atlieka pirmąjį ėjimą, todėl tikimasi blogiausio rezultato. Tada antrajame lygyje žaidėjas x stengsis maksimaliai padidinti savo pelną, atsižvelgdamas į priešininko prieš tai priimtą sprendimą.

Trečiame lygyje vėl eilė varžovui ir pan. Žemiau parodysime pavyzdį.

Minimax algoritmo pavyzdys

Šiame sprendimų medyje parodome žaidėjo x gautus rezultatus kiekvienu žaidimo momentu. Bazėje, pirmajame lygyje, oponentas priima sprendimą. Dėl šios priežasties pateikiami scenarijai, kai žaidėjas gali pralaimėti -10 arba laimėti 5.

Antrame lygyje priklauso žaidėjui x, todėl jis maksimaliai padidins savo pelną. Pralaimėję 10 arba laimėję 1 laimėsite 1. Taip pat laimėdami 5 ar 7 laimėsite 7.

Tada vėl ateis varžovo eilė, todėl bus pateikti scenarijai, kuriame žaidime x bus blogiausias rezultatas, priklausomai nuo atvejo, -3 ir 4. Galiausiai, pralaimėjęs 3 ar laimėjęs 4, žaidėjas x priims sprendimą, kuris leis pastarajam.

Turime atsižvelgti į tai, kad kiekvieno mazgo reikšmės priklausys nuo naudingumo funkcijos.

Jei norite geriau suprasti medį, tarkime, kad pagrindas yra sprendimas dėl produkto paskirstymo. Konkurentas (priešininkas) gali perduoti paskirstymą (žr. Kairę medžio pusę). Tokiu atveju jis turi pasirinkti, pavyzdžiui, tarp prekiautojo A ir B. Taigi jis pasirenka pirmąjį, dėl kurio žaidėjas x praranda 10 (Jei pasirinktų B, žaidėjas x laimėtų 12).

Tačiau galbūt priešininkas mieliau pats platina savo prekes, galėdamas samdyti motorines transporto priemones ar įsigyti sunkvežimį. Iš abiejų scenarijų pasirinkite pirmąjį, kuris mažiau glostantis žaidėjui x, nes jis laimi 5, o ne 10.

Populiarios Temos

„S & P500“ techninė analizė: 10 metų „Bullish“ tendencija

Nuo 2009 m. Kovo mėn., Kai JAV vertybinių popierių rinka pasiekė žemę, ji nenustojo kilti. „S & P500“ pakilo be pauzių, nelaukdamas kitų mainų ir nepaisydamas visko, kas įvyko. Po beveik 10 metų trukusios tendencijos investuotojai domisi, ar ji jau per daug nepakilo. Gal šis kopimas yraSkaityti daugiau…

Tai yra verslumo ekosistema Ispanijoje

Verslo ekosistemos regione vertinimas yra sudėtingas klausimas dėl daugybės kintamųjų, į kuriuos reikia atsižvelgti, ir jų nepastovumo. „Bloomberg“ sukūrė „startuolių JAV barometrą“, kuriame jis viename rodyklėje atspindi situaciją ir verslo ekosistemos situacijos raidą. Skaityti daugiau…

Tel Avivas, „Silicio Wadi“ Artimuosiuose Rytuose

Tel Avivo miestas, Izraelio ekonominis centras, turintis 400 000 gyventojų ir 4000 startuolių, tapo Artimųjų Rytų „Silicon Wadi“. Kiekvienas iš keturių darbuotojų tai daro pradedantiesiems ir tai yra trečioji pasaulio šalis, turinti daugiausiai NASDAQ kompanijų. Įsigytų didelių startuolių lopšysSkaityti daugiau…