Minimax - kas tai, apibrėžimas ir sąvoka

Žaidimų teorijoje „minimumx“ yra metodas, kuriuo siekiama sumažinti numatomą nuostolį. Norėdami tai padaryti, žaidėjas daro prielaidą, kad jo oponento sprendimas bus nepalankus. Tai yra, prieš priešininko judėjimą tikimasi blogiausio scenarijaus.

Kitaip tariant, minimumx metodas susideda iš to, kaip priimti geriausią sprendimą, darant prielaidą, kad kitas žaidėjas pasirinks jums blogiausią scenarijų.

Turime atsižvelgti į tai, kad šis metodas yra taikomas dviejų asmenų žaidime (du žaidėjai) ir kad tai nėra kooperatyvinis, o nulinės sumos žaidimas. Tai reiškia, kad tai, ką laimi vienas žaidėjas, praranda kitas ir atvirkščiai. Taigi kiekvienas agentas bus suinteresuotas maksimaliai išnaudoti savo naudingumą, net jei tai kenkia kitam.

Šiuo metu taip pat turime prisiminti, kad žaidimų teorija yra matematikos ir ekonomikos šaka, tirianti pasirinkimą, kuris optimizuoja asmens situaciją, kai išlaidos ir nauda nėra iš anksto nustatyti, bet priklauso nuo kitų sprendimų.

Minimax algoritmas sprendimų medyje

Mes galime pamatyti, kaip minimumx metodas taikomas sprendimų medyje su keliais mazgais. Žaidimas prasideda apačioje ir baigiasi rezultatu aukščiausiu lygiu.

Medžio pagrinde varžovas atlieka pirmąjį ėjimą, todėl tikimasi blogiausio rezultato. Tada antrajame lygyje žaidėjas x stengsis maksimaliai padidinti savo pelną, atsižvelgdamas į priešininko prieš tai priimtą sprendimą.

Trečiame lygyje vėl eilė varžovui ir pan. Žemiau parodysime pavyzdį.

Minimax algoritmo pavyzdys

Šiame sprendimų medyje parodome žaidėjo x gautus rezultatus kiekvienu žaidimo momentu. Bazėje, pirmajame lygyje, oponentas priima sprendimą. Dėl šios priežasties pateikiami scenarijai, kai žaidėjas gali pralaimėti -10 arba laimėti 5.

Antrame lygyje priklauso žaidėjui x, todėl jis maksimaliai padidins savo pelną. Pralaimėję 10 arba laimėję 1 laimėsite 1. Taip pat laimėdami 5 ar 7 laimėsite 7.

Tada vėl ateis varžovo eilė, todėl bus pateikti scenarijai, kuriame žaidime x bus blogiausias rezultatas, priklausomai nuo atvejo, -3 ir 4. Galiausiai, pralaimėjęs 3 ar laimėjęs 4, žaidėjas x priims sprendimą, kuris leis pastarajam.

Turime atsižvelgti į tai, kad kiekvieno mazgo reikšmės priklausys nuo naudingumo funkcijos.

Jei norite geriau suprasti medį, tarkime, kad pagrindas yra sprendimas dėl produkto paskirstymo. Konkurentas (priešininkas) gali perduoti paskirstymą (žr. Kairę medžio pusę). Tokiu atveju jis turi pasirinkti, pavyzdžiui, tarp prekiautojo A ir B. Taigi jis pasirenka pirmąjį, dėl kurio žaidėjas x praranda 10 (Jei pasirinktų B, žaidėjas x laimėtų 12).

Tačiau galbūt priešininkas mieliau pats platina savo prekes, galėdamas samdyti motorines transporto priemones ar įsigyti sunkvežimį. Iš abiejų scenarijų pasirinkite pirmąjį, kuris mažiau glostantis žaidėjui x, nes jis laimi 5, o ne 10.