Minimax - Nedir, tanımı ve konsepti

İçindekiler:

Minimax - Nedir, tanımı ve konsepti
Minimax - Nedir, tanımı ve konsepti
Anonim

Minimax, oyun teorisinde, beklenen kaybı en aza indirmeyi amaçlayan bir yöntemdir. Bunu yapmak için oyuncu, rakibi tarafından verilen kararın olumsuz olacağını varsayar. Yani en kötü senaryo rakibin hareketinden önce bekleniyor.

Başka bir deyişle, minimax yöntemi, diğer oyuncunun sizin için en kötü senaryoyu seçeceğini varsayarak en iyi kararı nasıl alacağınızdan ibarettir.

Bu yöntemin iki kişilik bir oyunda (iki oyuncu) uygulanabilir olduğunu ve işbirlikçi olmadığını, sıfır toplamlı bir oyunda olduğunu dikkate almalıyız. Bu, bir oyuncunun kazandığının diğeri tarafından kaybedildiği ve bunun tersi anlamına gelir. Sonuç olarak, her etmen, diğerine zarar verse bile, kendi faydasını maksimize etmekle ilgilenecektir.

Bu noktada, oyun teorisinin, maliyetler ve faydalar önceden sabitlenmediğinde, ancak başkalarının kararlarına bağlı olduğunda bireyin durumunu optimize eden seçimi inceleyen bir matematik ve ekonomi dalı olduğunu da unutmamalıyız.

Bir karar ağacında Minimax algoritması

Birkaç düğümlü bir karar ağacında minimax yönteminin nasıl uygulandığını görebiliriz. Oyun en altta başlar ve en üst düzeyde bir sonuçla biter.

Ağacın dibinde ilk hareketi rakip yapar, bu nedenle en kötü sonuç beklenir. Daha sonra, ikinci seviyede, rakibin daha önce vermiş olduğu kararı dikkate alarak karını maksimize etmeye çalışacak olan x oyuncusuna kalmıştır.

Üçüncü seviyede, sıra yine rakipte vb. Aşağıda bir örnek göstereceğiz.

Minimax algoritması örneği

Aşağıdaki karar ağacında, oyunun her anında x oyuncusu tarafından elde edilen sonuçları gösteriyoruz. Tabanda, birinci seviyede, kararı rakip verir. Bu nedenle oyuncunun -10 kaybedebileceği veya 5 kazanabileceği senaryolar verilmiştir.

İkinci seviyede, oyuncu x'e bağlıdır, bu yüzden karını maksimize edecektir. 10 kaybetmek veya 1 kazanmak arasında 1 kazanırsınız. Aynı şekilde, 5 veya 7 kazanmak arasında 7 kazanırsınız.

Ardından, tekrar düşmanın sırası gelir, bu nedenle x oyuncusunun en kötü sonuca sahip olduğu senaryolar, duruma göre -3 ve 4 olarak verilecektir. Son olarak, 3 kaybetmek veya 4 kazanmak arasında, x oyuncusu ikincisine izin verecek kararı verecektir.

Her düğümün değerlerinin bir yardımcı fonksiyona bağlı olacağını hesaba katmalıyız.

Ağacı daha iyi anlamak için, temelde kararın ürünün dağıtımıyla ilgili olduğunu varsayalım. Rakip (düşman) dağıtımı dışarıdan temin edebilir (ağacın sol tarafına bakın). Bu durumda, örneğin, dağıtıcı A ve B arasında seçim yapmalıdır. Böylece birinciyi seçer ve x oyuncusunun 10 kaybetmesine neden olur (B'yi seçerse, oyuncu x 12 kazanır).

Ancak, belki de düşman, motorlu araç kiralayabilmek veya bir kamyon satın alabilmek için malını kendisi dağıtmayı tercih ediyor. Her iki senaryodan da, x oyuncusu için daha az gurur verici olanı seçin, çünkü o 10 değil 5 kazanır.