mixed strategy和behavioral strategy有什么区别?

刚刚开始接触博弈论,看到Imperfect-information extensive-form game中以下图为例对mixed strategy和…
关注者
63
被浏览
23,705
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

recall这块notation太烦人,我随便讲讲,措辞不严谨拒绝捉虫,你们领悟精神就好

========================

换个角度谈谈

先看生成:

mixed strategy是先根据information set选择action/choice,根据这些actions生成一个action plan/list,然后对每个plan赋予一个概率,所有这些概率组成的概率向量就是一个mixed strategy

behavioral strategy是先看每个information set下的action space,每个action space直接生成一个概率向量。这些限制于information set下的混合战略就是behavioral strategy


所以能看出来,behavioral strategy是局部的混合战略,而mixed strategy则是总体的混合战略


于是Kuhn的等价定理其实说的就是在prefect recall下,每个局部最优(选择behavioral strategy

)等价于总体最优(选择mixed strategy)

这是什么?这就是个动态一致的表现


那回忆贝尔曼的原理可知,显然你记忆出问题的时候这两者就不等价了