演化方程 - 中企百科sports.zqxb.org

演化方程

更新时间：2022-08-25 15:21

演化方程(evolution equation)是揭示动态对策变化规律的方程。动态对策是与同步对策相对的概念，它意味着局中人按一定顺序相继作出若干步决策。对于动态对策通常考虑两种均衡概念：子对策精练纳什均衡与贝叶斯均衡。

概念

演化方程是揭示动态对策变化规律的方程。即：

这里考虑的是一个动态两人零和对策：

式中Xk={x(k)}，Yk={y(k)}分别表示局中人Ⅰ和局中人Ⅱ在k时刻的策略集，Ak是依赖于策略x(k)和y(k)的局中人Ⅰ的赢得函数，z(k)是状态变量，fk(·)是某个函数，当初态z(0)已知时，局中人Ⅰ在整个对策过程的赢得为

动态对策

动态对策是与同步对策相对的概念，它意味着局中人按一定顺序相继作出若干步决策。动态对策理论通常依赖于以下基本假设：

(1)每个局中人了解每一结局的后果，且确信其对手也了解这一点。

(2)每个局中人能完全记住自己及对手已作出的所有策略选择。

对于动态对策通常考虑两种均衡概念：子对策精练纳什均衡与贝叶斯均衡。

设对一展开型对策的每个决策结点x，指定了概率μ(x)，使得对每个信息集H，有。对于信息集H、在H行动的局中人i及某个混合策略组σ=(σi，σ-i)，若对i的任何其他混合策略i，i在策略组(σi，σ-i)下从H 开始的期望收益不小于在(i，σ-i)下从H开始的期望收益，即：E[ui|H，μ，σi，σ-i]≥E[ui|H，μ，i，σ-i]，则说σ对H是序列合理的。若σ对所有信息集 H是序列合理的，且当Prob(H |σ)>0时，对任何x∈H有：Prob(x|σ)=μ(x)Prob(H|σ)，则称σ为弱完全贝叶斯均衡，简称为WPBE。 WPBE必为纳什均衡，反之则未必。

贝叶斯均衡

贝叶斯均衡是不完全信息博弈(贝叶斯博弈)的均衡概念，静态的不完全信息博弈的均衡被称为贝叶斯纳什均衡，动态的不完全信息博弈的均衡被称为精炼的贝叶斯纳什均衡。解决不完全信息的方法是使用哈萨尼转换。

静态贝叶斯博弈记为G={a1，…，an;θ1， …，θn;p1，…，pn;u1，…，un}。其中ai是第i个博弈方采取的行动(纯策略)，ai∈Ai(θi)，Ai(θi)是第i个博弈方类型依存的行动空间；θi是第i个博弈方的类型，Θi是第i个博弈方的类型空间；pi是第i个博弈方的类型为θi(θi∈Θi)的概率。 ui是第i个博弈方的效用，ui=ui(a1，…，ai，…， an;θ1，…，θi，…，θn)=ui(ai，a-i;θi，θ-i)。其中θ-i=(θ1，…，θi-1，θi+1，…，θn)。

定义一：如果对所有的i，ai*∈Ai(θi)，使得：

则a*=(a1*，…，an*)就称为一个(纯策略)贝叶斯纳什均衡。混合策略的贝叶斯纳什均衡的定义类似。其中pi(θ-i|θi)是第i个博弈方在已知自己的类型为θi时判定其他博弈方类型属于θ-i的概率。

在动态博弈中，记Si(θi)为第i个博弈方类型依存的策略空间，si∈Si(θi)是Si中的一个特定的策略。记a-ih=(a1h，…，ai-1h，ai+1h，…，anh)是在第h个信息集上参与人i观测到其他参与人的行动组合。记p(θ-i|a-i)是第i 个博弈方在观测到a-i后关于θ-i的后验概率。

定义二：精炼贝叶斯均衡是一个策略组合 s*=(s1*，…，sn*)和一个后验概率分布p=(p1， …，pn)，满足：

1.对于所有博弈方i，在每一个信息集h，si*使得：

2.后验概率i(θ-i|a-i)是使用贝叶斯法则，从先验概率pi(θ-i|θi)，观察到的a-i和最优策略s-i得到的(在可能的情况下)。

需要注意的是，精炼的贝叶斯均衡不仅仅是关于策略的均衡，而是关于策略s和对类型的判断(信念)的共同均衡。给定信念p，策略s是最优的;给定均衡策略s，是使用贝叶斯法则从均衡策略和观测到的行动得到的。

贝叶斯博弈

又称“不完全信息博弈”。“完全信息博弈”的对称。至少有一个参与者不知道其他参与者的类型特征、对策和收益的一种博弈类型。不完全信息博弈是以英格兰概率统计学家贝叶斯(Bayes，Thomas，1702—1761)的名字命名的。

1967年前，博弈论对不完全信息博弈是无能为力的。匈牙利经济学家海尔萨尼(Harsanyi，John Charles， 1920—2000)引入了虚拟参与者——“自然”，将不完全信息模型化并进行分析。其工作被称为“海尔萨尼转换”。通过这个转换，海尔萨尼将不完全信息博弈转换为完全但不完美信息博弈。所谓不完美信息博弈，是指“自然”作出了它的选择，但是其他参与者并不知道它的具体选择是什么，仅知道该选择的各种可能的概率分布(先验信念)。在这个基础上，海尔萨尼定义了“贝叶斯-纳什均衡”(或称为“贝叶斯均衡”)。贝叶斯均衡是纳什均衡在不完全信息博弈中的扩展。

子对策精练纳什均衡

设Γ是有N个局中人的展开型对策。Γ的一个子集G称为Γ的一个子对策，若它满足以下两个条件：

(1)G从某个含惟一决策结点的信息集开始，包含这个结点的所有(直接或间接)后继决策结点，且仅含有这样的结点。

(2)G由若干完整的信息集组成，即若G含信息集H中某点x，则必定包含整个H。

子对策自身组成一个对策，因而可对之应用对策论的结论。

给定Γ的子对策G与Γ的纳什均衡σ。若当G单独考虑时，σ对应G中信息集的那些行为构成G的一个纳什均衡，则说σ在子对策G 中导出一个纳什均衡。若σ在Γ的每个子对策中导出一个纳什均衡，则称σ为Γ的子对策精练纳什均衡，简称为SPNE。SPNE必定是纳什均衡，但反之则未必，试看下例。

设Γ是如图1所示的展开型对策。开发商 A的策略集SA={开发，不开发}；B的策略集

SB={(开发，开发)，(开发，不开发)，(不开发，开发)，(不开发，不开发)}，其中(开发，开发)表示策略“当A开发时B开发，当A不开发时B 开发”，其余类推。Γ可表示如下表所示的标准型对策。这个标准型对策有三个纳什均衡：

(开发，(不开发，开发))、(开发，(不开发，不开发))与(不开发，(开发，开发))。对策Γ有三个子对策：Γ本身及分别从结点ⅡC与ⅡG出发的子对策C与G。因在子对策C内不开发是最优的，而在子对策G内开发是最优的，故(开发， (不开发，开发))分别在C与G内考虑时是纳什均衡，从而它是SPNE。但易于验证，P的其他两个纳什均衡都不是SPNE。

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}

{{item.title}}