理论教育 简单了解:博弈论及其应用

简单了解:博弈论及其应用

时间:2023-06-02 理论教育 版权反馈
【摘要】:首先声明,笔者不是博弈论专家,对博弈论的理解很肤浅。下面介绍的博弈论知识是笔者个人的理解,凡涉及与市场经济伦理相关知识的介绍,可能与正统的博弈论理论有所偏离,欢迎方家指教。博弈论可以被定义为对智能的理性决策者之间的冲突与合作的数学模型研究。博弈论对参与的局中人有两个假设,他们是理性的和智能的。因此,动态博弈亦有可能达成合作博弈。

简单了解:博弈论及其应用

首先声明,笔者不是博弈论专家,对博弈论的理解很肤浅。下面介绍的博弈论知识是笔者个人的理解,凡涉及与市场经济伦理相关知识的介绍,可能与正统的博弈论理论有所偏离,欢迎方家指教。

博弈论可以被定义为对智能的理性决策者之间的冲突与合作的数学模型研究。它为分析那些涉及两个或更多参与者且其决策会影响相互间福利水平的情况提供了一般性的数学方法。[40]博弈论内容复杂深奥,在此想用最经典的囚徒困境案例作一个浅显的说明。

囚徒困境是指两个同案犯被逮捕后,不能互相沟通情况,被分别审问。若两人都不揭发对方,由于证据有瑕疵,每个人皆坐牢一年。若一人揭发,一人沉默,则揭发者因立功而即刻可获释,另一沉默者获刑十年。若两人都揭发,则皆被判八年。在此情形下,两人该如何选择。若博弈只有一次,局中人因为互不信任对方,依个人利益最大化原则都选择坦白,此时就达到了所谓的纳什均衡。即在这一策略组合中,所有参与者面临一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的期望支付值会降低。

博弈论对参与的局中人有两个假设,他们是理性的和智能的。如果某一决策者作出的决策与其所追求的目标一致,其即被称为理性的。当然,一般而言,每个局中人的目标都是追求个人利益最大化。如果局中人能知道我们对此博弈所能知道的一切,并能作出我们对此情形所能作出的一切推断,此局中人就是智能的。[41]

博弈分为合作博弈和非合作博弈,区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,即为合作博弈;反之,即为非合作博弈。前文所述的囚徒困境案例,就是一个非合作博弈。但是,若两人在案发前或案发后通过某种途径结成攻守同盟,都不坦白,则会变成合作博弈。(www.daowen.com)

我们知道,人们通常对待与自己将有长期关系的人和以后不再交往的人,其态度是不同的,所以在行为上可能有别。这可以生活中的例子为证,如在火车站、旅游点等处的顾客,多是一次性消费的顾客,此类顾客被商家欺诈的可能性远比多次光顾商家的本地顾客要高。这是因为理性而又智能的行为可能会受到长期关系这一结构的影响,因此,我们要研究重复博弈,局中人在重复博弈中可能更加合作。[42]

仍以囚徒困境为例,若二者的博弈不是一次性的,作为一个理性人会考虑若合作,是不是双方处境都会得到改善。他们或许会在下一次博弈中尝试进行合作,若能被对方响应,二者会使这种合作得以延续,重复博弈可能导致合作博弈。

博弈还可分为静态博弈和动态博弈。所谓静态博弈,是指局中人同时作出决策,或即使作出决策有先后,但对方并不知道。而动态博弈是指双方作出决策有先后,且先作出者的决策可以被后者知道,后者就很有可能作出针锋相对的决策,即若对方是善意的,自己也将作出善意的回应,若对方是恶意的,也将以恶意回之。因此,动态博弈亦有可能达成合作博弈。

博弈还有一种类型,即附加通信的博弈。在很多类似囚徒困境的博弈中,局中人从纳什均衡中得到的期望支付值,相对于其他非均衡结果而言是很低的。局中人希望改造这个博弈,局中人可能力图通过相互通信并协调他们的行动,以期得到更好的结果。[43]但有时,若想达到目的,可能需要一个调解人,即一个能够帮助局中人通信并共享信息的人或机器。调解人可以向局中人推荐策略组合,虽然推荐可能并不具有约束力,但这个借助于调解通信做变换之后的博弈存在一个纳什均衡,其中两个局中人总是计划服从调解人的推荐。[44]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈