博弈视角下的合作行为_博弈论

时间：2012-03-24 作者：秩名

论文导读:：合作是两个或两个以上的主体之间从各自的利益出发而自愿进行的协作性和互利性的关系。合作可以在生产和分配过程中实现收益的创造，对人类的生存和发展起着重要作用。合作行为在自然界和人类社会是广泛存在的，然而合作的成因却并无定论。通过博弈论和间接互惠理论解释了合作的产生和发展模式，并对人类社会高度的合作水平提出了解释。
论文关键词：博弈论，合作，间接互惠

一、合作概述

（一）合作的定义和作用

根据黄少安（2000）的定义，合作是“相对于竞争而言的一种人类基本的经济行为，是两个或两个以上的主体之间从各自的利益出发而自愿进行的协作性和互利性的关系。”一般而言，合作的性质可以总结为以下的四个方面：

1.自发性，各参与主体自发地参与合作，履行合作义务。

2.相关性，各参与主体的收益不仅取决于自己的行为，而且受到其他人的行为的影响。

3.协调性，合作策略的决定和执行需要各方协调完成，而无法由其中的某个参与主体单方面实现。

4.互惠性，合作各方的福利均比不合作的情况下来得高博弈论，即对参与主体而言，合作的结果应是帕累托改进。

合作在人类发展过程中所起的作用无疑是巨大的。具体而言，合作的作用体现在以下两个方面：

1. 合作行为可以在生产过程中实现收益的创造。

斯密把人类社会进步归结为分工和专业化带来的劳动生产力的增进。人类社会最大的优势就是由分工和合作所产生的收益创造机制，从而产生“合作剩余[1]”。

2. 合作行为可以在分配过程中实现效用的提高。

戈森（H.H. Gossen）认为经济交换可以使物品对其消费者的心理效用实现最大化。由于同一物品对不同的人具有不同的效用，因此交换就成为增加物品的心理效用总量的绝佳办法：每个人都可以用对自己效用较小的物品向他人换取对自己效用较大的物品，从而提高自己的效用水平。

（二）自然界和人类社会中的合作现象

自然界中存在大量的合作现象，即没有血缘关系的生物个体相互提供帮助的行为。例如，一只刚刚饱餐一顿的吸血蝙蝠往往会把自己吸食的血液吐出一些来反哺那些濒临饿死的同伴。寄居蟹和海葵的“共生”现象也是合作的典范：寄居蟹依靠海葵保护自己，海葵则可以附在寄居蟹的壳上“搭便车”以解决自身移动困难的问题。自然界中生物之间的合作行为着实令人赞叹不已论文的格式。

然而，正如经济学家恩斯特·费尔所说，“人类社会的合作的机制和水平在动物界是无与匹敌的”。合作不仅是人类的基本存在方式，也是经济发展和社会进步的一个重要条件。很难想象如果没有大规模的合作行为，人类怎能创造出如此丰富的物质和精神财富。在这个社会分工高度专业化的世界中，合作对于我们是如此的重要，以至于如果没有别人的合作，我们将寸步难行。

二、博弈与合作

（一）单次博弈与合作

合作行动能够提高合作整体的福利水平。然而合作同时又表现出一定的利益分配格局，这就形成了合作双方的对抗诱因。在这两种因素的作用之下，许多合作行动都潜在地具有“囚徒困境”博弈的逻辑结构[2]。下面我们通过一个虚拟的例子描述这个情景。

博弈方各有两种选择，合作或是不合作。选择合作的一方必须付出c的成本（为合作所花的时间、精力等），如果双方合作，那么他们每人可以得到b的收益[3]。当然更狡猾的做法是让对方选择合作而自己选择不合作（例如在集体狩猎时出工不出力，却可以分享别人的猎物），这样既可以“搭对方的便车”又避免了自己合作的成本。当然这个时候选择合作的人就成了冤大头了博弈论，因为他付出了成本c，却什么都没有得到。双方不同选择的收益矩阵如表2所示：

表1：一个囚徒困境博弈的收益矩阵

合作

不合作

合作

（b-c,b-c）

（-c,b）

不合作

（b,-c）

（0,0）

对以上的博弈进行分析可以发现，尽管比起双方不合作而言，双方的合作是一种帕累托改进，但博弈中的占优策略是不合作。因此如果每个人都是自私的，那么没有人会在囚徒困境博弈中选择合作。

然而，现实生活中频繁出现的合作行为也让我们产生了一个疑问，为什么人们的行为与经济学的预测大不相同呢？

（二）重复博弈与合作

正如上文所述，在单次囚徒困境博弈中合作行为是不可能产生的[4]，合作产生的关键在于反复的互动。生物个体之所以不惜牺牲自己的利益帮助另一个个体，是因为它们期待日后得到更大的回报。从这个意义上说，合作类似于投资。虽然采取自利的行为可以在短期中获得更高的效用，但从长远来看，如果能实现相互回报，则个体的效用可以得到增加。

同样，人与人之间存在长期的交往，为了取得长期的利益，即使是自私的人也很可能会表现出合作行为。因此重复博弈理论可以解释博弈的产生。

根据重复次数的不同，重复博弈可分为有限次重复博弈和无限次重复博弈。以下分别就这两种情况进行探讨：

1．无限次重复博弈与合作

根据动态博弈中的“逆向归纳法”，有限次重复博弈中唯一的子博弈精炼纳什均衡是双方在每期都背叛[5]。因此在完美信息的情况下，合作行为不可能在有限次重复囚徒困境博弈中出现。

在无限次重复博弈中，情况会有所不同。因为博弈的次数是无限的，因此没有所谓的“最后一期”博弈论，我们也无法通过刚才的“逆向归纳法”找出纳什均衡。这就意味着如果进行重复博弈的局中人不知道什么时候博弈会结束，为了长期的利益最大化，他们就有可能在博弈中采取合作行为。

以上所说的情形可用博弈论中著名的“无名氏定理”加以说明：

无名氏定理（Friedman 1971）：令G为一个n人阶段博弈，G（∞, δ）为以G为阶段博弈的无限次重复博弈，a*是G的一个纳什均衡，e=（e₁,e₂,…,e_n）是a*决定的支付向量，v=（v₁,v₂,…,v_n）是一个任意可行的支付向量，V是可行支付向量集合。那么对于V中任何满足v_i> e_i的支付向量，都存在一个贴现因子δ*<1使得对于所有的δ ≥ δ*，v=（v₁,v₂,…,v_n）是一个子博弈精炼纳什均衡。

简而言之，无名氏定理阐述的是：在无限次重复博弈中，如果参与人有足够的耐心，即贴现因子足够大，那么任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼均衡得到。

无名氏定理表明了在无限次重复博弈中可能出现合作的结果，但这对我们似乎并没有太大帮助，因为它实际上表明了博弈中可能存在无限多种均衡，而合作只是其中的一种而已。瓦辛（Alexander Vasin，1999）表明了，在无限次重复博弈中，可以用一种类似剔除严格劣策略的方法，剔除V中所有非帕累托最优的均衡，而最后剩下来的均衡就是博弈中的合作解。

人的生命是有限的，因此我们似乎并没有太多理由认为人与人间的互动可以通过无限次重复博弈加以刻画。但正如某位心理学家所说的博弈论，“没有人真正相信自己会死”论文的格式。除非是身染重疾。否则人们总是充满信心地认为自己的生命将一直持续下去。由于不知道博弈将会持续多少期，在博弈即将结束的明确征兆出现之前，人们倾向于假设博弈将一直进行下去[6]。在这个意义上，人们之间的互动行为确实可以通过无限次重复博弈来描述。

2．有限次重复博弈与合作

正如上文所说，在完全信息情况下的有限次囚徒困境博弈中，每次都选择“背叛”是每个局中人的最优策略。这一结果不仅与人们的直观感觉不一致，也和以下经济学实验的结果相违背。

1984年，艾克斯罗德组织了一次囚徒困境博弈的“锦标赛”。他邀请了博弈论理论家和其他熟悉囚徒困境博弈的社会学家、行为学家等人，让他们为多人囚徒困境博弈提供策略方案。在预先公布的规则中，每种策略要与它本身、一个随机策略和每个被提交上来的其他策略进行200次囚徒困境博弈。然后根据每个策略在所有博弈中的总分数进行评分。实验结果表明，“善良”（合作且不首先背叛）的策略的得分比其他策略高得多。这个结果也告诉我们，即使在有限次重复博弈中，合作行为也是一种稳定的行为模式。

克瑞普斯等人提出的声誉模型（reputation model）通过将不完全信息引入有限次重复博弈解开了这个悖论。他们证明，局中人对其他局中人支付函数或战略空间的不完全信息对均衡结果有重要影响。在不完全信息的情况下，只要博弈重复的次数足够长，合作行为在有限次博弈中会出现。在艾斯克罗德的锦标赛中，提交参赛程序的人只知道自己的策略，而对其他参赛者采用的策略一无所知，因此合作策略的胜出也在情理之中。正式地，我们有以下定理：

不完全信息声誉模型定理[7]（又称为KMRW定理，Kreps etal,. 1982）：在T阶段重复囚徒博弈中，如果每个参与人都有p>0的概率是非理性的（即只选择一报还一报策略或触发策略），如果T足够大博弈论，那么存在一个T₀ < T，使得下列策略组合构成一个精炼贝叶斯均衡:所有理性参与人在t ≤ T₀阶段选择合作，在t > T₀阶段选择不合作;并且不合作阶段的数量（T - T₀）只与p有关而与T无关。

不完全信息声誉模型定理的直观解释是：尽管每一个参与人在选择合作时存在被其他参与人出卖的风险，即得到一个相对来说最低的现阶段收益，但是如果选择不合作行为，就暴露了自己是非合作类型，如果对方是合作类型，就会失去了获得长期合作受益的可能。如果参与人判断对方是合作类型的概率很大，且博弈重复进行的次数足够多，可能得到的长期合作收益就会超过不合作行为得到的短期收益。因此在博弈开始阶段，即使参与人本质上不是合作类型，他也想去树立一个合作的形象以换取对方的合作。只有在博弈快要结束时，当不合作的短期收益大于将来的合作收益时。参与人才会选择背叛，从而停止合作。

对于人类和一些动物来说，重复博弈对于维持合作存在的作用是毋庸置疑的。但是经济学实验的结果表明，大量的一次性博弈或匿名博弈中的合作现象无法通过期望将来的收益来解释。博伊德和理查德森（Boyd & Richerson，1988）的研究表明：尽管在二人重复博弈中自私者可以作出利他行为（为了利己的利他），但随着人数的增加，意外的或偶然的背叛数量提高，这使得互惠机制很难实施。他们的研究显示，如果群体规模大于10人且没有亲缘关系，仅仅通过互惠机制很难建立合作机制。为了对人类社会中大规模的合作现象进行解释，我们必须在（直接）互惠机制以外寻求答案。

1/2 1 2 下一页尾页

查看相关论文专题：

	加入收藏打印本文
上一篇论文：文学本质多元论_哲学论文
下一篇论文：关于20世纪西方理论知识阅读笔记_美学

社会科学分类

职称论文	政治论文
小学音乐论文	音乐论文
音乐鉴赏论文	美术论文
社会实践论文	军事论文
马克思主义论文	职业生涯规划论文
职业规划论文	人文历史论文
法律论文	文学艺术论文
企业文化论文	旅游论文
体育论文	哲学论文
邓小平理论论文

相关哲学论文

最新哲学论文

读者推荐的哲学论文