脱离报应规律——公平游戏理论的现状和课题

川越敏司
经济产业研究所 教职研究员

  根据经济理论的阐述,类似道路、港口以及公园等公共财产,一般人都认为"如果有人提供,则不必自己投资,最好是搭乘他人的便车"。由于"搭便车"问题的存在,所以,这些设施很少通过市场机制由民间提供。但是,当在实验室再现这种情况进行实验时,多数实验结果显示,愿意自发性为公共财产做出贡献的却大有人在。另外,实验中还经常观察到这样一个现象∶在谈判方面(请看下例。由一个游戏者提出一定的游戏规则,其他游戏者决定是否接受该提案),尽管按游戏理论的预测会出现"一人独赢"的情况,可是,人们还是会选择平等分享。在此,可以看出善有善报、恶有恶报的报应规律。另一方面,我们有时会做一些对自己无益却对他人有益的事情。比如,为慈善事业募捐、在不会再次造访的城市的旅馆付小费、明知有生命危险却勇敢地冒险救助他人等等。这些都无法用报应规律进行说明。本文将就最新的公平游戏理论的基本内容作一介绍,同时,探讨一下报应规律问题。

回避不平等以及互惠性

  先看看以下游戏。

游戏1

(1)游戏者1得到1000日元。

(2)游戏者1将决定是自己留下800日元,将余下的200日元给游戏者2呢(提案1)?还是和游戏者2平分这1000日元,即各得500日元(提案2)?

(3)游戏者2将决定是否接受这些提案。如果否决提案,则双方什么都得不到。要是接受,则可以按照提案,两人分了这1000日元。

  按照游戏理论,游戏者1会选择自己能得到最大利益的提案1。游戏者2与其否决提案什么都得不到,将更愿意选择获得200日元的提案。因此,最后双方都会选择提案1,游戏者1和游戏者2将分别获得800日元和200日元,即子博弈完全均衡(注1)。但是,在实验中,多数情况下双方则会选择提案2,而否决提案1。理论上的预测和实验结果为什么会产生如此差异呢?

  有一种解释是:被实验者们具有Fehr and Schmidt (1999)所提出的回避不平等的喜好(inequality aversion)。回避不平等的喜好,即在游戏者之间,除了物质上的利益之外,在和他人相对份额方面还存在相关效用,当自己的物质利益少于他人时会感到羡慕(envy),多于他人时则会感到抱歉(regret)。在此,羡慕比歉意更为重要。假设游戏者们有回避不平等的喜好,当游戏者2的羡慕感强,或者游戏者1的歉意感强时,则可得出与实验结果一致的理论预测,即双方都会选择接受提案2。实际上,除此之外,Fehr and Schmidt (1999)通过回避不平等的喜好对许多实验结果进行了研究,其结果显示,在说明与子博弈完全均衡规则相背离的谈判游戏以及公共财产游戏的实验结果的同时,也能解释与均衡预测一致的市场实验结果。

  请看第2个游戏。

游戏2

(1)为游戏者1提供1000日元。

(2)游戏者1决定是自己留下800日元将余下的200日元给游戏者2(提案1),还是将1000日元全部留给自己,什么都不给游戏者2(提案2)。

(3)游戏者2决定是否接受提案。如果否决提案,则双方什么都得不到。要是接受提案,则双方可以分享这1000日元。

  请注意游戏1的提案1和游戏2的提案1实质上是相同的。不过,在对游戏1和游戏2进行比较的实验中,与游戏2中的提案1相比,游戏1的提案1被否决的概率更高。让我们看看通常的游戏理论的推论吧。提案1被提出后,游戏者2在游戏1和游戏2中,都将面临是选择否决该提案什么都得不到呢、还是选择接受提案获取200日元的问题。在这两个游戏中,否决的比率是不会改变的。这与假定游戏者具有回避不平等的喜好的情况是同样的。因为回避不平等的喜好只注重最后结果的公平性。接受或者否决提案1,在游戏1和游戏2中,游戏者所获得的利益都一样,所以,无法以回避不平等的喜好解释两种实验结果的差异。但是,比如,针对杀人这一结果,也必须根据是故意杀人、还是由于过失或正当防卫所致,来进行裁决。对二者的评价(刑罚)当然会有所不同。我们不应该只看到最后的结果,而必须对导致结果的目的和动机追源溯本,考虑公平性。

  Rabin (1993)的战略互惠(strategic reciprocity)理论是这样解释的。在游戏1中,尽管游戏者1选择提案2,可以平等分配利益,但是,他却选择了对游戏者2不利的提案1。在此,对这种恶意的提案,就用恶意(否决)来对待。另一方面,在游戏2中,尽管游戏者1选择提案2,可以什么都不分给游戏者2,但是,他却分给了游戏者2部分利益。对这种善意,就用善意(接受)来对待。这样一来,如果考虑一下游戏者具有以善还善(正面互惠)、以恶还恶(负面互惠)即所谓Tit For Tat(针锋相对)的喜好,就可以说明两种实验结果的差异了。

  回避不平等的喜好,适合于分析游戏者对分配的绝对公平感给结果以重要影响的情况(分配的公平性)。不过,实际上考虑到没有提出的选项,回避不平等的喜好不适合于分析游戏者的目的(intention)成为问题的情况(互惠的公平性)。互惠公平性的背后所包含的报应规律,是古代汉穆拉比法典以及人类历史上相当古老的准则,和游戏理论的思路也容易协调。

报应规律的说服力

  Fehr and Gachter (2000)实施了以下两个有关公共财产的游戏。

  第一个游戏。首先给每人1000日元,由5个人组成一个小组。然后,由每人决定从得到的1000日元中拿出为小组投资的金额X,并将投资金额归还给实验者。实验者将相当于5人投资总额Y的0.4倍退还给每个人。这样,个人的最终利益为1000-X+0.4Y。在这个游戏中,假定他人的行动不变,那么,自己为小组投资1日元,退回的金额将是0.4日元,即每投资1日元将损失0.6日元。因此,最好还是不为小组投资。但是,他人为小组投资的行为则是应该欢迎的。他人每投资1日元,自己不用花费成本,就可以增加0.4日元的利益。即所谓的"搭便车"问题。这个实验反复进行数次后,将会出现大家都不愿意再为小组投资的倾向。

  第二个游戏。首先按照以上的游戏方式进行游戏。然后,公开每人为小组投资的投资金额表。根据投资金额表,可以向他人征收罚款。不过,向他人征收1日元罚款的成本,将随罚款金额的增加而递增。这种情况下,即便耗费成本向他人征收罚款,自己获得的金额也不会增加,所以,只是白费成本而已。因此,按照均衡理论,大家都不会再向他人征收罚款。因此,最后可以认为这个游戏和前一个游戏是同样的游戏。正如以上所看到的,大家都会认识到最好还是不要为小组投资。但是,在这个实验中,刚开始大家有可能为小组投入很多。因为担心被他人罚款。这样,与经济理论的预测相反,对报复和制裁的担忧,将会产生小组内的合作。在此,或许也可以认为是以善(为小组投资)还善、以恶(搭便车)还恶的报应规律在发挥作用吧。

是否可能脱离报应规律?

  囚犯困境的无限次反复博弈中的大众定理显示(注2),对报复和制裁的担忧是产生合作的有力源泉。假若对方有一次脱离合作关系,以后采取无限制裁行为的战略将有可能维持协调。报应规律采用"如果脱离合作关系,则会受到其他游戏者的制裁。因此,最好还是合作"的逻辑,解释人类的合作行为,这是比较容易理解的。而且,在游戏理论中,也多用这种逻辑进行解释。不过,仔细想想,这个报应规律横行的世界,是一个充满杀机的世界。

  芥川龙之介的《罗生门》中,死者们针对以生前犯了罪为由偷偷贩卖死者们头发的老太婆的犯罪行为,将以同样逻辑夺走老太婆衣服的行为正当化,出现了以报应规律为行为信念的人。每次读到这里,我都会想到,难道我们不得不陷入一旦出现背离合作行为,就要被不断的复仇所统治的世界吗?

  希腊悲剧诗人埃斯库罗斯的作品《奥列斯特》中,奥列斯特为报杀父(阿伽门农)之仇,杀死了自己的母亲(克丽达妮斯特拉)及其情人(亚格斯都)。后来复仇女神伊里逆司不断要求奥列斯特付出血的代价。但是,最后,这种连续不断的仇仇相报通过雅典娜的投票表决而得以终止。可见,约公元前5世纪的作品中,就已经指出了背离报应规律的道路。

  正如穗积陈重在《复仇和法律》中所描写的那样,自古到今,人类社会的法律和规范就以脱离仇仇相报的报应规律为课题。事实上,人类社会正在不断地由私刑向以刑法为基础的法制统治稳步发展。

脱离报应规律——群体选择

  那么,怎样才能脱离报应规律呢?在与上文所述的谈判游戏相似的信誉游戏中,川越(2003)已经实施过有关欧洲犹太人和亚非犹太人之间民族差异的比较研究实验。一般人们都相信,欧洲犹太人的收入和教育水平比较高,是值得信赖的群体。在实验中,被实验者并不是根据对方的被实验者实际上选择了什么样的行为,而是根据对方的被实验者是不是欧洲犹太人而改变行为。

  这样,决定进化生存战略的不是报应规律,而是游戏者属于什么样的群体、这个群体与其他群体相比具有多少优秀成果。这就是群体选择(group selection)理论。Sober and Wilson(1998)指出,根据这一理论,可以解释囚犯困境游戏中出现的合作行为。即使在自己所属群体中遭背叛而倒霉,也与他人合作的行为,将会提高群体的整体适应程度,最后具有充分合作行为的群体将会成为能够进化生存下去的群体,合作行为将发展性地延续下去。

  旧约圣经的《约伯记》通过好人为何得不到好报这一问题,从正面阐述了报应规律和现实生活之间的乖离,不失为杰出作品。信仰神的约伯被卷入撒旦对神的挑战中,从而丧失了财产和家人,自己也患了重病。在此,善(对神的信仰)有善报(神的恩惠)的报应规律并没有起作用。约伯诅咒自己的生日。但是,他并没有改变对神的信仰。这是因为即便没有因报应规律得到善报,但是,与跟随撒旦相比,还是站到神的一边,更能过上好一些的人生。

  在有关公平性的游戏理论方面,今后我们或许有必要以群体选择理论为中心,对能够解释超越报应规律的社会规范和伦理的理论进行探求。

2003年9月30日
脚注
  1. 子博弈完全均衡理论要求游戏者采取合理行动,即在游戏中的任何时候都要使自己的利益得到最大化。在这个游戏中,接受提案的游戏者2,与其否决提案得不到分文,还不如接受提案获得200日元的合算。所以,在子博弈完全均衡中,就会得出像本文一样的结果。
  2. 根据大众定理,在无限次反复博弈中,在双方相互合作的情况下,采用以背叛应对对方单方面背叛的战略,将会取得平衡。根据这一逻辑,在囚犯困境游戏的无限次反复博弈中,也有可能出现相互合作。
参考文献
  1. Fehr and Schmidt (1999): “A Theory of Fairness, Competition and Cooperation,” Quarterly Journal of Economics, 114, 817-868
  2. Fehr, E. and S. Gachter (2000): “Cooperation and Punishment in Public Goods Experiments,” American Economic Review, 90, 980-994
  3. Rabin, M. (1993): “Incorporating Fairness into Game Theory and Economics,” American Economic Review, 83, 1281-1302
  4. Sober, E. and D. S. Wilson (1998): Unto Others The Evolution and Psychology of Unselfish Behavior, Harvard University Press
  5. 埃斯库罗斯《奥列斯特》(《希腊悲剧全集》)(岩波书店)
  6. 芥川龙之介《罗生门》(《罗生门·鼻》所收)(新潮文库)
  7. 川越敏司(2003)∶《为建立实验经济学 社会科学综合化的基础》(《经济研讨会》)(2003年4月刊 26~27)
  8. 穗积陈重(1982)∶《复仇和法律》(岩波文库)
  9. 《约伯记》(《新译圣书》)(日本圣书教会)

2003年9月30日登载