2016年10月30日下午,西子行为实验论坛在浙江大学紫金港校区东三108举办本论坛的第二次讨论交流会。此次论坛由浙江大学实验社科科学实验室主任、浙江工商大学经济学院许彬教授主讲,主题为“‘敲诈’与‘慷慨’策略在重复囚徒困境中的表现”,浙江大学经济学院陈叶烽副教授主持。来自浙江大学、浙江工业大学、浙江工商大学、浙江财经大学等多所在杭高校20余名不同专业的老师和学生参加了讨论。
许彬教授对今年四月发表在Nature Communications(7,11125,2016)上的论文“Extortion can outperform generosity
in the iterated prisoner's dilemma”进行了详细阐释。
囚徒困境是研究人类合作问题的基本模型,自上个世纪80年代围绕着合作的演化而进行的计算机程序大赛之后,“针锋相对”这一既简单又善良的策略被广泛接受为人类克服囚徒困境的良策。然而,2012年,美国德克萨斯大学William H.Press等人提出,在重复囚徒困境博弈中,存在着叫做“零行列式(Zero-Determinant)”的某些条件合作策略,其实施的结果是可以单方面控制两个博弈者的收益关系。其中存在着敲诈策略,即,理论上可以获得使自我收益总是高于或等于对方收益的某种条件合作策略,同时,也存在着慷慨策略,即,使对方收益总是高于或等于自己的收益的某种条件合作策略。并且,理论上,敲诈策略可以获得的最高得分高于慷慨策略可以获得的最高得分。
2014年,马克斯普朗克进化生物学研究所、哈佛大学进化动力学项目的Christian Hilbe等人首次用实验室实验的方式检验上述理论。但实验表明,当与“真人”对弈时,敲诈策略不一定能对慷慨策略或简单善良的行为形成真正的挑战。尽管使用敲诈策略比对手获得的多,但慷慨策略下人更加合作,而敲诈策略下人更加不合作。这一结果对该理论构成了挑战。
许彬教授与她的共同作者发现,Christian Hilbe团队挑战该理论的实验在其设计方面可能存在两个主要问题,其一是理论给出的策略具有条件概率的形式,因此实验参与者需要有足够的学习时间,而原实验中人与策略互动轮次较短,因此可能导致个体参与者不能熟悉该策略;其二是,原实验中个体参与者与植入在电脑中的程序互动时并不知晓对手为电脑程序,而可能以为其对手为真人,因此可能会引起更多不可控因素影响个体决策。许彬教授与她的共同作者在这两个维度上改进了Christian Hilbe等人的实验设计:在实验轮次这一维度采取60轮和新增的500轮两种,在告知参与者的信息多少的维度上采用不告知和告知对手是计算机程序这两种。因此,实验研究在四种情况下比较敲诈策略和慷慨策略的表现,即长轮次告知参与者对手是电脑程序、长轮次不告知对手是电脑程序、短轮次告知对手是电脑程序以及短轮次不告知对手是电脑程序,每种情况均实施了敲诈策略和慷慨策略,这样总共有8种实验设置。实验发现,在互动时间足够长并且计算机对手的特征被真人被试知道的情况下,敲诈策略取得了比慷慨策略更高的收益,同时两种策略使真人对手达到了相似的合作水平。这一结论支持了原理论的预测,回应了Christian Hilbe团队对于理论的挑战。
许彬教授在其讲座中首先梳理了这一实验的理论背景及该理论在研究人类合作问题中的重要地位,随后介绍了上述实验背景及实验设计及结论。此外,许教授还分享了后续相关实验的发现、论文写作及投稿经验等。在讲座的过程中,报告人与其他参与人就理论本身,实验设计,及后续实验等方面的问题展开了深入的讨论。