博弈论ppt完整版课件.ppt

  1. 1、本文档共211页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
艾克谢罗德竞赛实验 在开始研究合作之前,艾克谢罗设定了2个前提: 每个人都是自私的 没有权威干预个人决策 要研究的问题: 人们为什么要合作? 人什么时候合作,什么时候又是不合作的? 如何使别人与你合作? 实验的方式:组织一场计算机模拟竟赛 参加者都扮演“囚徒困境”中的一个囚徒; 把自己的策略编成计算机程序,进行捉对博弈,在合作与背叛之间作出选择; 以单循环赛的方式玩200次。 艾克谢罗德竞赛实验具体设计 “囚徒困境”博弈 乙 甲 合作 对抗 合作 对抗 2,2 -1,4 4,-1 0,0 结果:取胜策略为——礼尚往来(tit-for-tat) 目的:集高手于一室,相互较量,找出合作的最佳策略。 礼尚往来(tit-for-tat)策略的特征 善良: 是指它第一步总是向对方表示善意。 可激怒:是指对方出现背叛行动时,它能够及时识别并一定要采取背叛的行动来报复,不会让背叛者逍遥法外; 宽容:是指它不会因为别人一次背叛而长时间怀恨在心或者没完没了地报复,而是在对方改过自新、重新回到合作轨道时,能既往不咎地恢复合作; 简单:是指它的逻辑清晰,易于识别,能让对方在最短的时间内识别出来其策略所在; 不嫉妒:是指它不耍小聪明,不占对方便宜,不在任何双边关系中争强好胜。 支付函数 对δ的解释: 贴现率; 博弈继续的概率 二者的结合 一般化:未来收益的重要程度 参与人B 参与人A 合作 不合作 合作 不合作 T,T S,R R,S P,P 满足: R>T>P>S; S+R<T+T “囚徒困境”的一般表示 双方都不合作; 无名氏定理(Folk Theorem) 在无限次重复博弈中,如果参与人对未来足够重视(δ足够大),那么,任何程度的合作都可以通过一个子博弈精炼纳什均衡得到; 这里“合作程度”定义为这个博弈中合作出现的频率; 子博弈是指从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈。 50年代人们就有这样的共识,但无人有发明权。 tit-for-tat 纳什均衡,但不是精炼纳什均衡; T,T S,R R,S P,P 为什么不是一个精炼纳什均衡? 假设A在t=5时没有合作,根据TFT战略,在t=6时,B应该选择惩罚A (不合作)。B会这样吗? 如果B相信A采取的是TFT策略,那么 B如果对A实施惩罚,预期的收入流为: R,S,R,S,R,… 如果B原谅A,预期的收入流为: T,T,T,T,T,… 尽管“tit-for-tat”是成功率最高的战略(Axelrod1984) Grim strategies 如果未来足够重要,精炼纳什均衡: 合作条件: 如果下列条件满足,合作就是均衡的结果: 解释 R-T可以理解为不合作的诱惑; R-P= (R-T)+(T-P); 条件说明: 给定未来的重要程度,不合作的一次性诱惑(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大; 给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大; 合作的剩余(利益) 行为的信息传递 假如欺骗两次才被发现: 含义 欺骗行为越难以被发现,欺骗发生的可能性越大;或者说,合作越困难; 在前面的例子,R=4,T=3,P=0。如果欺骗一次就被发现,只要 合作就会出现; 如果欺骗两次才被发现,只有当δ≥0.5时,合作才可能出现; 惩罚与合作 Abreu(1986):最大合作战略是使用最严厉的可信惩罚; 维护合作并不需要无限期的惩罚,只要惩罚期足够长就可以了; 胡罗卜加大棒;从合作开始,一直合作,直到 如果有任何一方在t期不合作,在t+1期,前期合作者选择“不合作”来实施惩罚,前期合作者选择合作; 如果该合作的没有合作,该惩罚的没有实施惩罚,在t+2期继续按照上述t+1期的战略规定博弈,否则,合作恢复。 对“胡萝卜加大棒”策略的解释 采用这个战略的参与人在对方与自己步调一致时(同时合作或同时不合作),则在下一阶段用合作奖励对方,即给对方一个胡萝卜。 在对方与自己步调不一致时,则在下一阶段用不合作来严厉地惩罚对方,即给对方当头一棒。 这个 战略要求不仅惩罚该合作时不合作的对手,而且惩罚该惩罚时不惩罚的对手,惩罚不惩罚者又是给惩罚者的一根胡萝卜。 假设A首先不合作 t t+1 A R S或P B S R或P 说明在t+1阶

文档评论(0)

191****0059 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5342242001000034
认证主体四川龙斌文化科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MA6ADW1H0N

1亿VIP精品文档

相关文档

相关课程推荐