因转码可能存在排版等问题,敬请谅解!以下文字仅供您参考:
第十一章 博弈论和策略行为 一、博弈论导论 二、博弈论和寡头垄断 三、阻止进入的策略行为 2021/4/4 1 一、博弈论导论 声明:以下部分内容借鉴了重庆大学蒲勇健教授的资料。
博弈论(game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的 带有方法论性质的学科,它被广泛应用于经济学、人工智能、 生物学、火箭工程技术、军事及政治科学等。
1994年,三位博弈论专家即数学家纳什(Nash,他的故 事被好莱坞拍成电影《美丽心灵》,该影片获得了2002年奥 斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和 泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上 所作出巨大贡献而获得诺贝尔经济学奖。
2021/4/4 2 1996年,两位将博弈论应用于不对称信息下机制设 计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及 2001 年 三 位 经 济 学 家 阿 克 洛 夫 (Akerlof) 、 斯 蒂 格 利 茨 (Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学 所取得的成就而成为这两个年度的诺贝尔经济学奖得主。
2021/4/4 3 瑞典皇家科学院已决定将2012年度瑞典央行纪念诺贝尔奖授 给授予哈佛大学教授埃尔文.罗斯(Alvin E. Roth)及加州大 学罗伊德.沙普利(Lloyd S. Shapley)。
他们得奖的理由是 “以鼓励他们在稳定配置理论及市场设计实践上所作出的贡 献”。
2012年的诺贝尔经济学奖关注了一个经济学的中心问题:如 何尽可能恰当地匹配不同的市场主体。
尽管两位研究者的研 究是各自独立完成的,但沙普利的基础理论与罗斯的经验性 调查一经结合,各类实验和实际设计已经产生出了一个繁荣 的研究领域,改善了许多市场的表现。
2021/4/4 4 2012年诺贝尔经济学奖获奖点评 获奖理论应用性更强 国人民大学经济学院教授郑超 愚表示,对于这两位经济学家的获奖有些意外,但对博弈论 的获奖不意外。
博弈论虽然被划为微观经济学,但对于宏观 经济学的指导意义很大。
郑超愚认为,获奖理论更多的是看 研究问题的方法和思路,打破完美的假设,更加贴近现实, 对于指导实际决策尤为重要。
博弈论正在受到重视 中国人民大学经济学院教授方福 前表示,自上世纪90年代中期以来,诺贝尔奖正倾向于把奖 项颁发给应用性更强的领域。
获奖的这两位学者所研究的领 域是个较为偏的领域,不是主流学科,应该是“机制设计” 方面的研究。
2021/4/4 5 2012年诺贝尔经济学奖获奖点评 国家信息中心预测部世界经济研究室副研究员张茉楠 则表示,从1994年诺贝尔经济学奖授予3位博弈论专家开 始,共有5届的诺贝尔经济学奖与博弈论的研究有关,分 别为:1994年,普林斯顿大学的约翰纳什;
1996年,授予 英国剑桥大学的詹姆斯莫里斯,而今又是博弈论学派的, 说明博弈论很受重视。
2021/4/4 6 1957年的纳什(Nash) 2021/4/4 7 老年纳什 2021/4/4 8 美丽心灵的剧照 2021/4/4 9 收益矩阵 ■ 策略:博弈的参加者所采取的行动方案 ■ 收益:策略实行的结果 2021/4/4 10 举例:囚徒困境 两嫌犯被警方抓住但未获证据。
警方将两人分别置于 两间房间分开审讯,每个嫌犯都被告知: 若一人承认供但另一人未承认,则承认者只需坐5年 牢,未承认者判入狱15年;
若二人都承认则两人各判刑5年;
若两人都不承认,则因未获证据,两人均释放。
本例中,“承认”与“不承认”,是两 策略;
被判坐牢年份的负值,是收益。
2021/4/4 11 说明 很多人——例如纳什——习惯于用代数的方法表示博弈, 也就是用目标函数、约束条件这样的方式演示和推导。
我们还是用比较形象的“收益矩阵”方式表达。
2021/4/4 12 收益矩阵 不承认 甲(嫌疑犯1) 承认 乙(嫌疑犯2) 不承认 承认 0,0 – 5, – 15 – 15, – 5 – 5, – 5 2021/4/4 13 不承认 甲 承认 乙 不承认 承认 0,0 – 5, – 15 – 15, – 5 – 5, – 5 尽管甲不知乙是否承认,但他认为自己选“承认” 最好,因而甲会选择“承认”,乙也同样会选择“承 认”,结果各判5年;
但若两人都不承认,结果是两人 全被释放,但这种结果是不会出现的。
2021/4/4 14 不承认 甲 承认 乙 不承认 承认 0,0 – 5, – 15 – 15, – 5 – 5, – 5 甲或乙可以作出的选择被称为“策略”,如“承 认”或“不承认”都是策略。
一方的各种策略,称 “策略集”。
双方各采用一种策略,搭配起来称“策 略组合”。
甲和乙是参与博弈的人,称为“局中人”。
表中每 一个小方格内的数字被称为局中人的收益(有的翻译为 “支付”),其中左边的数字代表甲的收益,右边的是 乙的收益。
表中的双变量矩阵称为博弈收益矩阵。
2021/4/4 15 另一个说明 局中人的策略,并不总是只有2个,双方的策略也 并非总相同。
比如老板和员工,员工的策略集是(跳槽、留下), 老板的策略集是(升职、加薪、休假)。
再如老师和学生,老师的策略集是(开卷考试、闭 卷考试、多次随堂考试),学生的策略集是(复习、不 复习)。
另举一例:夫妻。
妻子的策略集是(买衣服、逛街、 泡吧),丈夫的策略集是(看球赛、不看球赛)。
2021/4/4 16 从囚徒到竞争企业 企业1 价格不变 涨价 企业2 价格不变 涨价 10, 10 100, – 30 – 20,30 140, 35 2021/4/4 17 企业1 价格不变 涨价