我们身边的博弈问题

文/严加安

“博弈”一词源于中国古代游戏,如下棋和打牌。我们这里所谓的博弈,是指在遵守一定“游戏规则”的前提下,参与者具有竞争性或对抗性的行为。为了保障各自利益,参与各方需要做一些决策,而这些决策的实际效果依赖于其他各方采取的决策。因此,2005年诺贝尔经济学奖得主奥马把博弈论界定为“交互的决策理论”。寻找对自己最有利的决策,是博弈论的研究对象。

博弈论的诞生
关于博弈问题,《史记》中记载的战国时期“田忌赛马”的故事是众所皆知的。当时齐王与大将田忌赛马,孙膑给田忌出了一个主意:先用下等马与齐王的上等马对决,然后分别用上等马和中等马对决齐王的中等马和下等马。结果是:田忌输了第一场,但赢了后两场。这是一个用博弈思想以弱胜强的典型例子。当然,如果预先规定了双方的马必须分别按上、中、下等级对决,那孙膑的策略就是一种违规的欺骗行为。
博弈论真正成为一个理论要追溯到1928年。当年匈牙利裔美国数学家冯·诺伊曼在德国《数学年刊》上发表论文《社会博弈理论》,奠定了博弈论的数学基础。1944年,冯·诺伊曼与德裔美国经济学家摩根斯特恩合写了一本书《博弈论与经济行为》,创立了博弈论这门现代数学分支。
博弈可分为合作博弈和非合作博弈。所谓合作博弈是指参与者从自己的利益出发与其他参与者谈判,达成协议或形成联盟,其结果对联盟各方都有利;而非合作博弈是指参与者在行动选择时无法达成约束性的协议。
关于非合作博弈,要特别提到一个人,他就是美国电影《美丽心灵》的主人公纳什。他发表的两篇论文给出了所谓的均衡解(称为“纳什均衡”)。这是一个稳定的策略组合,每个参与者如果单独改变策略不会比现在的选择更好,而是可能变坏。因此达到纳什均衡后,参与各方都不会主动改变策略。纳什由于对博弈论的杰出贡献获得了1994年诺贝尔经济学奖。
博弈论的应用非常广泛,在经济学、管理学、社会学等均有应用。诺贝尔经济学奖得主萨缪尔森认为:要想成为现代社会中有文化的人,必须对博弈论有所了解。本文通过我们身边的若干例子,介绍一些博弈论知识。

几个例子看博弈
◆ 第一个例子:从博弈论观点看商业营销。
我们经常看到某些垄断行业为了追求利润而结成联盟,不允许降价促销;但总有一些商家试图把自己的商品卖得更快些,偷偷降价促销。所以,这个联盟是不牢固的,这种现象与博弈论里有名的“囚徒困境”问题类似。
“囚徒困境”是这样表述的:假定有两个小偷被抓住了,如果他们都不坦白也不揭发对方,有可能得到最轻的处罚;如果有一人坦白,另一人不坦白,那么坦白者可以获得较轻的处罚,不坦白者就要加重处罚。在没有事先同谋的情况下,最优策略是二者都坦白并揭发对方。
这就是非合作博弈的“纳什均衡”,它是各自最优策略,但并不是总体最优的。总体最优策略是各自都不坦白也不揭发对方,但这种策略组合是不稳固的,就如同上面所说的“价格联盟”。
◆ 第二个例子:为什么现实中“搭便车”现象不可避免?
这要从博弈论中著名的“智猪博弈”故事说起。该故事有多种版本,其大意是:
在一个猪圈里,有一头大猪和一头小猪。猪圈一端有个踏板,需要多次费力踩踏板,猪圈另一端才会落下一些食物。如果小猪去踩踏板,大猪会在小猪跑到食槽之前就吃完落下的九成食物,小猪只能得到一成食物;如果大猪踩踏板,则小猪能吃到三成落下的食物,大猪吃到七成食物。
假定踩踏板要消耗相当于二成食物转化的体能,两头猪各自会采取什么策略?在这种情况下,对小猪而言,等待大猪去踩踏板是最优策略,这就是所谓的“搭便车”策略。对大猪而言,虽然知道等待是小猪的最优策略,却不得不去踩踏板。这是它的唯一选择,否则它也要和小猪一样挨饿。所以,最终小猪搭了便车,可以不劳而获。
在现实社会生活中也有投机取巧的人,他们从生活经验的积累中学会了“搭便车”策略,因此就会出现能者多劳、强者多尽义务和“鞭打快牛”的现象。从博弈论观点来看,搭便车现象是不可避免的。
◆ 第三个例子:在战场上面临敌机轰炸,是否躲在最好的掩体里最安全?
不一定。因为敌人如果知道你躲在最好的掩体里,他就可以对这一掩体集中轰炸。明智的策略是以某种概率随机选取不同的掩体,让敌人不知道你躲在哪个地方。这就是博弈论里所谓的“概率策略”(或混合策略)。
◆ 第四个例子:如何在一个合作联盟中合理分配各个成员的收益?
这个问题归结为如何计算成员对联盟的贡献大小。美国数学家和经济学家沙普利建立了一个数学模型,可以计算每个成员在合作联盟里的贡献大小,即计算“沙普利值”。沙普利是博弈论专家,2012年获诺贝尔经济学奖。
沙普利值是对边际贡献的加权平均,满足如下几条公理:①若某参与者的所有边际贡献为零,则分配给他的收益也为零;②参与者分配的收益之和等于联盟的总收益;③若两个参与者在联盟中地位相同,则分配给他们的收益也相同;④如果联盟有两个博弈,参与者分别在两个博弈中分配的收益之和等于在合成博弈中的收益。沙普利证明了一个定理:沙普利值是唯一满足上述公理的分配方案。
沙普利值的计算可以应用到如何评估投票规则中的权力分配问题。例如:联合国安理会由5个常任理事国和10个非常任理事国组成,提案仅当全部常任理事国和至少4个非常任理事国赞成时方可通过。在这个规则下,常任理事国有一票否决权。计算沙普利值,每个常任理事国的权力是0.196,每个非常任理事国的权力只有0.002。如果把规则修改为:提案仅当全部常任理事国和至少7个非常任理事国赞成时方可通过,则每个常任理事国的权力降为0.170,每个非常任理事国的权力上升为0.015。

应用博弈须有度
博弈问题在日常生活中经常会遇到。例如,求职者和用人单位之间就有一种博弈。用人单位想通过面试了解求职者的实际能力,求职者则尽量包装自己,同时隐藏自己的弱点。又如,企业逃税现象相当普遍,在税务机关和纳税企业之间存在博弈。博弈论可以帮助税务机关确定对逃税企业的最佳处罚力度和稽查频率。
恰当地从博弈论观点去分析社会和经济学问题应该受到鼓励,但要防止对博弈论肤浅的借用、误用甚至滥用。

(本文作者严加安为中国科学院院士,中国科学院数学与系统科学研究院应用数学研究所研究员、博士生导师)

转载请注明 文章来源:《科学画报》

〖 欲看更精彩文章、图片,请购买科学画报。每月月初出版发行,铜板纸彩色印刷,每本仅售8.00元 〗 

 
《科学画报》2019© 版权所有 沪ICP备05024827号