登陆注册
5275800000023

第23章 警察与小偷博弈:没有纯策略均衡下的混合策略

在我们儿时玩的“剪刀、锤头、布”游戏中,每个小孩选择出剪刀还是布还是锤头应该是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。因为在这种警察与小偷的博弈中,并没有一种纯策略均衡,只有混合策略均衡,而混合策略是参与者在各种备选策略中采取随机方式选取的。

警察抓小偷的故事

在西部片里,我们常能看到这样的故事:

某个村庄只有一名警察,他要负责整个村的治安。小村的两头住着全村最富有的村民A和B, A和B需要保护的财产分别为2万元、1万元。某一天小村来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。

因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在A家看守财产,而小偷也选择了去A家,小偷就会被警察抓住;若小偷去了警察没有看守财产的B家,则小偷偷盗成功。

一种最容易被警察采用而且也更为常见的做法是,警察选择看守富户A家财产,因为A有2万元的财产,而B只有1万元的财产。

这种做法是警察的最好策略吗?答案是否定的,因为我们完全可以通过博弈论的知识,对这种策略加以改进。

实际上,警察的一个最好的策略是抽签决定去A家还是B家。因为A家的财产是B家的2倍,小偷光顾A家的概率自然要高于B家,不妨用两个签代表A家,抽到1号签或2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。

而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,即抽到1号签或2号签去A家,抽到3号签去B家。那么,小偷有2/3的机会去A家,1/3的机会去B家。这些数值可以通过联立方程准确计算出。

此时警察和小偷所采取的便是混合策略。所谓混合策略,是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。最常见的混合策略就是猜硬币游戏。比如足球比赛开场时,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下时朝上的一面是正面还是反面。由于硬币落下是正是反是随机的,概率都是1/2,因此猜硬币游戏的参与者选择正和反的概率都是1/2,这时博弈达到混合策略纳什均衡。

再比如我们儿时玩的“剪、布、锤”游戏,每个小孩来说,自己采取出“剪”、“布”、“锤”的策略应当是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。一旦对方知道你出其中某个策略的可能性增大,你在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。

明显可以看出,这类博弈与我们之前谈到的囚徒困境博弈有一个很大的差别,就是没有纯策略均衡,只有混合策略均衡。所谓纯策略,是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。

当每个博弈参与者都有优势策略时,纯策略均衡是非常合乎逻辑的。你有一个优势策略,你可以采用;假如你有一个劣势策略,你应该避免采用。同样,你的对手也会采取这样的措施。但是通过上面警察抓小偷博弈我们看到,并非所有的博弈都有这样的优势策略,哪怕这个博弈只有两个参与者。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,只有采取混合策略加以均衡。对于任何一方来说,此时不可能有纯策略的占优策略。

这就是纳什于1950年证明了的纳什定理。而零和博弈中没有纯策略纳什均衡点,而有混合策略均衡点,混合策略均衡点下的策略选择是每个参与者的混合策略选择。

谁来打电话

通常情况下,遭遇“警察与小偷”博弈时,双方采取混合策略的目的是为了战胜对方,是一种对立者之间的斗智斗勇。但实际上,你与别人合作的时候,也会发生混合性策略博弈。

如果正在和乙通话,电话断了,而话还没说完。这时每个人都有两个选择,马上打给对方,或等待对方打来。

注意:如果甲打过去,乙就应该等在电话旁,好把自家电话的线路空出来,如果乙也在打给甲,双方只能听到忙音;另一方面,假如甲等待对方打电话,而乙也在等待,他们的聊天就没有机会继续下去了。

一方的最佳策略取决于另一方会采取什么行动。

这里又有两个均衡:一个是你打电话而她等在一边,另一个则是她打电话而你等在一边。

博弈论中有一个结论:纳什均衡点如果有两个或两个以上,则结果难以预料。对于这个出现了两个纳什均衡点的打电话博弈,我们该如何从博弈论中求解呢?

我们可以把所谓“纳什均衡点如果有两个或两个以上,结果就难以预料”,理解为“没有正确(或者固定)答案”。也就是说,我们无法从博弈论中得知到底该怎么做。

事实上,博弈论在这个打电话问题上的解决办法看起来很笨,即用投硬币的方式来决定自己是不是应该给对方打电话。根据前面给出的条件,两人这种随机行动的组合成为第三个均衡:如甲打算给乙打电话,有一半机会可以打通(因为这时乙恰巧在等甲打电话),还有一半机会发现电话占线;假如甲等乙打来电话,那么,同样会有一半机会接到电话,因为乙有一半机会主动给甲打电话。每一个回合双方完全不知道对方将会采取什么行动,他们的做法实际上对彼此都最理想。

由于双方主动拨打电话的可能性均为50%,所以平均来说要尝试两次才能成功接通。当然,这个“笨办法”并不是博弈论的错,而是就策略而言只好如此。

博弈论对这种混合策略的传统解释是,局中人应用一种随机方法来决定所选择的策略。这种解释在理论与实践中均不能令人满意。约翰·查里斯·哈萨尼(John C.Harsanyi)对此提出了更确切的解释方法。

哈萨尼认为,在现实博弈中,每一种博弈的形势都受到一些微小的随机波动因素的影响。在标准的博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一个策略均对应一个随机变量。这些随机变量的具体数值仅为相关局中人所知,这种知识即成为私有信息;而联合分布则是博弈者的共有信息。哈萨尼把这称为“变动收益博弈”。

在变动收益博弈中,各随机变量的数值影响着每一个博弈者的收益。在适当的技术条件下,变动收益博弈所形成的纯策略组合与对应无随机影响的标准博弈的混合策略组合恰好一致。实验证明,当随机变量趋于零时,变动收益博弈的纯策略均衡点转化为对应无随机影响的标准型博弈的混合策略均衡点。

变动收益博弈理论对混合策略均衡点提供了具有说服力的解释:局中人只是表面上以混合策略进行博弈,但实际上仍是在各种略为不同的博弈情形中以纯策略进行博弈。

所以,在生活中遇到这类问题时,我们只能按照惯例或者随机应变。一种解决方案是,原来打电话的一方再次负责打电话,而原来接电话的一方则继续等待电话铃响。这么做有个显而易见的理由:原来打电话的一方知道另一方的电话号码,反过来却未必是这样。另一种可能性是,一方可以免费打电话,而另一方不可以(比如你是在办公室而她用的是住宅电话)。

通常情况下还有另一种解决方案,即由较热切的一方主动再打电话,如一个“煲电话粥”成瘾的家庭主妇对谈话的热情很高,而她的同伴就未必这样,这种情况下通常是她再打过去。再如恋爱中的男女遇到这种情况,通常也是由主动追求者再打电话。

由此看来,基于变动收益博弈理论,在生活中遭遇由谁来打电话这类无法用理性得出最佳策略的问题时,按照惯例或随机应变不失为比较稳妥的选择。

随机策略不是章法胜似章法

天宝十四年底(公元755年),安禄山假托承旨讨杨国忠,起兵十五万造反,派遣叛将令狐潮率重兵包围了雍丘(今河南杞县)。为了保卫雍丘,守将张巡留1000人守城,自己带领1000精兵,打开城门冲出。张巡身先士卒,冲进敌阵猛砍,兵士个个奋勇。叛军做梦也没想到张巡敢冲出城,被杀得措手不及、人仰马翻。

为了尽早攻下雍丘,令狐潮于第二天指挥士兵架起云梯登城作战。张巡率领士兵把用油浸过的草捆点着后抛下城去,登城的叛军被烧得焦头烂额,非死即伤。此后的60多天里,只要一有机会,张巡就突然出兵攻击,打得叛军不知如何应对。

在与叛军作战的过程中,张巡用计夺取了叛军的大量粮食和盐,但粮盐虽足,城中箭矢却已消耗得差不多了。张巡让兵士扎了许多草人,给它们穿上黑衣。当夜月色朦胧,张巡命令兵士用绳子把草人陆陆续续地缒下城去。城外叛军见这么多人缒城而下,纷纷射箭,一时间箭如飞蝗。射了半天,叛军发觉不对劲,因为他们始终没听到一声喊叫声,而且又发现一批刚拉上城去,另一批又坠下来。派人前去探查以后,他们方知所射的都是草人。在叛军大呼上当之时,张巡已收获1万多支箭矢。

为了储备足够的箭矢,第二天深夜,张巡又把外罩黑衣、内穿甲胄的草人从城上放下去。叛军发现,乱射了一阵,发现又是草人。以后每天夜里,张巡都是如此,城外叛军渐渐知道是计,也不再拿箭去射。于是,张巡决定发起总攻。一日,张巡把500名勇士趁夜色缒下城去,勇士们奋勇突进敌营。叛军一点准备也没有,立时大乱。接着,叛军的营房四处起火,混乱中也不知死了多少官军。最后,张巡率军直追杀出10余里,大获全胜。

上面这个故事中,叛军刚开始发现用箭射的都是稻草人时,以后当城墙上缒下东西,仍用箭去射是对的,但后来上当的次数多了,他们就乐观地以为再次缒下来的东西肯定还是稻草人,结果张巡就缒下真人将他们杀得落花流水。故事中张巡采用的这种方法就是警察捉小偷博弈中的随机策略。

民间很早就有“乱拳打死老师傅”的说法,说的是一位学艺归来的拳师,与老婆发生了争执。老婆摩拳擦掌,跃跃欲试。拳师心想:“我学武已成,难道还怕你不成?”没曾想尚未摆好架势,老婆已经张牙舞爪地冲上来,三下五除二,竟将他打得鼻青脸肿,没有还手之力。事后别人问他:“既然学武已成,为何还败在老婆手下?”拳师说:“她不按招式出拳,我怎么招架?”

这就告诉我们,在与对手博弈时,随机策略看似不是章法。但却胜似章法,因为,在博弈中,大家都是理性的人,一方采取某种策略,另一方都会进行理性推测进而作出相应的回应。此时,如果采取随机策略,让他摸不清你的行动规律,便可巧妙战胜对手。

采取随机策略的关键就是要让你的策略具有不可预测性。

《吕氏春秋·淫辞》中记载了这样一个故事:

战国时期,宋康王异常暴虐。凡群臣中有来劝谏的,都被他找理由撤职或者关押起来。臣下也因此对他更加反感,经常非议他。他十分苦恼地对宰相唐鞅说:“我处罚的人已经不少了,为什么他们还是不畏惧我呢?”唐鞅于是献计说:“您所处罚的,都是一些犯了法的人。惩罚他们,没有犯法的好人当然不会害怕。如果您要让您的臣子们害怕,就必须不区分好人坏人,也不管他犯法还是没有犯法,随便抓住就治罪。这样的话,大臣们就知道害怕了。”

唐鞅的建议,虽然缺德,但却不能不说是把握了随机策略的精髓——不可预测性。能够预测的惩罚,大臣总会想方设法地加以规避,而无法预测的惩罚,却是防不胜防的,因而也是更令人心惊胆战的。

要记住,实施不是章法胜似章法的随机策略,诀窍在于不可预测性。

投资中的随机游走

在投资界有这样一个经典的笑话:那些殚精竭虑的投资分析专家们精心挑选出来的投资组合与一群蒙住双眼的猴子在股票报价表上用飞镖胡乱投射所选中的股票在投资收益率上没有质的差别。也就是说,无法通过对历史数据的分析来预测股价未来的走向。这就是著名的“随机游走”(RandomWalk)理论。

随机游走理论是随机策略在投资领域的经典应用。

有一个游戏叫做“一、二、三射击”或称“手指配对”。在这个游戏中,一个参与者选择“奇数”,另外一个参与者则得到“偶数”。数到三的时候,两个参与者必须同时伸出一个或者两个手指。假如手指的总数是偶数,就算“偶数”参与者赢;假如手指的总数是奇数,就算“奇数”参与者赢。

怎样才能保证自己不被对手所赢呢?

有人回答,闭着眼,瞎出。这种方式运用到投资领域就是随机游走。

在随机游走理论中,股价有一个均值P0,未来股价的Pn=Pεn(ε,音念艾普西隆)。εn为随机干扰变量,并且其均值为0。在这种情况下,股价的变化就像一个“醉汉”在路上横行。每一个时刻,他既可能往左走一步,也可能向右走一步。尽管股价这个“醉汉”总围绕着均值上下徘徊,但时间越长,他离均值就可能越远。

从随机游走理论中我们可以得出一个结论:市场是不可预测的。

投资大师彼得·林奇曾说过:“我每次演讲完毕回答现场观众提问的时候,总会有人站起来问我如何看待未来股市行情?没有一个人关心上市公司基本面,例如想知道固特异轮胎公司是不是一家可靠的公司或者它目前的股价水平是否合理,同时倒会有些人想知道牛市行情是否会持续下去,或者熊市是否已经露出狰狞的面目?我总是告诉他们我所知道的有关股市预测的唯一规则就是:每当我得到提升,股市就会下跌。我刚刚说完这句话,就会有其他人站起来问我下一次提升会在什么时候?”

美国有6万名经济学家,他们中很多人被高薪聘请从事预测股票市场走势的专职工作,然而如果他们能够连续两次预测成功的话,他们可能早就成为百万富翁了。

成为百万富翁之后,他们可能辞去工作,到著名度假胜地巴哈马的比密尼岛,一边喝着酒,一边钓着金枪鱼,但实际情况是他们中的大多数还是在为了得到一笔丰厚的薪水而拼命工作,这应该能让我们认识到,这些经济学家预测股票市场变化的准确率是相当糟糕的。

另一个例子同样能说明股票市场的不可预测性。

在1981年7月和1982年11月间,美国发生了一次持续16个月的经济衰退。在这次长达16个月的衰退期间,失业率为14%,通货膨胀率为15%,最低贷款利率是20%。事后,很多人站出来说他们已经提前预测到这一切,但是衰退发生之前却没有一个人向公众说起过经济衰退将会发生。

然而,当80%的投资者都信誓旦旦地说我们即将回到20世纪30年代大萧条时期的时候,股市却突然出现了报复性的大反弹,让那些投资者的信誓旦旦显得荒唐可笑。

由于市场的这种不可预测性,所以,投资者与其去做各种分析,不如采取随机策略。当然,采取随机策略,并不等同于毫无策略地“瞎出”,这里面仍然有很强的策略性。这种策略性的主要体现就是正确地认识市场,在正确认识的基础上去应对它。

对于如何正确认识市场,股神巴菲特有着很独特的见解:

第一,市场总是(或经常是)错的。

第二,市场变化不定,他总会时不时地报出低得离谱的股价或愿意在价格高得荒谬的时候购买同样一只股票。

但你不可能预见到股市价格的未来变化趋势。

第三,市场先生是来侍候你的,不是来指导你的……如果你被他的情绪影响了,那将是灾难性的。

在这种正确理念的指导下,投资者需要做的就是用自己独立的价值标准去应对市场,去评价一只股票到底是便宜了还是贵了。

同类推荐
  • 王阳明:如何找回你强大的内心

    王阳明:如何找回你强大的内心

    王阳明游南镇,一友指岩中花树问曰:“天下无心外之物,如此花树在深山中自开自落,于我心亦何相关?”先生曰:“你未看此花时,此花与汝心同归于寂。你来看此花时,则此花颜色一时明白起来,便知此花不在你的心外。”王阳明认为,世界上的所有问题都可以在自己的心中找到答案,如同他在一诗中所言:“人人自有定盘针,万化根源总在心。却笑从前颠倒见,枝枝叶叶外头寻。”参考这位心学大家的观点,我们就会发现,心其实很强大。只要内心足够坚定,就不会让自己在现实的夹缝中苦苦挣扎。
  • 只有回不去的过往 没有到不了的明天

    只有回不去的过往 没有到不了的明天

    你在人生路上一刻不停地策马向前,任由疲惫和苦难侵蚀你一遍又一遍,你的眼前弥漫着一层层云雾,茫然无措。 你仍然蕴藏着力量,你只是不知如何拥有平衡的生活。歇一歇脚,等待灵魂追赶你的身体,等待风景跟上你的眼睛。请允许作者抬起她的手,尽一份绵薄的力量,拨开你眼前的云雾。从此,你可以带着一双透彻的眼睛,细心探索生命路程上的一切美丽事物,并永葆好奇之心。作者只想介绍给你这样一种生活状态:脚踏实地地追求梦想,畅快淋漓地体验生活,平静安稳地感受幸福。
  • 狼性商鉴:经商必知的游戏规则

    狼性商鉴:经商必知的游戏规则

    本书共分九章,解读狼道与商道,把狼的智慧运用到经商中,帮你提高自身的社会适应能力,培养坚忍不拔的意志,擅长与人沟通交流与合作,在生活和事业上,“如狼似虎”般拼搏,成为商界不可战胜的强者。
  • 思念与惜别(漫漫求知路)

    思念与惜别(漫漫求知路)

    思念是心灵的栖息,是感情的慰藉,是精神的享受,是淡淡忧伤中的喜悦,是温馨中的片刻孤寂。思念是流淌在心灵深处一首无字的歌,隽永,悠长,有人值得你默默地思念,是幸福的;你能让远方的人默默地思念,是欣慰的。思念是孤独中开放的花,带着几分忧伤,几分惆怅,甚至还有几滴晶莹的泪滴……
  • 让学生自信自强的故事(让学生受益一生的故事)

    让学生自信自强的故事(让学生受益一生的故事)

    自信而后可自强:自信可以决定理想人生的目标,人有了自信心就有力量决定自己人生的方向,就能策划自己人生的前途,就能主宰自己的命运,就能做自己的主人。自强而后能自立:为人当自强,所谓“天行健,君子以自强不息”,又说“将相本无种,男儿当自强”。懂得自己奋发图强、努力向上的人,才能自立。“少年强则国强”,故事是青少年喜闻乐见的阅读形式,它轻松、活泼、润心田于无声,比任何理论说教都更容易让人记住。特别是那些经典故事,因为蕴涵着深刻的道理而更加隽永、悠长。
热门推荐
  • 告诉你一个甘地的故事

    告诉你一个甘地的故事

    精选了甘地人生中富有代表性的事件和故事,以点带面,从而折射出他充满传奇的人生经历和各具特点的鲜明个性。通过阅读《告诉你一个甘地的故事》。我们不仅要了解他的生活经历,更要了解他的奋斗历程,以及学习他在面对困难、失败和挫折时所表现出来的杰出品质。
  • 狐仙有点娴

    狐仙有点娴

    “我们灵狐山的狐狸向来不拘小节!”。某狐端坐,一板一眼的直视他。“这位狐友,注意您的言行!”“我们灵狐山的狐狸都喜欢吃肉!”。某狐捂住鼻子,袖手一挥“!!全素???!”。“我们灵狐山的狐狸都怕狼!!”。某狐眼尾一挑,“哦?是吗”。轻松快乐带给大家,这是一篇傲娇狐与大尾巴狼如(相)胶(杀)似(相)漆(爱)的温馨文,双c,作者亲妈。纯属虚构,不喜勿喷。
  • 极致婚恋夫人有点腹黑

    极致婚恋夫人有点腹黑

    前世顾流筝看错了人,错把白莲当做心腹,亲手葬送了权力,爱情,亲情。重生十年前,顾流筝发誓要将失去的东西统统拿回来,得到的加倍珍惜。徒手虐白莲花,斗渣渣……等等!还要抱住前世的金大腿。江璟:“还想离婚?”顾流筝:“谁提离婚谁眼瞎!”本文极致宠文,虐渣中带着温馨,欢迎入坑!
  • 锐读(第5期·悬疑新主张)

    锐读(第5期·悬疑新主张)

    《惊奇档案》专栏编辑,觅骨寻踪,亲历惊奇与惊险,探寻神秘的不可思议,用科学的态度解读怪谈与诡闻。
  • 爆裂骑士

    爆裂骑士

    成为万众敬仰的骑士是无数人的梦想。“相信我,妹妹,世界终将在我脚下!”林恩穿着骚气的骑士盔甲,握着猥琐的大剑,站在山巅眺望远方。“是的,我就是伟大的骑士!”萝莉妹妹:“哥哥,快醒醒吧,又在说梦话了!”这是一个小杂役踏上骑士道路的故事,当然,还得带上他的萝莉妹妹......
  • 每周一张变身卡

    每周一张变身卡

    当灵气复苏之后,觉醒者们如同雨落春笋一般纷纷冒头。世界掀起变革,而在这场变革中,一个觉醒了奇葩异能,每隔一个星期,都会变身成幻想角色的男人,成为了最优(沙)秀(雕)的清流。魔王:“我是万王之王,地狱的掌控者......呔!你这混球居然敢在本王的眼皮子底下偷东西?本王要送你进局子!”剑仙:“人间由我守护,敢伸爪,我便杀你全家!”天使:“正义必胜!”王恺这样说道:“兵器本无正邪,人却有是非善恶;谁说魔王就不能拯救人间?”......这是一个充满正能量,积极向上的故事。
  • 倾世独宠:凰后难求

    倾世独宠:凰后难求

    她扶持他五年,助他除敌,斩奸,终登上皇位!她分娩,刚诞下的婴儿被二妹刀刀凌迟,被所谓的丈夫无情摔死!她心痛欲裂!他亲自动手,更让她含恨而终!天公作美,灵魂不死,再度重生至三妹之身。帝位很好是么?我非闹的你永无安宁之日!和二妹恩爱是么?我非闹你们自相残杀!帝位怎么得来的,我就怎么把你废掉!总之,你说我一句,我十倍相还,你动我一下,百倍相报!只祈求你没来生,否则我必让你生世永无天日!
  • 我认出许多熟悉的脸:闫红读名著

    我认出许多熟悉的脸:闫红读名著

    腾讯大家专栏作者、畅销书作家闫红诚意新作:对经典作品的独特解读,于字缝间发现世事的有趣之处,在阅读中识别自己,也将自己唤醒!
  • 王智保·道路

    王智保·道路

    《王智保·道路》记述了宇航交通工程有限公司董事长兼总经理王智保的生平事迹,内容包括:少年经历、修水库、山林管理员、炊事员兼出纳、苗鸡推销员、生产队长、婚姻和家庭、当民兵连长、成立配货中心、出任交通工程公司经理等。
  • 天末凉风寄残秋

    天末凉风寄残秋

    作为H市的一大学霸,冷一有着自己的性格。脾气不好,爱玩手机,喜欢那些不务正业的东西。她经历的普通姑娘经历过的恋爱,甜蜜苦涩。爱恋和喜欢。只是最后这一生。究竟执手于谁。或许只是一笑回眸,那个温润如玉的人。