|
一个职业扑克女牌手在她写的《对赌》一书中,专门写了一节扑克与象棋的本质区别,我原文摘录如下。
【扑克与象棋】
在英国广播公司(BBC)的纪录片《人类的攀升》(The Ascent of Man)中,科学家雅各布·布伦诺斯基(Jacob Bronowski)讲述了冯·诺依曼在伦敦乘坐出租车时是如何描述博弈论的。作为一名象棋爱好者,布伦诺斯基请冯·诺依曼阐明概念:“你的意思是,博弈论是类似象棋这种游戏的理论?”
布伦诺斯基转述了冯·诺依曼的回答:“‘不,不是的,’他说,‘象棋不是博弈。象棋是一种定义明确的计算形式。你可能无法算出确切答案,但从理论上来说,一定会有解决的方案,即在任何局势下都存在着一套正确的下法。可是,真正的博弈完全是另一回事。’他又说,‘真实的生活也不是象棋中那样的。真实的生活里面有虚张声势,有欺诈策略,也会去掂量对方将如何看待自己的意图。这就是我的博弈理论’。”
因为上面这段我秒懂,瞬间解释了我好几个旧问题,所以我才把它摘录保存到我的读书txt上。今天恰好看了一个AI的新闻,联想到之前的“扑克与象棋”,那就顺便把这些零散的知识点穿成散文,可以归入我的读书word了。
我找来了这部1973年的纪录片,13集里的最后1集才是上面那个小片段,32分钟开始讲John von Neumann,然后讲到这次回忆中的对话——
问: You mean the theory of games like chess?
答: No, no, Chess isn't a game. Chess is a well-defined form of computation. 你可能结算不出结果,但理论上,there must be a solution, a right procedure, in any position. Now, real games, are not like that at all. Real life consists of bluffing, of little tactics. And that's what games are about.
总结:It seems very strange......Poker and bluffing.

基本上原始内容与女牌手的书中介绍一致。这段话应该说于1944年之前,那年他与摩根斯特恩的《博弈论与经济行为》首次出版。也就是计算机初始诞生的年代,他已经认识到——象棋的本质是什么,是需要无穷算力但理论总有解的定义明确的计算形式;也摸索到了一种更复杂的包含大量不确定性且相互较力或影响的“玩意”,比如德州扑克,比如经济、战争或政治行为。
两者的区别在今天不难理解(但如今已经是21世纪了)——如同玩《英雄联盟》或《王者荣耀》,去除战争迷雾的情况下,就类似象棋,全凭技术。包含战争迷雾后,就类似德州扑克。
对于没有隐藏信息且几乎无关运气的象棋来说,第一次有深刻印象是IBM深蓝终于击败了世界棋王卡斯帕罗夫,那是1997年。当时我才上高一,有一台兼容机,说是为了学习,主要用来玩《三国英杰传》,不关心棋王是人还是machine,但依稀记得报纸说棋王指责IBM工程师作弊。其实,这件事不过是验证了冯·诺依曼在半个世纪前的说法——象棋是一种定义明确的计算形式。你可能无法算出确切答案,但从理论上来说,一定会有解决的方案,即在任何局势下都存在着一套正确的下法。
又过了19年,在2016年谷歌的阿尔法狗碾压李世石,次年碾压柯洁。我觉得彻底验证了两件事:(1)围棋也是一种定义明确的计算形式。你可能无法算出确切答案,但从理论上来说,一定会有解决的方案,即在任何局势下都存在着一套正确的下法。(2)围棋复杂程度比象棋大一些(然并卵,还是被算法和算力解决了)。
那今时今日,又过了几年之后,围棋界有什么新闻呢?(1)作为曾经AI的老师,如今棋手们开始拜师AI,研磨思路。我曾经看过柯洁的直播录像,既诙谐又丧气地吐槽,大意是围棋已经没乐趣了,人类不可能再次战胜AI了。(2)有棋手涉嫌AI作弊,比如中国棋手李轩豪九段击败韩国棋手申真谞九段之后,他国家队队友杨鼎新竟然公开微信质疑李轩豪疑似利用上厕所的机会作弊;比如业余棋赛爆出AI软件作弊;再比如韩国围棋天才少女因为AI作弊被禁赛。
这些新闻至少说明了两件事:一、纯粹围棋技术领域内,AI完全征服了人类。二、以围棋谋生的社会经济领域内,一旦AI被证明是一种至高无上的技术工具,那么人类就会迅速利用这种工具。无论是深夜启迪思路,还是日光下用它作弊。而恰好第二件事可以用来解释或科普什么叫不确定性、战争迷雾以及博弈论。
哦,今天浏览的关于AI的新闻就是“李轩豪被队友杨鼎新爆料疑似作弊”,而且完整版新闻应该是“李轩豪被队友杨鼎新爆料疑似作弊,但结果查无实证,且杨鼎新被禁赛半年。”

【理智与随机】
冯·诺依曼给出的象棋赛道已经被AI完全征服了,那另一条扑克型或者多方决策型赛道呢?冯·诺依曼当初是才开始摸索它,自然也就没有预言它是否也能被算法征服。但毫无疑问,博弈论里最关键的一个概念就是——如何决策、决策、还是他妈的决策!
人生什么最重要?出身?人脉?资本?都不是——最重要的是决策、决策、还是他妈的决策!或者换成运气、运气、还是他妈的运气也可以,但你必须知道决策和运气之间的本质关联。就不细讲了。
说回扑克型赛道,看看去年输入文字可以出图的绘画AI(DALL·E2),再看看如今“忽然爆火”的ChatGPT,两者都是马斯克(以及其他大佬)几年前投资的。这条赛道终于被解决可能也只是时间问题吧——我猜肯定比象棋的每步对应唯一最优解更复杂,也许是将来有一天,AI的掌控力度足够强大之后,它能逼迫(或给出意见让)每个受控的人类按照它的计算中的最优解来行动。怎么理解?就是每个人都成了原本假设公式中的理智人。
通俗本质是,比如原来某些经济学的公式,XX提出,市场推崇甚至奉为圭臬。但我们又都知道,世界上最不靠谱的两种人,一是统计学家,二是经济学家,后者更甚。这种反差还体现在我们往往觉得这些经济学公式在宏观是灵验的,但在微观是扯淡的。所有的这一切,其中一个重要的原因是,XX公式或者博弈论的某个具体场景,它都是有个前置必要假设——假设代入公式或参与博弈的都是理性人,然后给出一个所有理性人集合的解。与此类似的,大多数概率公式也有前置必要假设——假设每次都是“随机发生的”。
而真实世界中,反而绝大多数人在重要行动中都是“非理性人”,而且越关乎自己的身家性命越是非理性的听从自己的本能反应。比如战争中溃败、股灾中踩踏、党争中内耗、竞争中犹豫等等。以及胜势不求稳、顺风不梭哈、逆风却拼命、绝境怂如狗——这些都是大多数人的选择,但都是非理性的。同样在真实世界中,越是重要行动的前奏,越不可能是随机的。这一切也都与物理学说得通,宏观行为用牛顿的公式就可以准确预测,但微观粒子现在只能用“随机”、“概率”、“不可测”、“量子理论”来摸索。
综上,我觉得——将来有一天,AI的掌控力度足够强大之后,它能逼迫(或给出意见让)每个受控的人类按照它的计算中的最优解来行动。怎么理解?就是每个人都成了原本假设公式中的理智人。
比如,当人类在无人驾驶汽车中闭目养神的时候,该人类是乘客,被剥夺了驾驶权,但毫无疑问无论他冲动还是低能,作为这辆受控的无人驾驶汽车,该人类与汽车的整体被视为“理智单位”,在AI算法的调控下,这些无数理智单位的行动虽然复杂,但可以按照最优公式解去计算执行了。
再比如,当人类在争抢医疗资源时,你的AI手表就是你的律师,它会根据你的财产和健康状况替你计算一切,比如就医时间、地点、药品种类等。当然了,越富有的人,他的AI功能更强大、限制更少,甚至他的AI权限就在更高层级——比如你的AI在权限第1层替你排队,他的AI已经在权限第5层联系医生甚至器官捐献者了。
对每一个自然人来说,他们都是互相天然平等的且受法律保护的。对他们的AI来说,这些AI都是天然理智的且受法律约束的。长久适应之后,每一个互相平等的自然人都离不开他的理智AI了。只不过呢,每一个AI芯片中分别刷着不同权限的理智逻辑程序,社会依然要分高低贵贱。至于上升通道嘛,自然人会有脑力输出,视贡献多少而擢升?谁知道呢。
总之,这些设想场景就是我的解释:将来有一天,AI的掌控力度足够强大之后,它能逼迫(或给出意见让)每个受控的人类按照它的计算中的最优解来行动。怎么理解?就是每个人都成了原本假设公式中的理智人。
我不相信AI能解决人类大同或者贫富差距,我只相信AI“能在人类复杂晦涩的法律约束下做到理智分配资源且逐渐替代人类修补法律以维护人类与AI共同的权利。”
此外,我还相信AI可以“有效且理智”的计算火炮口径与火力投射等重要事项,以保障前述所有权利。 |
|