8.
六 让我们回到现实。 演化论,自下而上,是不是说“规划无用”?
但是,达尔文不正是使用一种“鸟瞰式”的视野,发现了“演化论”吗?
但愿你还记得开头,我提到本文最想探讨的焦点问题是: 对未来的计算,我们到底应该算很多步,还是走好当下的那一步? 由此引发的,不仅是对一个人生道理的思考,更是对决策本质的理解。 我曾经写过,厉害的人都是人肉阿尔法狗。 什么叫人肉阿尔法狗?
先看阿尔法狗如何做决策。 阿尔法狗几乎会在每一手棋时,都计算自己的赢棋概率。 即:对它而言,每一个决策点都是独立的,阿尔法狗都会冷静地寻找“当下”的最大获胜概率。 听起来,这不也是人类棋手下棋的方法吗? 有什么不一样呢?
难道人类的职业棋手下棋时,不也是如此吗?计算每一手棋,推算可能的走法之后的变化,比较结果的优劣,然后从中选择最优的一手。
要想理解这一点,我需要在很短的时间里,来说说围棋的“特别之处”。
对比其它棋类,围棋有如下特点: 因为不止于以上数点的原因,所以,人类以前用来对付国际象棋的那一套穷举搜索,难以用来解决复杂的围棋,因为搜索空间太大,无法写出精确的评估程序。
这也是围棋棋手的自豪之处。围棋被视为完美博弈游戏的巅峰,其中被视为体现了人类灵性的那部分,象征了人类大脑引以为荣的对抗AI的智慧堡垒。 阿尔法狗的策略是,学习人类的直觉。
DeepMind的创始人哈萨比斯说: “围棋中没有等级概念,所有棋子都一样,围棋是筑防游戏,因此需要盘算未来。你在下棋的过程中,是棋盘在心中,必须要预测未来。小小一个棋子可撼动全局,牵一发动全身。”
如今,人们已经接受了AI在围棋上碾压人类,我也经常忙中偷闲看AI和人类下让子棋。
我总结了如下10点,不是从技术层面去分析AI下围棋的原理,而是试图从AI下棋的十个特点中学习“阿尔法狗思维”,以改善人做决策的思维。 1、AI不讲棋理。 什么叫棋理? 棋理可能介于公式和道理之间。 算是一些模糊的“夹层解释”。 对比很多人生大道理,棋理,以及各种围棋格言,已经算很靠谱了,有些围棋格言看起来连AI都在“遵循”,由此可见经验和人类群体智慧的厉害。 但AI并不需要棋理,它的世界里只有计算。 年轻人不讲武德… 其实,有些德啊,理啊,要么是因为不够智能,要么是用来忽悠外行和年轻人的。 2、AI一心一意,只为终局胜率。 围棋只要胜半目就赢,这是一盘棋胜负的唯一评判方式,和你是否下得漂亮、是否走出了妙手、杀死了对手多少棋子等等都没啥关系。 这是基本规则,按理说AI和人的理解都一样啊,能有啥区别? 区别很大。人是情感动物,在某个局部杀红了眼,经常就要争口气,争一下就忘记了自己的目的不是争气,是赢棋。 在围棋中,有个名词叫“气合”,是指对局者在气势上坚持的强劲着法,经常是双方都较劲儿,结果互相转换。 由此延伸的概念,就有“动机”,以及“评价系统”。 这二者在现实中都是决定性的玩意儿,动机就不用说了,这是人性的火源。 评价系统,有点儿像巴菲特说的内部计分卡或者外部计分卡。 评价系统对于一个人或者企业来说,就是其使命、愿景、价值观。 这些看起来假大空的东西,真的很有用。 为什么? 围棋可以用半目来定胜负。但人类社会是复杂的没边界的无限游戏,有了价值观这类东西,更有利于个人或企业在模糊的领域做计算。 3、AI下没有记忆的棋。 AI经常脱先,甚至在很多看起来重要的地方,说不下就不下,跑到别处走棋了。 看起来,转身非常灵活。 当然,AI不懂什么叫转身,什么叫灵活,它永远在搜索计算当前局面下对终局胜率最高的一手棋。 沉没成本、纠结、放不下,这是人类文化的副产品。
|