2.4 曙光

所谓算法，顾名思义，就是计算的方法，再通俗地说，就是每一步怎么算，其实也是一种流程。人类史上，迄今为止最重要、最具价值的算法，很可能是两百多年前一位牧师提出来的，即后来人们以他的名字命名的贝叶斯定理。

贝叶斯（1702—1761）本人可能并不同意以他名字来命名定理。严格意义上讲，贝叶斯只是证明了贝叶斯定理的一个特例；而拉普拉斯（1749—1827）证明的是贝叶斯定理的一个更普遍的版本，并将其应用于天体力学、医学统计，甚至法理学之中。遗憾的是，拉普拉斯认为这个定理几乎无关紧要；更遗憾的是，贝叶斯是个小神父，而拉普拉斯是个数学泰斗，于是，拉普拉斯的看法影响了后面一百多年里几乎所有统计学家。

直到 20 世纪 50 年代末，贝叶斯定理才被重新发现，至 21 世纪初，才开始在各个领域被全面应用，而后逐步成为今天人工智能应用的终极算法（The Master Algorithm）。

[ \mathrm{P} (\mathrm{A} | \mathrm{B}) = \frac {\mathrm{P} (\mathrm{A}) \times \mathrm{P} (\mathrm{B} | \mathrm{A})}{\mathrm{P} (\mathrm{B})} ^ {1} ]

虽然这个数学公式的理解难度并不是很高，但也的确不是一看就懂的。它并不存在于当前的中学课本里，甚至绝大多数的本科毕业生也对它一知半解，也许听说过这一公式的人占比也不高。这实在是“在重要知识点上认知分布差异极大”的一个经典案例。

智商、积累、生产资料都相对有限的普通人，比如我，常常可以选择一种捷径——囫囵吞枣。虽然那证明过程我看不大懂，可如果那结论的确严肃且靠谱，那么我总可以把它拿来直接用吧？事实上，我翻阅很多领域的科学论文时，的确经常这么干——反正也理解不了证明过程，看完概要之后就直接跳到末尾去看结论，然后拿着结论去解决问题。还别说，这样的确轻松解决了不少问题。

细想想，字面意义上的“囫囵吞枣”，虽然缺了咀嚼的过程，少了品尝的滋味，甚至吞下了本应吐掉的枣核，但从充饥的角度来看，也相当够用。

我们不是在讲概率课，也不想马上深入研究人工智能主要算法，所以我们在这里先不管具体细节，就囫囵吞枣地理解一下“贝叶斯定理”究竟是干什么的：

贝叶斯定理是可以用新的证据修订并提高之前假说的正确概率。

战场上的炮兵就在不由自主地应用贝叶斯定理，不管他是否知道“贝叶斯定理”这个词。或者换个说

法，炮兵在击打目标的过程就是贝叶斯推理过程。当一个炮兵瞄准目标准备发射的时候，他就持有一个假说——他要熟悉自己的设备，能够估算炮弹的轨迹，估算距离和风速的影响，确定炮筒的方向和角度。这个假说有一定的成功概率，但很难直接做到 (100%) 准确。第一发炮弹打过去，击中了目标，那很好，可以说技术好也可以说运气好，事实上哪怕成功概率不超过一半，也有可能第一次就打中。第一发没打中，也正常，但第一发炮弹落地的位置将成为新的证据，这个新证据将使这位炮兵改进自己的假说，即调整炮筒方向和角度。于是，这一次的假说比上一次的假说的成功概率更高。

在此之前，形式逻辑也好，非形式逻辑也好，概率统计也罢，事实上都是面向过去的，然后一厢情愿地希望能够用基于过去的数据在当下分析出来的结论去指导未来决策。翻译过来差不多是“经过分析确定，过去是因为这样，所以现在那样”，然后再下一步是多少有些一厢情愿地认定“如果我现在这样，那么将来就会那样”。

问题在于，“如果我现在这样，那么将来就会那样”只是个假说，并不确定。有句话说得好：这世界唯一确

定的就是不确定。问题在于，“不确定”总是藏在时间里，并随着时间的推移终将显现，等它出现的时候，一切都失灵了。

贝叶斯定理不一样，它的应用是面向未来的；更关键的是，贝叶斯推理过程可以递归和迭代地使用，即反复根据新的证据提高假说的正确概率，直至接近100%。而传统的概率统计只是一次性计算，且不见得可以递归迭代地使用。

至此，人类有了面向未来的因果推理工具。贝叶斯定理可以不断用新的证据计算假说的正确概率，也可以通过对假说进行调整，逐步达到更高的正确概率。换言之，人类终于有一个工具可以用来预测未来了，虽然那预测不是一开始就 100% 准确，但可以通过不断迭代逐步提高预测的准确率。

大众倾向于拒绝任何不确定性，这是没办法的事

情，尤其是试错的成本涉及金钱甚至生命的时候。在实际生活中，回避不确定性确实能够躲避很多的危险，少承担很多损失，这不可否认。但久而久之，大多数人不光回避不确定性，也养成了拒绝对不确定性进行思考的习惯，因为有限的经验表明，那不仅浪费时间，还总是危机四伏。

当然，更深层次的原因其实是人脑不够用——任何人类的大脑，在使用贝叶斯定理去预测未来或者提高预测准确度的时候，都不够用。因为贝叶斯推理过程需要的不是一次运算，而是从不间歇的运算，这只是第一个层面。再进一步，人脑更不够用，因为需要计算的因素往往不止两个，而是很多个，每多考虑一个因素，计算量就以几何级数上涨，人脑怎么可能够用呢？

万幸的是，今天的人们有了另一个工具——计算机。我认为计算机无疑是迄今最成功的仿生产品，因为电脑仿生的是极其复杂的器官：人类的大脑。随着时间的推移，综合各种因素，计算机的硬件和软件持续发展，逐步突破了各种限制。比如，单台计算的运行速度和效率在持续提高的同时，单位时间耗能越来越低；再比如，分布式网络构成的集群工作

能力越来越强的同时，电力成本在持续降低。就这样，仰仗着持续提高的算力和持续降低的成本，人工智能在2023年突然爆发，人类进入了“智能时代”——用我的话讲，人类突然进入了暴力破解宇宙秘密的时代。

因果推理（思考）工具

2.4 曙光 ​

2.4 曙光