“自由能原理”对最小现象自我的解释其实蛮值得一看的。
简单来说,神经系统与环境的交互中,需要这样一个“我”以确保其物理状态构成一个不变的有界集合。这有利于最小化神经系统和外界交互的自由能,从而支持系统在更长的时期中稳定的存在。[1]
我们先看一个有趣的实验然后再介绍自由能原理。
一个关于“我和非我”的实验
先来看一个著名的橡胶手错觉实验,来认识一下“我”这个概念。
最简单的自我认知就是“这个是 我 的身体”。而这个实验通过多感官刺激展示了一个人的身体自我认知是可塑的。[2]
这个实验的设置像下图这样,[3][4]
参与者坐在桌边,一只橡胶手被放置在参与者面前,而他自己的手则被放置在隔板之外,是视线不能看到自己的真手。
然后同时在参与者的真手和橡胶手上施以触觉刺激。参与者能够通过皮肤感觉到真手上传来的触觉刺激,同时通过视觉观察到橡胶手上的触觉刺激。
当触觉刺激在两只手上以一致的位置、时间同步方式传递时,参与者就会体验到对橡胶手的所有权感。此外,参与者对自己手的位置的感知会转移到离橡胶手的位置更接近的空间位置。
此时,若是以锤子击打橡胶手,尽管并不对真手施以刺激,参与者依然会本能地抽出手甚至跳起来。[5]这就是因为此时参与者对橡胶手地所有权感已经被训练到很高,神经系统误认为橡胶手是我们自己身体的一部分。
所以,同时的多感官体验可以更新橡胶手在我们神经系统中的表示,使得橡胶手是“我”的概率不断增加。
注意这里我们用了“概率”这个词,我们后面会详细解释。同时上面的实验也展示了“我”和“非我”是确实存在的概念,但是这个概念并不是牢不可破的,而是可塑的。
自由能原理
这里对自由能原理做一个粗糙的介绍。自由能原理本质上是数学的、物理的。它是关于远离热力学平衡的自适应自组织系统的综合性理论。而神经系统就可以被看作这样一种自适应自组织系统。
它的一个核心是,在神经系统和环境交互的过程中,大脑寻求最小化惊讶度(surprise)。或者更广泛的说,生物体在不断变化的环境中抵抗自然的无序倾向。
神经系统和世界的交互可以用下图表示:[6]
- 首先,智能体只能通过其感觉间接了解其遇到的(隐藏的)外部状态;因此它必须进行(贝叶斯)推理来推断隐藏状态。比如我们听到“喵”的一声,要来判断猫的位置(甚至判断到底是不是猫),显然不是完全准确的,是概率性的。即便是“眼见为实”也依然是概率性的,因为“不知全貌”。
- 同样,如果大脑想要改造外部世界,也只能通过行动来间接修改隐藏状态,甚至需要推断其适应性行动过程。
- 其次,为了执行支持感知和行动的推理步骤,智能体需要学习(分层)生成模型,该模型本质上描述了两件事:智能体先验期望什么,以及它的感觉是如何基于外部假设的事件生成的。
如果要从数学上描述这个模型,经过一系列贝叶斯操作、变分推断(这里不展开,可以参考 如何评价神经科学家 Karl Friston 的自由能原理和主动推断的时代意义?),可以得到自由能和 surprise 的关系:
好,现在假设我们脑子里已经存在一个“旧”的模型。比如“鱼在陆地上的概率非常低,但在水中的概率很高”。
大脑(作为评估有关外部和内部环境的信息并抵抗混乱的器官)必须具有低水平的熵。要做到这一点,大脑需要通过预测环境中的事件将引起什么感官后果来最大程度地减少与当前事件相关的 surprise。
随着时间的推移,预测会不断更新和优化,以便在整个大脑中保持较低水平的熵。从长远来看,这意味着大脑作为一个整体,可以最大限度地减少所有感觉系统中 surprise 的平均值,学习如何最好地建模和预测传入的感觉输入。
比如,我们看到河流,大脑就会预测,我们大概率能看到鱼(先验概率),这样当鱼出现的时候。这个外部环境的事实传输给大脑的信息,和大脑原来的模型是很吻合的,神经系统很容易就能对该状态做出推断,因此 surprise 很小。
但是如果在陆地上突然出现鱼,则 surprise 较大。
但是神经系统的这个内部状态模型也会学习,比如学到在海鲜市场的地上看到鱼的概率可能不小。
“自我”也同理
我们仍用橡胶手错觉举例子。
视觉上观察到的皮肤上的触摸与体感系统检测到的触摸在时间上一致,于是将彼此关联,从而导致对即将发生与皮肤的接触时的体感事件的预测。
那么顺着这个逻辑,根据我们大脑里原有的经验模型,当我们看到有东西接触来这个物体时,如果这个物体会使我们感受到触摸,那这个物体大概率是我们自己身体的一部分。
不同身体部位的视觉特性也将被感知地学习,这样当任何物体接近身体时,就会预测体感事件。
因此,自由能和预测编码框架内的感知学习导致了生成模型,其中,一个人自我身体的各个方面被处理为这样一种概率上最有可能的物体(或物体集合):即,当触摸、移动、威胁或以任何方式作用时,这个物体或物体集合能唤起检测身体状态的其他感觉系统中的事件。
简而言之,“自我”的存在是对感官输入最简洁、最准确的解释。
我们在日常生活中要与环境大量交互,“自我”这一模型在神经系统中的存在,使得神经系统能够在我们的交互事件发生之前给出一定的预测概率,使得事件真的发生时 surprise 会较小。
从而这个神经系统与外界交互的自由能会较小,有利于神经系统作为一个自适应自组织系统更加长期稳定的存在。