我的认知取决于我的神经元——我的大脑细胞。更准确地说,我所知道的取决于数百亿神经元之间的具体连接方式,取决于相连神经元之间的神经化学相互作用,以及不同类型神经元的反应组合。所有这些让我成为了我。
我所知道的事物的范围就像二手市场出售的商品一样五花八门。有些描述怎么做,有些描述是什么,有些两者都包含,还有些两者都不是。有些转瞬即逝,有些则经久不衰。有些我可以清楚表达,比如如何更换轮胎;有些我没法清楚表达,比如我如何构建一个逻辑论证。
有些学习是有意识的,有些则不是。为了学一些东西,比如如何骑自行车,我不得不一次次尝试;相反,如果上次生蚝让我呕吐,那我就会学着不再吃生蚝。知道如何换轮胎取决于知识,但知道如何拍手就不需要了。
而神经元是这一切的根源,它们是如何让我们知道这一切的?
在生物历史早期,演化偶然发现了一些动物身上累积的优势,它们的神经系统可以根据过去的关系做出预测。与植物只能被动接收不同,动物是行动者,拥有一个具有学习能力的大脑。这使得它们在寻找食物、配偶和栖息地以及躲避危险方面具有竞争优势。神经系统的工作是预测,并为此绘制出世界中与自我相关的部分,如它的空间关系、社会关系、危险等等。当然,大脑会根据生物体的需求、能力和生活方式绘制出复杂程度不同的世界。
因此,人类、狗和青蛙会以非常不同的方式表征同一片池塘。例如,人类可能对池塘的水源、水的可饮用性和灌溉潜力感兴趣,狗可能对在池塘中游泳和饱喝一顿感兴趣,而青蛙则对池塘中适合产卵、寻找苍蝇、晒太阳或隐藏起来的地方感兴趣。
归根到底,有关知识的神经科学的主要问题在于:神经组织的结构如何表征知识(表征问题)?作为动物经验的结果,神经元的结构特征如何发生变化,进而构成对新事物的认识(学习问题)?基因组如何进行组织,以使得它所构建的神经系统能够学习需要学习的东西?
在过去的三四十年里,遗传学、心理学、神经行为学、神经胚胎学和神经生物学取得了惊人的进展,让我们对于大脑如何表征、学习和构建有了全新的看法。在这个过程中,许多令人尊崇的范式都受到了冲击。从旧真理的灰烬中,一个用于思考自身以及大脑如何理解世界的崭新框架诞生了。
先天与后天之争
历史上,哲学家们一直在争论我们的知识有多少是基于本能,又有多少是基于经验。理性主义者作为一个极端,认为本质上所有的知识都是天生的,另一方是激进的经验主义者,认为所有的知识都是后天获得的。
出生时表现出的知识很有可能是天生的。一只正常的新生老鼠会爬到最温暖的地方、用嘴咬住乳头开始吮吸。一只被抛到空中的小猫会恢复平衡双脚着地。一个人类新生儿会模仿面部表情,比如伸出的舌头。但其他知识,例如,如何编织或生火,显然是后天习得的。
这些对比似乎意味着,我们所知道的一切要么是由基因引起的,要么是由经验引起的,没有第三种可能。但分子生物学、神经发生学和神经生物学的近期发现推翻了先天与后天之间的巨大差异,其中一项发现是,正常的发育从最早期开始就依赖于基因和表观遗传条件。
另一方面,长期学习(如记住穿过森林的一条路线)依赖于基因表达在体现这种学习的细胞中的变化。如果你在白天经历了一种新的感觉运动事件,比如学习钓鱼,在你深度睡眠周期中大脑会不断排练该事件,zif268基因会上调。第二天钓鱼的进步将依赖于相应产生的基因产物和它们在神经元功能中的作用。
事实上,五项重要且相关的发现已经越来越清楚地表明“先天”和“后天”是如何相互关联的,因此过去对于二者的区分是多么不恰当。
1.基因的作用是编码蛋白质。基因只是一组碱基对序列,它包含的信息可以让RNA把一组氨基酸串联起来构成蛋白质。(基因转录形成RNA产物被称为“表达”,其中一些RNA产物反过来会被翻译成蛋白质。)
2.自然选择不能直接选择特定的神经连接,以支持特定的知识领域。抛开运气,决定动物是否能生存的是它的行为,它的生理、神经和其他方面构成了行为的基础。尽管是间接的、但只有当表现行为的表征给予了动物竞争优势,神经系统中的表征能力才会被选择。因此,表征的复杂性和神经连接只有通过行为的更新才能得到选择。
3.所有脊椎动物的结构和发育组织都有极高的保守程度,并且从蠕虫到蜘蛛再到人类,所有门的基本细胞功能都有非常高的保守程度。所有神经系统使用本质上相同的神经化学物质,它们的神经元也以相同的方式运作,相似之处远远超过了差异。人类只有约三万个基因,并且只有约300个基因与小鼠的有差异;与此同时,我们和黑猩猩共享约99.7%的基因。我们的大脑和其他灵长类的大脑具有相同的组织、比例大致相同的总体结构、相同的神经元类型,并且就我们所知,也具有几乎相同的发育时间和神经连接模式。
4.鉴于高度的保守程度,多细胞生物的多样性来自何处呢?分子生物学家已经发现,一些基因调控其他基因的表达,而且它们自身也受到其他基因的调控,形成复杂的、相互作用的、系统的组织。但是基因(通过RNA)生成蛋白质,所以一个基因对另一个基因的表达可能会因对蛋白质产物的敏感性而受到影响。此外,细胞内和细胞外的蛋白质可能相互作用,产生进一步的偶发事件,从而形成一个解折叠的调控级联网络(蛋白质互作网络)。由于调控基因之间错综复杂的层级关系,调控基因的细小差异能产生巨大而深远的影响。复杂的、相互作用的基因表达因果关系的出现产生了非常奇特的调控级联网络,这些级联可以产生非常奇特的生物体,比如我们人类。
5.从受精卵到正常活动的生物,生物体发育的各个方面都取决于细胞出生的地点和时间。神经元来源于前神经元细胞最后一次分裂的子细胞,子细胞是成为神经胶质(支持)细胞还是神经元,以及该细胞成为几百种神经元细胞中的哪一种,都取决于它的表观遗传环境。此外,来自某一区域(如丘脑)的神经元与皮层细胞的连接方式在很大程度上取决于表观遗传环境,例如丘脑和皮层神经元的自发活动以及之后由经验驱动的活动。这并不是说新生儿吮吸反射和知道如何生火之间没有因果上的显著差异,差异显然存在。关键点在于这些差异并不属于古老的“先天”与“后天”之分,基因和遗传之外的因素以复杂的相互依赖性相互合作。
到目前为止,人们一直认为,负责特定任务的大脑中枢模块在出生时就已经产生神经连接了。我们之所以能看见是因为大脑皮层中专门的视觉模块与视觉相连,我们之所以能感受是因为大脑皮层中专门的模块与触觉相连,诸如此类。
真相要令人费解得多。例如,无论盲人是先天还是后天失明,他们的视觉皮层在阅读盲文时被激活,阅读盲文是一种明显的非视觉的触觉能力。此外,事实表明,用磁感应电流刺激盲人的视觉皮层会暂时损害他阅读盲文的表现。更值得注意的是,蒙上眼睛数天学习阅读盲文的视力正常者也会发生视觉皮层活动。只要蒙上眼罩,防止光线落入视网膜,盲文阅读能力就会稳定提高。眼罩非常关键,因为正常的视觉刺激会以正常方式激活视觉皮层,这会损害触觉技能的习得。例如,如果五天后眼罩摘下,即使只是睡前短暂地观看了电视节目,他第二天戴眼罩阅读盲文的表现也会不如以往。如果视觉皮层可以参与非视觉信号的加工,那么专用视觉模块的概念,以及更普遍的专用模块假设对我们还有什么意义呢?
可以确定的是,在构建人类大脑可塑性起源的研究框架时,先天与后天的二分框架与其说是一种优势,不如说是一种劣势。
信息分布于神经元之中
一种吸引人的想法是,如果你学习了一些东西,比如打车夫结,那么这些信息会与相关知识(比如车夫结介于平结和半绞结之间)一同存储在大脑中的某个特定位置。毕竟,这是一种存储工具和文件的好方法——放在特定位置的特定抽屉中。但正如卡尔·拉什利(Karl Lashley)在20世纪20年代首次证明的那样,大脑不是这么工作的。
拉什利推断,如果一只大鼠学习了一些东西,比如穿过某个迷宫的路线,而且这些信息存储在一个单独的点状区域,那么,通过损伤大鼠大脑的正确位置你应该能够提取正确信息。拉什利在迷宫中训练了20只大鼠,接着,他移除了每只大鼠皮层中的不同区域,给大鼠一些时间恢复,之后,他再次测试每只大鼠以观察哪一处损伤移除了关于迷宫的知识。拉什利发现,一只大鼠的知识不能被定位于某个单一区域,尽管更广泛的组织切除会导致更严重的记忆缺陷,但似乎所有大鼠都有一定程度的损伤,却也还有一定程度的能力。
正如后来改进的实验方案表明的,拉什利的非定位结论基本正确。大脑中没有专门的记忆器官,信息根本不是存储在特定的文件柜中,而是分布在神经元中。
对于信息以网络形式分布在神经元中的意义,我们一般的理解源于计算机模型。基本观点是,通过与其他人造神经元的连接以及连接的不同强度,网络中的人造神经元可以产生一种表征事物(如男性或女性的脸)的模式。在人造网络进行训练时连接强度会发生变化,在这个阶段,它会得到一些反馈,获悉对给定输入的表征是否适当。但是,与计算机模拟的神经网络相比,实际的神经网络如何存储及分布信息的许多细节还没有确定,所以计算机模型和神经学实验正在共同发展。
神经科学家正试图使用多种研究策略来理解学习的结构。一种策略包括在神经元水平追踪依赖于经验的变化,用以找出究竟是什么、在什么时候以及为什么发生变化。另一种策略涉及更大范围的学习:当身体受到损伤时,或在发育过程中,或当受试者在扫描仪中执行记忆任务时,或当实验动物的某些基因被敲除时,行为和特定的大脑子系统会发生什么?在这个研究层面,心理学、神经科学和分子生物学紧密合作。
网络层次的研究旨在跨越系统水平和神经元水平的缺口。一个挑战在于,理解不同神经元中不同的局部变化是如何产生一致的、全局的、系统水平的变化以及对行为进行适合任务的调整。大脑中多样而深远的变化,是如何促成高尔夫挥杆动作的改进或对量子力学更好的理解呢?
大脑里发生了哪些依赖于经验的调整呢?每一天,这些神经元共同造就了现在的“我”,它们经历着许多结构上的变化:新的分支会冒出,已有的分支会延伸,新的神经化学信号的受体位点会形成。另一方面,修剪会减少分支,从而减少神经元之间的突触连接数量;或者剩余分支上的突触可以被完全关闭;或者整个细胞可能会死亡,伴随而去的还有它所支持的所有突触;或者最后在某个特殊区域,一个崭新的神经元可能会诞生,开始在该区域建立突触连接。
这还不是全部。重复高频的突触放电(尖峰)会耗尽可供释放的神经递质囊泡,从而构成一段约2~3秒的记忆。特定神经元的成分、每次峰电位释放的囊泡数量,以及每个囊泡中包含的递质分子数量都可以发生改变。然而,不知何故,尽管“我”的大脑每一天、甚至每一分钟都并非完全相同,但“我”的技能几乎保持不变,“我”的自传体记忆依然完整。
预测和奖励
神经元系统让动物做出预测。与植物不同,动物能够使用事件间过去的关联(如红樱桃和令人满意的味道)来判断未来关联的可能性。因此,学习的一个核心部分涉及计算哪种具体性质能预测哪种有利效应的存在。我们将可变的奖励与某种程度的概率特征关联起来,所以好的预测将同时反映奖励的期望值和奖励发生的概率,这就是期望效用。在正常的生活过程中,人类和蜜蜂一样都会计算期望效用。一些神经元水平的证据开始出现,来解释我们的大脑是如何做到这一点的。
对于不经意的观察者来说,蜜蜂似乎随意地采花蜜。然而,仔细观察就会发现它们有条不紊地觅食。蜜蜂不仅会记住哪一朵花它们已经光顾过,而且在一片花蜜含量不同的花丛中,它们还学会优化觅食策略,以最少的努力获得最多的花蜜。
假设你在一小块土地上种了两批塑料花,一批黄色一批蓝色。每一朵花中间都有小孔,里面放有精确数量的蔗糖。这些花随机分布在封闭的田地周围,然后用量好的“花蜜”作为诱饵:所有的蓝色花含2毫升花蜜,三分之一的黄色花含6毫升花蜜,剩余三分之二含0毫升花蜜。这样的蔗糖分布确保光顾蓝色花和黄色花的平均价值相同,尽管黄色花比蓝色花不确定性更高。
在最初随机在花丛中探索后,蜜蜂很快形成了一种模式,即有85%的时间光顾蓝色花。你可以通过提高黄色花平均价值的方式改变它们的觅食模式,例如,让三分之一的黄色花含10毫升花蜜。蜜蜂的行为表现出来源类型可靠性与花蜜含量之间的某种权衡,它们会略微偏好可靠性。有趣的是:根据探索过的花的奖励情况,蜜蜂会修改自己的策略。它们似乎会计算期望效用。蜜蜂,它们只是蜜蜂,是如何做到这一点的?
在蜜蜂的大脑中有一种神经元会对奖励做出积极反应,尽管它不是感觉神经元也不是运动神经元。该神经元被称为VUMmx1(记为vum),能调节强化学习过程,在蜜蜂大脑内分散投射,到达感觉区域和运动区域。使用一种人造神经网络,里德·蒙塔古和皮特·达扬发现,vum的活动反映了预测偏误,即“预期奖励”与“实际奖励”之间的差值。vum的输出是一种神经调质的释放。该神经调质针对多种细胞,包括那些负责行为选择的细胞。如果神经调质也作用于连接感觉神经元和vum的突触,那么这些突触将会变得更强,这取决于vum计算得到“比预期更差”(更少的神经调质)还是“比预期更好”(更多地神经调质)。假设蒙塔古-达扬模型是正确的,那么根据一种相当简单的权重修正算法得到的简单回路,便奠定了蜜蜂对觅食条件的适应性基础。
现象间的依赖关系可以非常复杂。在生活的大部分时间,依赖性是有条件的和概率的:如果我在鱼钩上放一条新鲜的蠕虫,正是午后,那么我非常有可能在这钓到一条鲑鱼。随着我们对世界的复杂性了解更多,我们会“更新”我们对于依赖关系的表征。例如,我们了解到当水较凉时更有可能钓到鲑鱼,阴暗的池塘比阳光充足的池塘更适合鱼类栖息,而和蠕虫说话、恳求鲑鱼或戴上“幸运帽”则毫无作用。我们所说的人类和其他动物的智力,有一部分是一种对依赖关系获得越来越复杂的理解的能力。这使我们能将长期来看并不具备预测性的偶然关联(如第13个星期五断了一颗牙)与具有预测性的因果关联(如断牙与咀嚼硬糖)区分开。这意味着我们可以用那些通过了实证检验的假说来取代迷信的假说。
和蜜蜂一样,人类和其他动物也有一种奖励系统,用来调节对世界运转方式的学习。哺乳动物的大脑内有像vum 一样的神经元对奖励做出反应。它们会对能够预测奖励的刺激做出反应,或者在奖励不会到来时提示错误。这些神经元从脑干结构(腹侧被盖区,VTA)投射到额叶皮层,并向突触后神经元释放多巴胺。多巴胺只是奖励系统涉及的一种神经化学物质,它调节目标神经元对神经递质的兴奋性,从而为特定关联的局部学习创造条件。
通过增加愉悦、减少焦虑和痛苦来强化行为非常有效。然而,这样的系统可能会被植物来源的分子劫持,这些分子的行为模仿了大脑自身奖励系统的神经化学物质。在服用可卡因、尼古丁或阿片类药物后,奖励系统通路发生改变。所有这些药物都与神经元上的受体位点结合,它们与大脑自身的肽相似。大量脑肽在大脑功能中的精确作用也是神经科学一直以来的难题之一。
这些发现为理解预测背后的神经元组织打开了一扇门。它们开始在依赖经验的单个神经元变化和依赖经验的行为指导之间建立起解释的桥梁,也已经开始揭示成瘾的神经生物学机制。与此同时,一项补充性的研究正在理清预测讨厌事物的机制。尽管相较于强化学习,厌恶学习依赖于一组不同的结构和网络,但关键的改变也发生在单个神经元层面,这些局部改变在神经元集群中协调,并跨越时间进行整合。
在学习研究的其他领域,类似的解释线索开始将神经系统组织的许多层次联系在一起。这种研究加深了我们对工作记忆(在缺少相关刺激时维持信息)、空间学习、自传体记忆、运动技能和逻辑推理的理解。尽管在关于知识的神经科学方面取得了非凡的研究成果,但是我们必须意识到,这些对神经科学来说仍然是非常早期的阶段。毫无疑问,许多惊喜甚至一两场革命即将发生。
,