The lab published a mini-review paper in Current Biology that discusses the role of the orbitofrontal cortex in prediction, inference, and generalization.

Find the full article here.
Read the news.
Current Biology | 北京脑所周景峰实验室综述文章:眶额叶皮层在预测、推理和泛化中的作用
2025年4月7日,北京脑科学与类脑研究所、北京师范大学认知神经科学与学习国家重点实验室周景峰课题组在Current Biology发表题“Prediction, inference, and generalization in orbitofrontal cortex”的短篇综述文章 (minireview),系统回顾了近几十年来关于眶额叶皮层 (orbitofrontal cortex, OFC) 功能的研究进展。文章指出,OFC不仅仅是一个简单的价值计算区域,而是大脑用于预测、推理和泛化的重要认知中枢。该区域通过构建任务空间的认知地图 (cognitive map),帮助个体利用经验推测未来,进行复杂的因果推理,并在新情境下灵活应用已有知识。
引言
我们根据以往的经验预测未来事件,比如根据过去的收入情况来预测每月的工资。然而,有时候仅依赖过往数据是不够的。例如,在考虑更换工作时,我们需要根据自身技能、过去的薪资水平以及当前的就业市场状况来评估和协商新的薪酬。该过程需要通过整合多个信息来源进行推理。此外,在转换工作岗位时,我们并不是从零开始,而是会将过去积累的技能和经验应用到新的但类似的工作环境中,这体现了泛化能力。预测、推理和泛化是帮助我们适应不断变化世界的重要认知功能。作为前额叶皮层的重要组成部分,OFC在这些过程中可能起到了关键的作用。
OFC曾被认为参与了多种认知功能,包括嗅觉感知、反应抑制、归因、预测误差以及刺激-奖赏关联。当前主流的一种假说认为,OFC通过传递经济价值信号,支持下游脑区的决策过程。尽管每种说法解释了实验结果的某些方面,但它们都无法完全涵盖OFC在多个物种中表现出的丰富信息表征,也无法全面解释与OFC受损相关的多种基于推理的行为缺陷。考虑到OFC参与如此多样化的功能,猜测其可能存在某种更核心的功能。
为了涵盖其功能的多样性,最新的假说认为,OFC编码了任务空间的认知地图,可用于解释多样的实验结果。尽管这一观点具有很强的普适性,但由于它的灵活性,也使得其面临挑战:包括如何清晰定义构成认知地图的具体要素,以及明确指出哪些功能通常需要OFC中的这种地图。尽管存在困难,最近的研究为认知地图假说提供了更多的数据支持和进一步的阐述。这些研究凸显了该理论框架激发新思考和探索的潜力,有助于我们更全面的探究OFC的功能和机制。
OFC绘制用于预测和推理的关联结构
OFC最显著的特征是其预测未来奖赏的能力,尤其预测奖赏的价值或具有生物意义的结果。因此有假说认为,OFC为下游脑区提供潜在结果的主观价值,以用于决策过程。然而,这种“价值”模型并不能完全解释OFC中存在的复杂任务信息。实际上,OFC神经元编码特定的感觉、预期结果、选择类型、不确定性以及时间和空间环境等多种信息。并且OFC神经元在没有奖赏的情况下能够编码刺激-刺激关联,表明其具有处理与价值无关的信息的能力。因此,OFC的功能不仅限于传递价值信号,其在预测未来事件的重要关联信息方面发挥更普遍的作用。
有意思的是,OFC并非在所有需要结果预测的任务中是必须的,如简单的辨别任务——仅基于感觉线索就能预测未来奖赏。相反,当涉及一定程度的推理时,OFC至关重要。例如,早期的研究发现OFC受损的患者不会感到后悔,这是一种评估从未经历过的、假定事件的认知缺陷。在大鼠和猴子的电生理研究中发现,OFC的活动参与了这种假定事件价值评估的任务。
过去的研究中存在一类行为任务,要求被试通过整合归纳过去经历或习得的关联信息,预测或想象从未直接经历的线索-结果的关联。这些任务包括感觉预学习、强化物贬值和过度期望;OFC异常的啮齿类动物在这些任务中表现不佳;并且类似的现象在猴子和人类中也有报道。另一类任务范式也得到了一致的结论:在这些任务中,动物必须整合过去线索-结果配对的关系以推断当前关系的变化规律,OFC受损的动物难以适应这种变化。这两类任务的研究提示了OFC在处理不可观测或隐藏因素中的关键作用——OFC的独特功能似乎在于其提取和使用未直接呈现的信息的能力。需要注意的是,虽然包括其他前额区域在内的更广泛的大脑网络可能参与到这些任务,但OFC的独特性在于,这一脑区可能通过整合所有感觉、情感、记忆和环境等多种输入信息以构建复杂的刺激关联,从而支持超出直接经验的预测和推理。
由于OFC存在丰富的任务信息表征,及其在基于推理行为中的关键作用,研究提出,OFC能够在任务空间的认知地图中标记当前的状态或位置。认知地图指的是任务中状态网络以及状态之间转换关系的大脑表征。每个状态可以定义为任务中的特定情境或具体时刻,并与一组可能的行动及预期结果相关联。当准确识别当前状态需要记忆或多维信息整合时(这一过程通常被称为隐状态或潜在状态推断),OFC尤为重要。通过对状态空间分层组织,将情境状态与更具体的局部状态结合起来,OFC使个体能够灵活运用环境中刺激、行为和结果之间的因果关系。
契合当下需求的隐状态表征
支持认知地图假说的证据主要集中在识别隐状态的神经表征。最初的证据来自一项人类fMRI研究,被试需要判断一所房子或一张脸的年龄。当某一类别(房子或脸)内的年龄发生变化时,参与者需要切换到对另一类别的判断。这种任务设计创建了一个包含16种状态的任务空间,每种状态由类别和年龄的过去及当前信息共同定义,而无法从即时线索中获得。这些状态可以通过OFC的BOLD信号解码出来。这些和后续的研究表明,人类的OFC能够结合过去、现在、未来以及推断的信息,为当前任务状态生成一个独特的标识。
电生理学研究也提供了证据支持。例如,在没有明确信号的情况下,关联信息突然发生变化时,动物通过整合过去的信息生成新的情境状态,进而辅助动物完成任务。OFC能够区分编码这些关联性存在差异的隐藏情境状态。此外,在我们使用气味序列训练“go, no-go”任务的研究中,大鼠需要同时追踪过去和当前的气味线索以做出正确应答。结果发现,OFC神经元能够区分当前气味线索相同但过去气味线索不同的气味序列。进一步实验证明,OFC能够在较长时间内维持隐藏的情境信息,即便在受到干扰性感官刺激的情况下也是如此。虽然单个神经元对这些状态的选择性在任务的不同时期存在显著差异,但在群体水平的特定子空间中仍可识别出一种持续表征情境状态的神经编码模式。
尽管存在这些证据,认知地图假说面临的一个挑战是如何精确界定纳入定义任务状态的信息类型。最近的研究结果与以下观点一致:OFC中的地图定义受行为目标驱动,以最大化奖赏或最小化预测误差。首先,OFC在忽略与任务无关的信息(如潜在抑制)方面起关键作用。其次,OFC对与任务无关信息的表征在学习过程中往往会被压缩。例如,当气味序列信息不再与任务相关时,在经过充分训练的大鼠中,OFC中的这些信息变得无法区分。第三,OFC中的任务相关状态表征与行为表现密切相关。例如,最近的一项人类fMRI研究表明,OFC中有两种并行的价值信号,分别受到任务相关和无关情境的调节,它们相互竞争以影响选择,其中任务相关的信息能更好预测行为表现。
任务结构的泛化表征
综合考虑OFC在基于推理行为和在解析隐状态中的作用,OFC似乎通过采用已有知识来创建新的状态,从而使受试者能够将学到的信息应用于新任务。猜测可能的机制是形成一种泛化的认知地图或图式,它能够跨情境对齐看似不同但潜在相关的任务状态。当状态空间的底层结构足够相似时,即便在感知层面上存在差异,个体也可以调整这些泛化的认知地图以应对类似的新问题。
实际上,过去的研究暗示了OFC的泛化能力,尤其是在价值编码方面。首先,早期研究发现OFC中存在独立于感官模式以及线索和奖赏类别的通用且抽象的价值信号。近期的神经活动分析进一步发现,可以从OFC神经群体活动中线性分离出价值信息。其次,编码价值的OFC神经元可以在不同情境中重复使用,而且单个细胞使用相同的放电率范围来映射不同情境中不同的奖赏量级范围。最后,OFC神经元的价值编码是稳定的,甚至可以持续数月之久。这些特征使OFC适合在各种情境中采用相同的神经编码模式。
最近的研究提供了更直接的证据。在一项原型学习任务中,人类参与者被训练将特定图像与抽象类别关联起来,随后测试他们将这些类别泛化到全新图像的能力。fMRI数据显示,在概念泛化过程中,OFC中存在抽象的原型信息。在另一项探讨经验传递内容的研究提出,迁移学习可能通过将已学习的任务分解为基本元素来实现,而这些基本元素可以作为新经验的框架被重复利用。在测试啮齿类动物OFC跨任务泛化能力的实验中,我们训练大鼠学习五个具有相同任务结构但具体气味线索不同的气味序列,发现OFC中具有反映共同任务结构的神经活动成分,使大鼠能够在新颖但类似的问题中重复利用这些成分。
这些研究表明,神经活动的降维对于理解任务结构的抽象和泛化表征非常有用。那么,在不同环境中实现泛化时,哪种类型的低维神经表征最为有效?一种可能的机制是通过因子化表征,使得特征维度保持分离或正交,从而使每个维度都可以通过简单的线性解码器独立解读。这种神经群体层面的特征分离通过将复杂的任务信息分解为简单、模块化的组成部分,从而支持跨不同条件的泛化。下游神经元可以独立学习和识别每个特征,并在新情境中重新组合这些特征,从而简化解决新颖但类似问题的学习过程。这种因子化表征在最近的研究中已有所体现。
那么,OFC是否在泛化及由此产生的迁移学习中存在因果关系?答案似乎是肯定的。由于OFC损毁导致的感觉预学习和奖赏贬值的行为缺陷,可以归因于关联或情境间泛化能力受损。在一项啮齿类动物经济选择任务中,OFC在新颖选项对之间的选择至关重要,而非熟悉选项对之间的选择。最近的一项研究表明,经过双臂赌博任务训练的小鼠能够将学到的策略迁移到一个新颖且类似的任务中,而这一过程需要OFC的可塑性。
从上述讨论中,出现了一个关键问题:我们应如何统一OFC在基于推理的行为和泛化中的作用?似乎OFC对于使用已建立的认知地图的行为并不重要;而当这些地图需要通过心理操作来创建新的关联或生成新的抽象状态时,OFC发挥重要作用。这种心理操作可能是OFC的核心功能,但这一想法还需要更多的实验证据来验证。
与海马认知地图的关系
OFC不可能孤立地完成这些功能,而是必须依赖与其他脑区的直接或间接连接,尤其是海马,后者同样被认为对认知地图至关重要。过去的研究表明,两个区域似乎扮演着互补的角色。
从认知地图的角度来看,OFC和海马之间的关键区别在于它们的认知地图是如何组织的。在空间十字迷宫任务中,经过多次奖赏位置反转后,海马稳定表征当前路径,而OFC则对通往相同奖赏的不同路径进行泛化。在一项小鼠学习多组气味-结果序列的非空间任务中,海马生成了“序列区分”信号,这些信号根据过去和当前的气味线索明确区分不同序列。即使这些序列具有重叠的元素,这些信号使海马能够维持每个序列的独特表征。相比之下,OFC倾向于对共享相同底层结构和预期结果的序列对进行泛化,强调更高层次的共性而非序列特定的细节。这种互补的神经编码突显了海马和OFC协同工作机制,在状态辨别与基于任务结构和结果的泛化之间取得平衡。
使用因果扰动的研究发现抑制海马输出主要影响了OFC对反应方向和情境状态的编码,但却增强了其在相似气味序列间进行泛化的能力。这表明OFC依赖海马输入来进行状态解析,但并不依赖它进行泛化。这些结果为进一步研究海马在何种条件下以及如何支持OFC功能提供了启发,同时也引发我们对OFC信号如何影响海马表征问题的进一步探讨。
结论
近期研究认为,OFC维持任务空间的认知地图,通过整合多来源的信息来表征当前状态并支持基于推理的行为。这一认知地图不仅对于解析隐状态至关重要,还能够通过利用现有知识生成新的状态表征,从而将学到的知识应用于新情境。OFC的泛化能力可能得益于其适应性和稳定的编码特性、压缩任务无关信息的能力,以及为未来任务灵活组合的因子化表征。此外,OFC的功能与海马密切相关,这两个区域在认知地图中扮演着部分重叠但互补的角色。未来的研究应阐明这些相互作用的具体机制,以及OFC和海马在预测、推理和泛化等认知功能中的精确贡献。
论文信息
课题组得到了科技部科技创新2030-“脑科学与类脑研究”重大项目、北京市科技新星计划、中国医学科学院北京协和医学院以及北京脑科学与类脑研究所的资助。北京脑科学与类脑研究所2021级博士生马凤君和林慧欣为本文共同第一作者,周景峰为通讯作者。