||
美国哈佛大学Naoshige Uchida、HyungGoo R. Kim等研究人员,合作建立了不同时间尺度下多巴胺信号的统一框架。
这一研究成果于2020年11月27日在线发表在《细胞》上。
研究人员使用虚拟现实开发了将奖励预测误差(RPE)与价值区分开来的实验范例。研究人员检查了各个阶段的多巴胺回路活动,包括体细胞突增、体细胞和轴突处的钙信号以及纹状体多巴胺浓度。
结果表明,多巴胺信号的上升与RPE一致,而不是与价值一致,并且在所有检查的阶段均观察到了这种上升。
多巴胺信号的上升可以由动态刺激来驱动,从而表明一种逐渐采取奖励措施。研究人员提供了对快速相位和缓慢倾斜的多巴胺信号的统一计算理解:多巴胺神经元在时间基础上对价值执行类似导数的计算。
研究人员介绍,中脑多巴胺神经元的快速相位活动被认为是RPE的信号,类似于机器学习中使用的时间差异误差。但是,最近报道缓慢增加的多巴胺信号研究提出,它们代表状态值并且独立于体细胞突波活动而出现。
相关论文信息:
DOI: 10.1016/j.cell.2020.11.013
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 11:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社