氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

计算机程序能否模拟大脑? 精选

已有 4886 次阅读 2023-11-8 16:15 |系统分类:海外观察

研究人员一直在尝试回答这个问题。机器学习的发展使构建模拟大脑活动的计算模型成为可能。连接组学和其他数据使机器学习系统能够重现生物系统中的神经活动。将来自传统大脑建模技术的信息与在不同数据集上训练的机器学习系统相结合的混合方法可以使整个工作更加严格和信息量更大。然而,这种方法也带来了一些挑战,如解释模型的预测和预测未来场景。研究人员需要解决这些挑战,以实现使用机器学习构建整个大脑的模拟。研究人员需要合作获取多模态数据集,并就建模目标和衡量指标达成一致。神经科学家需要确定模型是否应根据过去状态或整个大脑预测单个神经元行为,以及生物系统中神经活动的准确再现。为了向更广泛的科学界开放大脑建模挑战,研究人员需要阐明哪些建模任务是最高优先级的,以及应使用哪些指标评估模型性能。机器学习大脑建模方法在神经科学中具有潜在价值,特别是在处理和编码感官刺激方面。研究人员使用经典建模的神经网络,结合机器学习系统,以再现神经系统的视觉或听觉能力。即使失败,也能为测绘工作提供有价值的信息。

图片1.png

计算机编程能模拟大脑吗?这是数学家、理论家和实验家长期以来一直在问的问题。一是出于创造人工智能(AI)的愿望,是出于这样一种想法,即只有当数学或计算机能够重现其行为时,才能理解大脑等复杂系统。为了试图回答这个问题,研究人员自1940年代以来一直在开发简化的大脑神经网络模型1.事实上,今天机器学习的爆炸式增长可以追溯到受生物系统启发的早期工作。

 

然而,这些努力的成果现在使研究人员能够提出一个稍微不同的问题:机器学习是否可以用于构建模拟大脑活动的计算模型?

这些发展的核心是越来越多的大脑数据。从 1970 年代开始,但自 2000 年代中期以来,神经科学家一直在制作大脑连接组——神经元的连接和形态图,这些神经元在特定时刻捕捉大脑的静态表示。除了这些进步之外,研究人员进行功能记录的能力也得到了提高,功能记录以单个细胞的分辨率测量神经活动随时间的变化。同时,转录组学领域使研究人员能够测量组织样本中的基因活性,甚至绘制该活性发生的时间和地点。

到目前为止,很少有人努力连接这些不同的数据源或同时从同一标本的整个大脑中收集它们。但是,随着数据集的细节水平、规模和数量的增加,特别是对于相对简单的模式生物的大脑,机器学习系统正在使一种新的大脑建模方法变得可行。这涉及在连接体和其他数据上训练人工智能程序,以重现您期望在生物系统中发现的神经活动。

计算神经科学家和其他科学家需要解决一些挑战,才能开始使用机器学习来构建整个大脑的模拟。但是,将来自传统大脑建模技术的信息与在不同数据集上训练的机器学习系统相结合的混合方法可以使整个工作更加严格和信息量更大。

大脑图谱

绘制大脑图谱的探索始于近半个世纪前,在蛔虫秀丽隐杆线虫中进行了15年的艰苦努力。过去二十年中,自动组织切片和成像的发展使研究人员更容易获得解剖数据,而计算和自动图像分析的进步已经改变了这些数据集的分析。

现在已经获得整个大脑连接组的物种有很多。线虫、果蝇、部分小鼠和更小部分人脑(分别为千分之一和百万分之一)。

迄今为止制作的解剖图有很大的漏洞。成像方法还不能与化学突触一起大规模地绘制电连接。研究人员主要关注神经元,尽管为神经元提供支持的非神经元神经胶质细胞似乎在通过神经系统的信息流中起着至关重要的作用。关于哪些基因被表达,以及哪些蛋白质存在于被映射的神经元和其他细胞中,还有很多未知数。

尽管如此,这样的图已经带来了洞察力。例如,黑腹果蝇连接组学使研究人员能够确定负责攻击等行为的神经回路机制;脑图谱还揭示了果蝇负责计算位置信息的回路,这些回路知道它们在哪里以及它们如何从一个地方到达另一个地方。在斑马鱼(Danio rerio)幼虫中,连接组学有助于揭示气味分类控制眼球位置和运动10和导航背后的突触回路工作原理

可能最终导致整个小鼠大脑连接组的努力正在进行中 - 尽管使用目前的方法,这可能需要十年或更长时间。小鼠的大脑几乎是黑腹果蝇大脑的1000倍,后者只有15万个神经元组成。

除了连接组学的所有这些进展外,研究人员一直在使用单细胞和空间转录组学以越来越高的准确性和特异性捕获基因表达模式。各种技术还允许研究人员一次数小时记录脊椎动物整个大脑的神经活动。就斑马鱼幼虫的大脑而言,这意味着在近10万个神经元上进行记录。这些技术包括具有荧光特性的蛋白质,这些蛋白质会随着电压或钙水平的变化而变化,以及可以在单个细胞分辨率下对活体大脑进行3D成像的显微镜技术。以这种方式进行的神经活动记录提供的图片不如电生理学记录准确,但比功能性磁共振成像等非侵入性方法要好得多。

数学和物理

在尝试模拟大脑活动模式时,科学家们主要使用基于物理学的方法。这需要使用真实神经元行为或真实神经系统部分行为的数学描述来生成神经系统或神经系统部分的模拟。它还需要对电路的各个方面(例如网络连接)做出明智的猜测,这些方面尚未通过观察得到验证。

在某些情况下,猜测是广泛的。但在另一些情况下,单细胞和单个突触分辨率的解剖图帮助研究人员反驳并提出假设4.

神经科学家一直在完善使黑腹果蝇成为可能的电路的理论描述。黑腹果蝇计算运动大约七十年。自2013年完工以来,运动检测电路连接组,以及随后更大的苍蝇连接组,提供了一个详细的电路图,该图支持了一些关于电路如何工作而不是其他电路的假设。

然而,从真实神经网络收集的数据也凸显了解剖学驱动方法的局限性。

例如,在1990年代完成的神经回路模型包含对大约30个神经元的连通性和生理学的详细分析,这些神经元包括螃蟹(Cancer borealis)口胃神经节 - 一种控制动物胃部运动的结构14.通过测量神经元在各种情况下的活动,研究人员发现,即使对于相对较小的神经元集合,看似微妙的变化,例如引入神经调节剂,一种改变神经元和突触特性的物质,完全改变了回路的行为。这表明,即使使用连接组和其他丰富的数据集来指导和约束有关神经回路的假设,今天的数据也可能不够详细,建模者无法捕捉到生物系统中正在发生的事情。

在这个领域,机器学习可以提供一条前进的道路。

在连接组学和其他数据的指导下,可以优化数千甚至数十亿个参数,机器学习模型可以被训练以产生与真实神经网络行为一致的神经网络行为——使用细胞分辨率功能记录进行测量。

这种机器学习模型可以结合来自传统大脑建模技术的信息,例如霍奇金-赫胥黎模型,该模型描述了神经元中的动作电位(跨膜电压的变化)是如何启动和传播的,并使用连接图、功能活动记录或为整个大脑获得的其他数据集来优化参数。或者,机器学习模型可以包含“黑匣子”架构,这些架构几乎不包含明确指定的生物学知识,但包含数十亿或数千亿个参数,所有这些都经过经验优化。

例如,研究人员可以通过将他们对系统神经活动的预测与实际生物系统的记录进行比较来评估这些模型。至关重要的是,当机器学习程序获得未经训练的数据时,他们将评估模型的预测如何比较——这是评估机器学习系统的标准做法。

这种方法将使包含数千个或更多神经元的大脑建模更加严格。例如,研究人员将能够评估更易于计算的简单模型是否比提供更详细生物物理信息的更复杂的模型在模拟神经网络方面做得更好,反之亦然。

机器学习已经以这种方式被利用,以提高对其他极其复杂的系统的理解。例如,自 1950 年代以来,天气预报系统通常依赖于精心构建的气象现象数学模型,而现代系统则由数百名研究人员对此类模型进行迭代改进。然而,在过去五年左右的时间里,研究人员已经开发了几种使用机器学习的天气预报系统。例如,这些包含较少的假设,例如,压力梯度如何驱动风速的变化,以及这反过来又如何使水分通过大气。取而代之的是,数以百万计的参数通过机器学习进行优化,以产生与过去天气模式数据库一致的模拟天气行为16.

这种做事方式确实带来了一些挑战。即使模型做出了准确的预测,也很难解释它是如何做到的。此外,模型通常无法对未包含在训练数据中的场景进行预测。经过训练可以预测未来几天的天气模型很难将预测预测到未来几周或几个月。但在某些情况下,对于未来几个小时的降雨量预测,机器学习方法已经优于经典方法17.机器学习模型也提供了实际优势;它们使用更简单的底层代码,气象学专业知识较少的科学家可以使用它们。

一方面,对于大脑建模,这种方法可以帮助填补当前数据集中的一些空白,并减少对单个生物成分(如单个神经元)进行更详细测量的需求。另一方面,随着更全面的数据集的出现,将数据合并到模型中将变得简单明了。

从大处着眼

为了实现这一想法,需要解决几个挑战。

机器学习程序的好坏取决于用于训练和评估它们的数据。因此,神经科学家应该致力于从标本的整个大脑中获取数据集,甚至从整个身体获取数据集,如果这变得更加可行的话。虽然从大脑的某些部分收集数据更容易,但如果系统的许多部分都不存在,那么使用机器学习对高度互连的系统(如神经网络)进行建模的可能性要小得多。

研究人员还应该努力从同一标本的整个大脑中获得神经连接和功能记录的解剖图(也许在未来可以获得基因表达图谱)。目前,任何一个群体都倾向于只关注获得其中之一,而不是同时获得两者。

只有302个神经元,秀丽隐杆线虫神经系统可能已经足够硬连线,研究人员能够假设从一个标本获得的连接图对于任何其他标本都是相同的 - 尽管一些研究表明并非如此18.但是对于较大的神经系统,例如黑腹果蝇和斑马鱼幼虫的神经系统,标本之间的连接组变异性足够显着,因此应该根据从同一标本获得的结构和功能数据来训练大脑模型。

目前,这只能在两种常见的模式生物中实现。 秀丽隐杆线虫和斑马鱼幼虫的身体是透明的,这意味着研究人员可以在生物体的整个大脑中进行功能记录,并将活动精确定位到单个神经元。在进行此类记录后,可以立即杀死动物,将其嵌入树脂中并切片,并绘制神经连接的解剖学测量值。然而,在未来,研究人员可以扩展这种组合数据采集的生物体集,例如,通过开发新的非侵入性方法来以高分辨率记录神经活动,也许使用超声波。

在同一样本中获得这样的多模态数据集将需要研究人员之间的广泛合作,对大团队科学的投资以及增加资助机构对更全面努力的支持19.但这种方法也有先例,例如美国情报高级研究项目活动的MICrONS项目,该项目在2016年至2021年期间获得了一立方毫米小鼠大脑的功能和解剖数据。

除了获取这些数据外,神经科学家还需要就关键的建模目标和衡量进展的定量指标达成一致。模型是否应该根据过去的状态或整个大脑来预测单个神经元的行为?单个神经元的活动应该是关键指标,还是应该是数十万个活跃神经元的百分比?同样,什么构成了生物系统中神经活动的准确再现?正式的、商定的基准对于比较建模方法和跟踪长期进展至关重要。

最后,为了向包括计算神经科学家和机器学习专家在内的不同社区开放大脑建模挑战,研究人员需要向更广泛的科学界阐明哪些建模任务是最高优先级的,以及应该使用哪些指标来评估模型的性能。WeatherBench 是一个在线平台,它提供了一个用于评估和比较天气预报模型的框架,它提供了一个有用的模板16.

概括复杂性

有些人会质疑——这是正确的——机器学习大脑建模方法是否在科学上有用。试图理解大脑如何工作的问题,可以简单地换成试图理解大型人工网络如何工作的问题吗?

然而,在神经科学的一个分支中使用类似的方法,即确定大脑如何处理和编码感官刺激(例如,视觉和嗅觉)是令人鼓舞的。研究人员越来越多地使用经典建模的神经网络,其中指定了一些生物学细节,并结合机器学习系统。后者在海量视觉或音频数据集上进行训练,以再现神经系统的视觉或听觉能力,例如图像识别。由此产生的网络与它们的生物对应物表现出惊人的相似性,但比真正的神经网络更容易分析和查询。

就目前而言,也许只要问一问当前大脑图谱和其他工作的数据是否可以训练机器学习模型来重现与生物系统中看到的相对应的神经活动就足够了。在这里,即使是失败也会很有趣——这是一个信号,表明测绘工作必须更加深入。




https://blog.sciencenet.cn/blog-41174-1408942.html

上一篇:猪到人的心脏移植为更广泛试验铺平道路【里程碑】
下一篇:线粒体跨细胞转移和线粒体治疗学
收藏 IP: 117.135.13.*| 热度|

3 杨正瓴 冯圣中 guest29356032

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 15:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部