O去年秋天的一个寒冷的夜晚,我在哈佛大学郊外办公室的落地窗外凝视着虚无。当紫红色的太阳落山时,我坐在那里沉思着我关于老鼠大脑的数据集。我想到了波士顿市中心的寒冷无窗房间,那里是哈佛大学高性能计算中心的所在地,计算机服务器保存着我宝贵的48 TB数据。作为我博士学位的一部分,我在这个数据集中记录了13万亿个数字。实验,询问大鼠大脑的视觉部分对运动的反应。
在纸上印刷,数据集将填充1160亿页,双间距。当我最近完成写入数据的故事时,Magnum Opus适合少于两次打印页面。表演实验结果是容易的。我已经花了过去一年的痛苦,观察和提出问题。答案遗漏了没有涉及问题的大块,就像地图离开了一个领土的无关紧要的细节。
但是,尽管我的数据集听起来很庞大,但它只是整个大脑数据集的一小部分。它提出的问题是:当动物看不见东西时,视觉皮层的神经元会做什么?当从大脑其他区域输入到视觉皮层的信息被切断时,会发生什么?相比于神经科学的终极问题:大脑是如何工作的?
科学过程的本质是这样的,研究人员必须挑选小的,尖锐的问题。科学家就像餐馆里的食客:我们想尝遍菜单上的所有食物,但必须做出选择。所以我们选择了我们的领域和子领域,阅读了之前在这个领域做过的数百个实验,设计并执行我们自己的实验,希望这些答案能促进我们的理解。但如果我们不得不问一些小问题,那么我们如何开始理解整体呢?
神经科学家在理解大脑结构和大脑功能方面取得了相当大的进展。我们可以识别对环境做出反应的大脑区域,激活我们的感官,产生运动和情绪。但我们不知道大脑的不同部分是如何相互作用和相互依赖的。我们不了解他们的互动如何影响行为、感知或记忆。技术让我们很容易收集庞大的数据集,但我不确定大脑是否能跟上数据集的大小。
我现在在一条黑暗的道路上,对一个充满大数据和小理解的未来感到不安。
然而,现在正在进行一些严重的努力来映射大脑。一种致电Connectomics的一种方法,努力绘制大脑中神经元中的整体连接。原则上,完整的连接器将包含提供所需的所有信息,以便为建立对大脑的整体理解来构建整体基础。我们可以看到每个大脑部分是什么,它如何支持整体,以及如何与其他部件和环境互动。我们能够将大脑放在任何假设的情况下,并具有如何做出反应的良好感。
我们如何开始理解产生我们思想的整个器官,这个问题已经困扰了我一段时间。像大多数神经科学家一样,我不得不培养两种相互冲突的想法:努力理解大脑,同时知道这可能是一项不可能完成的任务。我很好奇其他人是如何容忍这种双重想法的,于是我找到了杰夫•利希特曼(Jeff Lichtman),他是连接组学领域的领军人物,也是哈佛大学(Harvard)的分子和细胞生物学教授。
利希特曼的实验室正好在我的楼下大厅,所以最近的一个下午,我漫步到他的办公室,问他有关连接组学的新生领域,以及他是否认为我们永远都不会对大脑有一个全面的了解。他的回答——“不”——并不令人安心,但我们的谈话是一个启示,揭示了困扰我的问题。我如何理解庞大的数据量?科学从哪里结束,个人解释从哪里开始?人类甚至有能力将今天的海量信息编织成一幅完整的画面吗?我现在正走在一条黑暗的道路上,质疑人类理解的极限,对充满大数据和小理解的未来感到不安。
lichtman喜欢先开枪,然后再问问题。这位68岁的神经科学家选择的武器是一台61束电子显微镜,利希特曼的团队用它来观察脑组织中最细微的细节。神经元在大脑中的排列方式会使罐装沙丁鱼看起来像是具有高度进化的个人空间感。为了理解这些图像,进而理解大脑在做什么,神经元的各个部分必须用三维标注,结果就是一张接线图。在整个大脑的范围内完成,这一努力构成了一个完整的接线图或连接体。
为了捕捉这张图,利希特曼使用了一台只能被描述为精美熟食切片机的机器。该机器将脑组织切成30纳米厚的切片,然后粘贴到胶带传送带上。磁带放在硅片上,进入利希特曼的电子显微镜,在那里数十亿个电子轰击大脑切片,产生的图像显示了神经元、轴突、树突以及它们用来交换信息的突触的纳米级特征。特技彩色图像是一幅美丽的景象,唤起了一种奇妙的想法:大脑如何创造记忆、思想、感知、感觉的奥秘意识本身必须隐藏在这迷宫般的神经联系中。
一个完整的人类连接体将是一项巨大的技术成就。一个完整的老鼠大脑接线图需要2艾字节。那是20亿兆字节;相比之下,所有写过的书的数据占用估计不到100tb,也就是老鼠大脑的0.005%。但李奇曼并不气馁。他决心要绘制整个大脑的地图,那太大的埃克字节大小的存储就见鬼去吧。
Lichtman的办公室是一个宽敞的地方,俯瞰着落地窗户,俯瞰着树木走道和一个旧的圆形建筑,在神经科学的日子里,甚至存在于作为一个领域的日子,曾经是一个回旋加速。他穿着深深的毛衣,与他的银发和橄榄皮肤呈现。当我询问完成的Connectome是否会充分了解大脑时,他并没有暂停答案。我感觉到他自己想到了他自己的这个问题。
李奇曼说:“我认为‘理解’这个词必须经过一个演变。”“当我们说‘我明白一些事情’时,大多数人都知道自己在说什么。这对我们来说是有意义的。我们可以把这个想法记在脑子里。我们可以用语言来解释。但如果我问,‘你了解纽约吗?’你可能会回答:‘你是什么意思?这一切都很复杂。如果你无法理解纽约,并不是因为你无法获取数据。只是同时发生了很多事。这就是人类的大脑。它是数以百万计的事情同时发生在不同类型的细胞中,神经调节器,遗传成分,来自外部的东西。当你突然说‘我现在理解了大脑’,就像你不会说‘我现在理解了纽约’一样,这是没有意义的。’”
我们错误地认为没有什么是人类不能理解的,因为我们有无限的智慧。
“但我们了解大脑的特定方面,”我说。“难道我们不能把这些方面放在一起,获得更全面的理解吗?”
“我想我会撤退到另一个滩头,这就是”我们能描述大脑?“”拉希特曼说。“我们有关于我们不知道的大脑的物理性质的各种基本问题。但我们可以学习描述它们。很多人认为'描述'是科学中的佩吉。但这就是哈勃望远镜所做的。这就是基因组学的作用。他们描述了实际存在的东西。然后从中可以生成你的假设。“
“为什么描述对神经科学家来说是一个乏味的概念?”
“生物学家经常被与他们产生共鸣的想法所引诱,”Lichtman说。也就是说,他们试图让世界顺从他们的想法,而不是让世界顺从他们的想法。他说:“从这个世界开始,然后让你的想法与它相一致,实际上,这要容易得多。”与其采用假设检验方法,不如采用描述性方法或假设生成方法。否则我们就只能自讨苦吃了。李奇曼说:“在这个时代,信息的丰富是简单理解的敌人。”
“为何如此?”我问。
“让我这么说吧,”李奇曼说。“语言本身基本上是一个线性过程,一个想法引出下一个想法。但是如果你要描述的事情同时有上百万件事情发生,语言就不是合适的工具了。这就像了解股票市场一样。在股市上赚钱的最好方法可能不是通过理解经济的基本概念。而是通过了解如何利用这些数据来知道买什么和什么时候买。这可能与经济学无关,而是与数据以及如何使用数据有关。”
“也许人类的大脑还没有准备好去了解自己,”我提出。
Lichtman说:“也许这个想法有一些基本的东西:没有机器能产生比它自己更复杂的输出。”“一辆汽车的功能与它的工程技术相比微不足道。人脑所做的事情与它的工程学相比微不足道。这是最大的讽刺。我们错误地认为宇宙中没有什么是人类无法理解的,因为我们有无限的智慧。但如果我问你,你的狗是否能理解一些东西,你会说,‘我的狗的大脑很小。“好吧,你的脑子只大了一点点,”他笑着继续说。“为什么你突然什么都懂了?”
利希特曼被连接体可能实现的结果吓倒了吗?他把自己的努力看作是西西弗吗?
“这就是相反的,”他说。“我想到了这一点,我们将少得多。现在,我们正在研究一种人类大脑的皮质平板,在那里自动识别每个突触,每个神经细胞的每一个连接都是可识别的。太奇妙了。说我理解这将是荒谬的。但这是一个非凡的数据。而且很漂亮。从技术的角度来看,您真的可以看到电池如何连接在一起。我不认为这是可能的。“
利希特曼强调,他的工作不仅仅是对大脑的全面了解。“如果你想知道神经元和行为之间的关系,你必须有接线图,”他说。“病理学也是如此。有许多不治之症,如精神分裂症,没有与大脑相关的生物标志物。它们可能与大脑接线有关,但我们不知道是什么问题。我们没有它们的医学模型。我们没有病理学。因此,除了关于大脑如何工作的基本问题之外在rks和意识方面,我们可以回答这样的问题:精神障碍是从哪里来的?这些人怎么了?为什么他们的大脑工作方式如此不同?这些可能是人类最重要的问题。”
l一天晚上,在经过漫长的一天试图弄清楚我的数据之后,我偶然看到了乔治·路易斯·博尔赫斯的一篇短篇小说,它似乎抓住了大脑映射问题的本质。在名为《论科学的准确性》(On accurate In Science)的故事中,一个名叫苏亚雷斯·米兰达(Suarez Miranda)的人写道,一个古老的帝国通过科学的运用,完善了地图制作的艺术。早期的地图只不过是对他们想要代表的领土的粗糙漫画,而新的地图变得越来越大,在每个版本中填充了越来越多的细节。随着时间的推移,博尔赫斯写道,“制图艺术达到了如此完美的地步,一个省的地图占据了整个城市,而帝国的地图则占据了整个省。”尽管如此,人们还是渴望更多的细节。随着时间的推移,那些不合情理的地图不再令人满意,制图师协会绘制出了一幅帝国地图,它的大小与帝国的大小相当,而且地图与帝国的大小一致。
博尔赫斯的故事让我想起了利希特曼的观点,即大脑可能过于复杂,无法用口语来理解,而描述它可能是一个更好的目标。尽管如此,这个想法还是让我感到不舒服。很像讲故事,甚至是大脑中的信息处理,描述必须省略一些细节。对于传达相关信息的描述,描述者必须知道哪些细节重要,哪些不重要。知道哪些细节是不相关的需要对你描述的东西有一些理解。我的大脑,尽管可能很复杂,是否能够理解老鼠大脑中的两个EB?
博尔赫斯的故事让我想起了一种观点,即大脑可能太复杂,人类无法理解。
人类在这场战斗中有一个批判性武器。机器学习一直是脑部映射的福音,而自我加强关系有望改变整个努力。在过去的十年中,深度学习算法(也称为深度神经网络,或DNN)在过去的允许的机器中,以执行认知任务,一旦考虑到计算机,而且是对象识别,而是文本转录和翻译,或者玩游戏,或者像去或国际象棋一样玩游戏。DNN是数学模型,将近似真神经元的简单功能的链子串联。这些算法直接通过哺乳动物皮质的生理学和解剖学来启发,而是基于20世纪60年代收集的数据是真正的大脑的粗近似。然而,他们已经超越了对机器可以做的事情的期望。
利希特曼绘制人脑地图的秘密是机器智能。利希特曼的团队与谷歌合作,利用深度网络对显微镜采集的数百万张大脑切片图像进行注释。电子显微镜的每次扫描只是一组像素。人眼很容易识别图像中每个斑点的边界(神经元的胞体、轴突或树突,以及大脑中的所有其他部分),并且通过一些努力可以分辨出一个切片中的特定位在下一个切片上出现的位置。这种标记和重建对于理解连接组学中的庞大数据集是必要的,传统上需要大批本科生或公民科学家手动注释所有数据块。经过图像识别培训的DNN现在可以自动完成这项繁重的工作,将一项耗时数月或数年的工作转变为一项只需数小时或数天就能完成的工作。最近,谷歌确认了人类大脑皮层切片中的每一个神经元、轴突、树突、树突棘和每一个突触。“真是难以置信,”利希特曼说。
科学家们仍然需要了解这些细微的解剖学特征和神经元的动态活动特征之间的关系——神经元产生的电活动模式——这是连接体数据所缺乏的。在这一点上,连接组学受到了相当大的批评,主要是通过蠕虫的例子:神经科学家已经有了蠕虫的完整接线图秀丽隐杆线虫已经有几十年的历史了,但仍不能完全理解300个神经元的生物;它的大脑连接如何与它的行为相关联仍然是一个活跃的研究领域。
尽管如此,在生物学中,结构和功能是密切相关的,所以有理由期待有一天神经科学家会知道特定的神经元形态是如何影响活动的。不难想象,一个映射的大脑可以在某个地方的大型服务器上启动,创建一个类似于人类思维的模拟。下一个飞跃构成了反乌托邦,我们通过数字化保存我们的思想而获得永生,或者机器利用我们的大脑线路制造超级智能机器,消灭人类。李奇曼并没有考虑科幻小说中那些遥远的想法,但他承认,拥有与人类大脑相同接线图的网络将是可怕的。“我们不会理解它是如何工作的,就像我们不会理解深度学习是如何工作一样,”他说。“现在,突然之间,我们有了不再需要我们的机器。”
Y然而,一个熟练的深度神经网络仍然不能让我们对人类大脑有一个全面的了解。这一点在去年的计算与系统神经科学会议上让我明白了,这是一场神经科学领域的名人会议,在葡萄牙里斯本城外举行。在一家酒店的舞厅里,我听了40多岁的阿拉什·阿夫拉兹(Arash Afraz)的演讲。阿夫拉兹是马里兰州贝塞斯达(Bethesda)国家心理健康研究所(National Institute of Mental Health)的神经学家。他表示,神经元神经网络中的模型神经元之于真实神经元,就像简笔画之于人类,而且它们之间的连接方式也同样粗略。
Afraz很短,有一个黑色马蹄胡须和秃顶圆顶部分地覆盖着一块薄薄的马尾辫,让人想起马修麦卡金真正的侦探.当大西洋的巨浪撞击着下面的码头时,阿夫拉兹问观众是否还记得René马格利特的塞西不是烟斗这幅画描绘了一根管子,下面写着标题。Afraz指出,DNN中的模型神经元不是真实的神经元,它们之间的联系也不是真实的。他展示了一张通过猴子实验发现的大脑区域间相互联系的经典图表——一堆盒子,名字像V1、V2、LIP、MT、HC,每一个都有不同的颜色,黑线似乎随机地以比可能更多的组合连接着盒子。与真实大脑中令人眼花缭乱的连接相反,DNN通常以一条简单的链连接不同的大脑区域,从一个“层”到下一个“层”。“试着向一位严谨的解剖学家解释一下,”阿夫拉兹一边说,一边闪现着一只震惊的猩猩宝宝兼解剖学家的模因。“我试过了,相信我,”他说。
一个与人类大脑有着相同图表的网络将是可怕的。我们将拥有不再需要我们的机器。
我也很好奇,为什么dnn与真正的大脑相比如此简单。难道我们不能通过让他们更忠实于真实大脑的结构来提高他们的表现吗?为了更好地理解这一点,我打电话给牛津大学的计算神经科学家安德鲁·萨克斯(Andrew Saxe)。萨克斯同意,这可能是有益的,使我们的模型更真实的现实。“这一直是脑科学的挑战:我们只是不知道细节的重要程度是什么,”他通过Skype告诉我。
我们如何做出这些决定?萨克斯说:“这些判断通常是基于直觉,而我们的直觉可能千差万别。”“许多神经科学家有一种强烈的直觉,那就是单个神经元是极其复杂的:它们有所有这些反向传播的动作电位,它们有独立的树突间隔,它们有所有这些不同的通道。所以单个神经元本身可能就是一个网络。把它画成一个校正过的线性单位(dnn中神经元的简单数学模型),显然是遗漏了太多东西。
随着2020年的到来,我思考了很多我从Lichtman、Afraz和Saxe身上学到的东西,以及神经科学的圣杯:理解大脑。我发现自己重新回到了我的本科时代,那时我把科学作为唯一的方法来了解那是真正客观的(我也曾经认为科学家是高度理性的,对真理最感兴趣的公平的人——所以也许这只是表明我是多么天真)。
我现在很清楚,虽然科学研究的是事实,但这项崇高努力的一个关键部分是理解事实。甚至在实验开始之前,真相就通过解释性的镜头被筛选出来了。人类,带着我们所有的怪癖和偏见,首先选择进行什么实验,以及如何进行。当科学家们必须弄清楚这些数据的含义时,在收集数据之后,解释仍在继续。所以,是的,科学收集了关于世界的事实,但描述世界并试图理解世界的是人类。所有这些过程都需要通过我们时代的语言和文化塑造的个人筛子过滤原始数据。
看来,Lichtman的两艾萨克字节的大脑切片,甚至是我的48tb大鼠大脑数据,都不可能适用于任何一个人的大脑。或者,至少没有人的大脑会将所有这些数据整合成人类大脑工作方式的全景图。当我坐在办公桌前,看着落日将万里无云的天空染成浅红色时,我的脑海里浮现出一幅彩色的未来图景。我们制造的机器——那些按照皮层结构设计的机器——无法捕捉到人类大脑的本质。但他们在大型数据集中找到模式并不困难。也许有一天,随着他们在更多的皮层解剖结构上变得更强大,他们将能够向我们解释那些模式,解决大脑相互连接的谜题,创造出一幅我们理解的画面。窗外,麻雀兴奋地叫着,还没准备好收工呢。
Grigori Guitchounts即将为他的博士学位辩护。在神经科学方面。你可以读一些关于他48 TB的这里是老鼠的大脑数据.
导联图:树突(红色)的渲染——神经元的分支过程和接收突触信息的突出棘,以及来自小鼠皮层的饱和重建(多色圆柱体)。由哈佛大学利希特曼实验室提供。