我曾经认识一个科学家,谁在她醒着的时间连续数周的实验室所有的工作。事实上,我知道一些。当一个大发现似乎伸手可及,研究可以成为一个痴迷。试想一下,那么,它一定感觉像失去了比赛,成为第一对舀。几个月或几年的工作会变得多余,还是一文不值。没有用的任何人。
虽然在我从事科学工作的25年里,我从来没有抢先获得过重大发现,但我对这个想法很着迷。因为被别人抢先一步就会打破激发科学家的两股力量:好奇心和自我意识。找到困扰你的问题的答案让你兴奋不已,但与此同时,你又粉碎地意识到你不是那个发现答案的人。
有一个著名的案例,尤其引起了我的想象。这不仅是科学史上最大的独家新闻之一,而且参与其中的科学家也留下了他们反应的证据。我说的是1961年破译DNA语言,即遗传密码。西德尼·布伦纳和弗朗西斯·克里克是20世纪最杰出的遗传学家,他们从1953年到1961年研究这一问题,却被一位鲜为人知的美国生物化学家击破。
我n 2010, archivists released Brenner’s letters and lab notebooks, and discovered some of Crick’s lost papers mixed in. In the papers, and in the scientists’ actions, I swore I could see their reaction to being beaten to an epochal discovery: They were thrilled.
至少看起来是这样。2014年,在布伦纳去世的五年前,我找到了他,问他。
我要找到西德尼·布伦纳并不容易。他在新加坡、冲绳、弗吉尼亚和加利福尼亚都有实验室和办公室。他经常旅行。我在圣地亚哥附近找到一个行政助理她已经两年没见过他了,但她认识一个人。当我终于联系上他时,我很幸运:仅仅一周半之后,我们就都在英国待了一天。
“进来吧!”他说,我弯下腰到他家低矮的门口。布伦纳,88,有浓密的眉毛和圣诞老人知道的笑容。但他可以惊人的坦率著名科学家被他认为是傻瓜。关于一个,他对我说,“我不得不解释他 - 听着,我想,这白痴不理解。”我看得出来,他已经按年龄进行物理放缓,但他头脑灵活。我很高兴我重新阅读了许多他从20世纪50年代和60年代的研究文章,所以我可以试着跟上他。
我们坐在一个小的,明亮的房间与植物拥挤,而他的继子,乔纳森,给我们做午饭。随着分子生物学的创始人之一,布伦纳大概可能变得富有,如果他想。但是,他是众所周知的讲话对科学,不要钱动画音,他的房子是适度的。我觉得吃超大在他的小厨房,盘子和杯子一字排开开架的表,我可以达到从我的座位冰箱。
布伦纳用脚敲着,开始让我回想起编码问题最初是如何让他着迷的。典型的蛋白质是由几百个氨基酸组成的,每个氨基酸像串珠一样连在一起。有20种不同的珠子。一些珠子粘在另一些珠子上,一些粘在水里,这样每一根线就会自然地在水里折叠成一定的形状,形成生命的一个机械部分。有些蛋白质看起来和工作起来像小棒、杠杆、连锁砖和轮子。
布伦纳告诉我,在20世纪50年代早期之前,许多科学家“认为蛋白质是一种模糊的聚合物”,只是重复或序列不明的珠子图案。但到1953年,人们发现蛋白质具有确定的珠子序列,而DNA看起来就像由四个字母组成的密码:a、T、G和c。DNA中的每个基因似乎都是一套指令,用来按照正确的顺序组装蛋白质的珠子。最大的问题是,如何做到这一点?
DNA密码的四个字母显然不能代表每个只有一个氨基酸,因为他们一起可能再编码不超过20种氨基酸中的四个。利用连续两个字母代替-AT,AG,AC,TA,等等,给了只有16种可能的组合,也实在太少了。三封信给了64种组合,超过需要做出20个氨基酸。所以三封信很可能是在DNA最小的字大小,但4个字母是可能的。
看看这将是多么难以解决的代码的蛋白质,胰岛素在这种情况下,即使你知道什么是DNA和蛋白质序列的样子。这里的胰岛素的蛋白质序列的片段:
今天,我们知道胰岛素的DNA序列是这样的:
TTCGTCAACCAGCATCTGTGTGGCTCCCACCTGGTGGAGGCGCTGTACCTGGTGTGCGGAGAGCG……
即使有这方面的知识,这是解码一个巨大的挑战,如何从DNA到蛋白质获得。而在1953年,没有人知道对于这个问题该DNA序列,也没有任何DNA序列。
但这并没有阻止人们试图破解密码。理论物理学家乔治·伽莫夫(George Gamow)提出,每个氨基酸珠可能会紧密地嵌入DNA双螺旋中间的菱形孔中。他认为,DNA可以作为按正确顺序串珠的物理模板,就像一排装不同形状钉子的钉孔。尺寸大概是正确的,恰巧DNA的四个字母定义了20种这样的洞。
但布伦纳和克里克都不认为伽莫夫的代码可行,布伦纳说:“因为首先,他从两方面解读东西。”DNA有一个方向,这是伽莫夫忽略或不理解的。1956年9月,布伦纳发现伽莫夫解是不正确的,他证明伽莫夫解会阻止某些氨基酸相邻。
虽然伽莫夫错了,但他的想法激发了布伦纳和克里克的想象力。伽莫夫像密码学家一样思考,在信息和密码方面,这对当时的大多数生命科学家来说都是新鲜的。数百名研究蛋白质如何形成的生化学家“只对肽键的能量从何而来感兴趣,”布伦纳告诉我。克里克和布伦纳,在伽莫夫的激励下,开始从信息传递的角度思考问题。
这导致了一些聪明的想法。1957年2月,克里克提出,我们体内读取DNA的机制可能知道DNA序列中的每个单词在哪里停止,下一个单词在哪里开始。即使没有空格或标点符号,由3个字母组成的英语句子,比如“Theboyatepieandham”,我们也能理解。这不仅是因为它包含有意义的单词,还因为如果我们从错误的地方开始,一次数三个字母,我们只会发现无意义的单词。克里克提出,在DNA密码中,可能存在特殊的“意义”词,它可以指示蛋白质制造机制的阅读框架。
克里克认为,一些字母组合不可能作为意义词。例如,AAA指定的氨基酸不起作用,因为连续两个这样的词,AAAAAA,将使阅读框不可能被找到。建立一套可能从一个三个字母的单词,T、G和C,克里克的同事计算出不仅AAA 43更多的64可能的三个字母的组合需要排除无意义words-leaving完全20可以三个字母的单词,氨基酸的神奇数字。这是一个很有前途的聪明的解决方案,但后来证明是错误的。我们现在知道,几乎所有的单词都是意义单词,包括由重复字母组成的单词。然而,像这样的提议有助于形成关于代码的明确问题。
1958年,布伦纳想到了一种方法,从理论建议转变为直接对DNA进行修补。想到一位同事的DNA病毒研究结果,他做出了一个有先见性的猜测:一种被称为原黄素的亮黄色染料可能会在DNA中产生单个字母的缺失或添加,而这些可能会使DNA的读取过程超出框架。如果阅读框架很重要,那么产生的蛋白质就没有意义——想想“这个男孩吃了馅饼和火腿”变成了“Heb oya tep iea ndh am”。他和克里克开始在实验室里合作,在培养皿上培育DNA病毒。病毒会感染细菌,当DNA病毒中的蛋白质正常工作时,在细菌的草坪上留下一个典型大小的洞——如果DNA中的变化没有使产生的蛋白质失效的话。布伦纳告诉我:“你可以从这些洞中预测DNA的内部结构,这在我看来一直是非常了不起的。”
Brenner和Crick结合突变体,发现大多数染料诱导突变体都能被某些其他染料诱导突变体所抑制。他们认为染料有时会添加一个字母,有时会删除一个字母,于是开始把这些变化称为“+”和“-”,他们必须随机分配,因为知道哪个是哪个是不可能的。+和-组合常常能使病毒恢复正常,就好像通过在同一序列中获得或丢失一个字母,就能恢复正常的阅读框架,而+和+或-和-组合则永远不能。
结果是有意义的。如果他们的理论是正确的,那么布伦纳和克里克就会最终破译密码。他们无法读取DNA中的单个字母,但经过8年的研究,看起来他们至少可以以可预测的方式改变字母。布伦纳夜以继日地工作。克里克很少做实验,也被实验搞得精疲力尽。有时候,他从实验室经过剑桥回家,只是为了吃饭和睡觉。
然后,惊喜来了。
我1961年8月,5000多名科学家来到莫斯科,在国际生物化学大会上进行为期5天的研究演讲。几天后,克里克的朋友马特·梅瑟尔森(Matt Meselson)告诉他一个消息:基因密码的第一个字被别人破解了。在一个小国会周五下午讨论,在空旷的房间,马歇尔Nirenberg-an美国生物化学家和一个完整的克里克和Brenner-reported,他不知道一个重复字母输入系统进行蛋白质,并产生一种蛋白质的重复单位的氨基酸之一。代码的第一个字就解出来了。很明显,尼伦伯格的方法将很快解决整个代码。
这里就是我喜欢想象自己会做,如果我是克里克。对于有人完全由好奇心驱使,尼伦伯格的结果是了不起的新闻:长期寻找的答案抵达。遗传代码将被破解。但有人与人的本能冲动一个人的名字重视发现,该消息可能再糟糕不过了。许多近十年的价值克里克和布伦纳的编码问题工作的即将被裁减。
我希望我的反应是体面的。我不会向自己解释尼伦伯格的发现,编造理由解释为什么它不令人信服。我就不会回到我的实验室,更快地工作,更快地发表我自己的研究成果。我见过科学家对竞争的反应。我愿意相信我会承认失败并祝贺尼伦伯格。当然,我永远不知道我会做什么。
克里克的反应对我来说是非凡的和模范的。他请求尼伦伯格再做一次演讲,这次是向克里克主持的一个大型研讨会上的1000多人宣布结果。克里克的莫斯科会议手册作为他的决定的一个手工品保存了下来,上面有一个用蓝墨水手写的“尼伦伯格”,还有一个长长的箭头插入了刚刚抢了他的科学家已经排得满满的日程表。当尼伦伯格到达这个阶段时,他报告说,他的实验室刚刚解决了密码中的第二个单词。
克里克后来写在莫斯科的观众已经“电气化”,由尼伦伯格的结果,后来改变了词“吓了一跳”。克里克可能既感到错愕和电气化。但是失望呢?如果克里克感到有些失望,这对梅塞尔森来说并不明显,他形容克里克对这个消息的最初反应是“高兴”。“还能是什么呢?”,”梅瑟尔森在电话中向我解释道,“上帝保佑,我们在有生之年就会知道答案了!”
即使梅塞尔森,谁对DNA有他自己的研究计划,在他的演讲结束了冲动抱住尼伦伯格。我试着想象那个时代在教室拥抱自然的两人在一次会议上,特别是当一个是遗传学家和其他生化学家。玛克辛·辛格,是谁给了他尼伦伯格需要他的实验中的RNA的生物化学,告诉我,“生物化学家和遗传学家都怀疑对方,”东西呼应布伦纳给我的人。
莫斯科会议后不久,克里克和布伦纳作出了重要贡献。那时他们知道,在病毒DNA中插入或删除一两个字母将使产生的蛋白质失效。但现在他们发现,插入或删除三个字母可以让它重新工作,就好像这恢复了正确的阅读框架。结果表明,DNA密码是由三个字母长的单词组成的。这是解决代码的一个重要组成部分,也许和尼伦伯格的发现一样重要。
1962年克里克写给尼伦伯格的信显示,克里克和他的同事在很短的时间内确实尝试过像尼伦伯格那样的实验,这让我怀疑他是否试图为发现代码而获得一些荣誉。但是,这些信件和克里克在1962年BBC广播讲话中的文字都清楚地表达了他的感受——真正取得突破的人应该归功于尼伦伯格的团队。“不,他绝对相信,”当我问克里克是不是出于好心时,布伦纳告诉我。我问布伦纳,当他听到尼伦伯格的结果时,他自己有什么反应。“我们认为这非常重要……非常好,”他说。我认为他是在禁欲,但当我再次追问他,我们进一步交谈时,我开始确信,他也真的对知道答案感到兴奋。
尼伦伯格和他的同事所做的解码工作的重要性再怎么强调也不过分。现代生物学的大多数重大进展都依赖于它。我自己的实验室每天都用它。它之于分子生物学家就像元素周期表之于化学家一样,是未来所有发现的基础。当然,尼伦伯格是在前人的基础上建立起来的,包括布伦纳和克里克在内的许多其他科学家,用其他重要的发现完善了他的成果。但这是具有里程碑意义的科学。被问到答案的人都很兴奋。因为“这样我们就可以处理更重要的问题,”布伦纳解释道。
今天输掉一个结果至少和1961年一样容易。我们尽量不做多余的研究。但许多科学家往往被相同的问题所激励,所以我们有时会发现自己在相互竞争。输掉一场比赛是有后果的。资金可能会受到威胁。职业生涯可能会偏离轨道。我们有时能感受到,对科学家个人有利的事情和对科学进步有利的事情之间的紧张关系。克里克和布伦纳的反应为我树立了榜样,也为所有科学家树立了榜样。正如布伦纳在临别赠言中告诉我的那样:“尽你所能做最好的实验,永远讲真话。”这就是。”
鲍勃·戈尔茨坦(Bob Goldstein)是北卡罗莱纳大学教堂山分校(University of North Carolina at Chapel Hill)生物研究实验室的负责人。
本文最初发表于2015年2月的《信息》杂志。