Y你以前听过这样的论点:基因是进化中永久的贵族,在多肉的宿主来来去去的时候照顾自己。这是理查德·道金斯的一本书的主题,去年,这本书被命名为史上最具影响力的科学书籍自私的基因.
但实际上,我们人类产生的可操作信息远比我们所有组合的遗传物质中编码的信息要多得多,而且我们将大部分信息带到了未来。我们生物自我之外的数据称之为数据组,实际上可以代表复杂生命的更宏大的支架。数据组可能为我们称之为智力的狡猾特征提供一个普遍可识别的特征,它甚至可能教会我们关于自己的一两件事。
这也是一个相当大的精力负担。这种负担让我们不禁要问,我们制造和保护数据组是否只是为了我们自己的利益,还是像自私的基因一样,因为数据让我们这么做,因为它是有保证的它的传播到未来。
以威廉·莎士比亚为例。
s哈克斯佩尔于1616年4月23日去世,两天后,他的遗体被安葬在埃文河畔斯特拉特福德的圣三一教堂。他现在著名的墓志铭对任何敢于“移动我的骨头”的人都是一个诅咒。据我们所知,在过去的400年里,没有人冒着招致威尔不死之怒的风险。
但他肯定是活在了坟墓之外。在他去世的时候,莎士比亚总共写了37部戏剧和其他作品。这37部剧本共包含835997个单词。在他肉体生活之后的几个世纪里,估计有20亿到40亿份他的剧本和作品的实物拷贝被制作出来。所有这些复制品都是由数千亿张纸组成的,这些纸充当了超过1万亿份墨水丰富的信件的容器。
自从我们第一次口头交流一个好故事以来,我们一直在输出持续的数据。
随着时间的推移,这些数以十亿计的书已经被物理地举起和运输,放下和捡起,用手拿着,或者被吊到书架上。每一个单独的运动都会消耗少量的能量,可能只有几焦耳。但这几个世纪以来一直在增加。有可能人类举起和放下莎士比亚作品的简单动作消耗了超过4万亿焦耳的能量。这相当于燃烧几十万公斤的煤。
每当一个人阅读了835997个单词中的一些单词并让他们的神经元放电时,额外的能量就会被利用。或者向全神贯注的观众讲述这些故事,或者花费数千万美元制作一部电影,或者打开电视观看其中一部戏剧的演出,或者驱车前往莎士比亚艺术节。或者为此买了一尊俗气的“不朽吟游诗人”半身像,并把它拖到壁炉台上。再加上纸张、书籍及其运输的能源消耗,数量只会不断增长。
我们可能无法完全衡量威廉·莎士比亚在不知不觉中给人类带来的能量负担,但它是巨大的。当然,我们可以很容易地原谅他。他写了一些好东西。但也有一种感觉,莎士比亚的数据已经成为数据体的一部分,传播到未来,迫使我们所有人支持它,就像现在这句话中发生的一样。
s平心而论,hakespeare在浩瀚的数据海洋中只贡献了一滴水,这些数据既空灵又对我们产生了极其切实的影响。这是我们的荣耀和磨石智人.
自从我们第一次口头交流一个好故事和我们第一次在岩壁上实验手印以来,我们一直在输出持续的数据。这两种东西都没有明确地编码在我们的DNA中,但它们很容易比创造它们的人活得更长。事实上,这样的数据比一代又一代的人类都要长寿。
但随着时间的推移,我们的数据生产速度加快了。今天,据一些人说,我们这个物种每天产生大约25亿字节的数据。每一次行星自转超过十亿字节。而这一产出率仍在增长。虽然从谷歌搜索到空中交通管制,很多数据都是短暂记录的混合体,但越来越多的数据最终会留在环境中。宠物视频、GIF、政治诽谤、巨魔回应,以及医疗记录、科学数据、商业文档、电子邮件、推特、相册,所有这些都会在硬盘上掺杂硅或磁点,形成半永久性的电脉冲。
从有人的手在土壤中寻找稀土元素的那一刻起,到维持这一切的电力,这种数据的生产和存储需要大量的能量。有一个原因是像苹果这样的大公司建立了自己的数据服务器农场,并寻找优化这些空调、电子推动工厂所需的发电的方法,无论是在内华达州建立大规模太阳能农场还是在俄勒冈州利用水电。
即使是莎士比亚的传统纸张,也仍然是一个能源饥渴的野兽。2006年,据估计,美国的纸张产量减少了约2400万亿BTU(约400万兆焦耳),生产了9950万吨纸浆和纸制品。这相当于每克最终材料在打印任何数据之前所消耗的约28000焦耳能量。或者换句话说,这相当于每页纸燃烧大约5克优质煤。
我们为什么要这样做?为什么我们要花费越来越多的精力来维护我们和我们的机器生成的数据?这种行为可能远远超出我们最初的想象。
我们的数据集对我们人类来说既是一种优势,也是一种负担。
从表面上看,很明显,我们携带如此多数据的能力是我们成功在地球上传播的关键部分。我们可以以一种其他物种似乎无法做到的方式,不断地建立我们的知识和经验。我们的数据组为我们提供了巨大的进化优势。
但它显然不是免费的。我们可能被困在一个更大的达尔文现实中,即我们现在实际上是我们自己的数据体的支持细胞器。
这是一个令人不安的自我审视框架。但它在自然界的其他地方也有相似之处。我们的微生物群,由数十万亿个单细胞生物组成,与其说是由我们作为个体而存在,不如说是由我们一代又一代人通过时间携带这些生物信息而存在。然而,我们也可以将这一点扭转过来,将这种情况概念化为一种微生物群落,它承载着我们穿越时空。微生物群存在于我们体内,因为我们是一个良好的环境。但这是一种共生关系。微生物必须以某种方式来做事情,必须努力支持它们的人类运输系统。对于微生物来说,人类既是一种能量负担,也是一种进化优势。同样,我们的数据组对我们人类来说既是一种优势,也是一种负担。
问题是,我们的共生关系是否仍然健康?今天的dataome的能量负担似乎达到了我们物种历史上的最高水平。这并不一定意味着我们正在经历一个相应的巨大好处。我们最好检查数据组是否存在一个最佳状态,即它赋予其物种的进化优势和它所代表的负担之间的平衡。
看似非常低效的数据激增(我可能会发牢骚地称之为猫咪图片和自拍)实际上可能是我们的数据组出现令人担忧的功能失调的迹象。换句话说,低值数据的无差别指数增长表明数据可能会患癌症。在这种情况下,我们最好把它作为一个人类健康问题来认真对待,特别是如果治疗能减轻我们的全球能源负担,从而减少我们对地球环境的影响。
提高我们数据的效用,清除那些浪费能源的垃圾可能不受欢迎,但可能会受到激励。要么通过类似于将家用太阳能反馈到电网的数据信用计划,要么将数据丢失作为一种积极的特征。你可以称之为Snapchat的方式。
在这种情况下,人类dataome共生可能成为共生关系本质上唯一的例子有意识地由一方管理。它的长期进化稳健性是什么还很难说。
但更加乐观;如果数据组确实是我们进化道路中不可分割的一部分,那么也许通过挖掘它,我们不仅可以了解我们自己和我们的健康,还可以了解生命和智力的本质。我们究竟如何审问数据组是一个悬而未决的问题。其中可能存在我们根本没有认识到的紧急结构,我们需要制定措施和量度来适当地检查它。网络理论或计算基因组学等现有工具可能会有所帮助。
这种分析的潜在收益可能是巨大的。如果数据部分是真实存在的,那么它代表了我们拼图中缺失的一块;一个有知觉物种的功能和进化。我们至少得看一看。正如莎士比亚所说:“我们生活的网是由善恶交织而成的。”
Caleb Scharf是一位天体物理学家,纽约哥伦比亚大学天体生物学主任,yhousenyc.org的创始人。yhousenyc.org是一家研究人类和机器意识的机构。他的新书是可缩放的宇宙:宇宙尺度的史诗之旅,从几乎一切到几乎一无所有。