事实如此浪漫

一千年后你能读到这篇文章吗?

如果你问安东尼·维纳,数字记录,尤其是互联网上的数字记录,似乎难以摆脱。当图片或文档缩减为一系列1和0时,它将变得可传输、可复制、可下载和可存储。你不能烧掉数字书籍,云计算这样的想法可以在多个地方备份数据,确保即使是意外火灾也不会烧掉你的论文或婚礼照片。

数据的数字化为它提供了免受物理灾难的保护,但就目前而言,它远不是永恒的。问题不在于数据本身可能丢失,而在于无法读取数据。

例如,尝试在WindowsVista、7或8中打开WordPerfect文档,您会很快发现Microsoft已停止支持该软件。同样,苹果也没有支持克拉里斯沃克斯从2004年开始,在13年后抛弃了旧的办公套件,2013年末发布的PlayStation 4无法读取1996年的原始Crash Bandicoot cd真的老实说,这很令人沮丧,因为这是一场伟大的比赛)。上帝禁止你从软盘上恢复数据。互联网之父、谷歌“首席互联网传播者”温特·瑟夫(Vint Cerf)说:“保存比特并不难。问题是,‘比特意味着什么?’”

Crash Bandicoot,一个长着尖头的流氓,与电影明星同名一系列流行游戏,可能需要一些帮助才能生存到遥远的未来。 通过Flickr的游戏玩家

从最初的软盘发明到现在只有大约50年的时间,许多现代笔记本电脑已经放弃了它的继任者,即CD驱动器。突然间,纸质文档的寿命开始变得有希望了。“如果我们在未来1000年或3000年思考,我们必须问自己,‘我们如何保存我们所需要的所有比特,以正确解读我们创造的数字对象?“瑟夫说。“如果我们找不到解决这个问题的方法,我们的21世纪将是一个信息黑洞。”

“信息时代”的居民不会留下任何有用的信息,这可能是一件既有趣(又悲哀)又具有讽刺意味的事情,但至少有一个人决心确保这种情况不会发生。在卡内基梅隆大学(Carnegie Mellon),马哈德夫·萨蒂亚纳拉亚南(Mahadev Satyanarayanan),或者几乎所有人都叫他萨蒂亚(Satya),已经开始开发一个平台,用于编目和记录我们创造的数字物体,以及至关重要的是,对软件和硬件的描述,这些描述让这些物体可以被解读。被称为橄榄存档,Satya的平台旨在解决需要保存的最棘手的数据类型之一:可执行文件。

归档静态数据(如图片或文本文档)是一回事,但当今许多重要的数字信息都是动态的。视频游戏、交互式数据库和应用软件更难保存,因为它们不仅依赖于计算机能够读取位和字节,还要求未来的硬件能够输入命令和解释程序中的更改。当玩家按下PlayStation控制器上的“方形”按钮时,Crash Bandicoot会旋转,但即使游戏中的所有代码都保存在存档中,计算机也没有“方形”按钮。随着GPU、CPU、主板和其他硬件的不断发展,同样的问题将困扰未来的计算机。

一个解决方案是保留每一件硬件的一个版本;虽然这可能有些过分,但它可以让我们重新创建我们希望恢复的任何数据的生态系统。橄榄档案馆的目标是完成同样的保存工作,但它的方法要优雅得多,不需要堆满古董硬件的仓库,而这些古董硬件可能会在几十年内损坏。Satya希望创建“虚拟机”:硬件的地图或描述,允许使用软件重新创建旧程序。用当前软件模拟过去的硬件并不是一个新想法(事实上,任何拥有安卓智能手机的人都可以从互联网下载PlayStation模拟器,并在今天运行Crash Bandicoot),但构建一个能够打开和执行任何数字对象的存储库的想法是一项巨大的任务。

Cerf说:“为了正确解释我们创造的数字对象,我们如何保存我们需要的所有数据位?”。“如果我们不能找到解决这个问题的办法,我们的21世纪将是一个信息黑洞。”

那么,需要什么来确保这样一篇文章能够延续到下一个千年呢?Satya首先建议将其保存为PDF,以便于存储。PDF需要打开Adobe Reader,因此未来的公民将需要访问它保存在其中的相同版本的程序(我的例子是10.1.12)。不过,Adobe Reader只能在操作系统的上下文中运行,因此需要在我们的虚拟机中包含与我们的PDF Reader兼容的Windows(或MacOS或Linux)版本。最后,操作系统运行在某种硬件上。当我输入这些单词时,它们出现在联想ThinkPad Y470的屏幕上。虚拟机可以模拟我的特定计算机中的硬件,但任何能够运行与Adobe Reader兼容的Windows版本的PC都可以完成这项工作。数字文件中的每一位数据都生活在由软件、操作系统和硬件组成的生态系统中。Satya的目标是创建这些组件的存档,这些组件可以根据需要进行组装,上传到服务器,并由用户通过互联网访问。“文件格式不是孤立地创建的,它们与使用这些格式的软件密切相关,”他说。Oliver在您的Internet浏览器中的启动方式与YouTube视频的启动方式类似,不同之处在于通过Oliver运行的软件模拟整个计算机环境,因此您可以像实际使用旧硬件和软件一样单击、键入和进行更改。

自2013年开始认真工作以来,团队已经存档了以下内容:Windows3.11,几十年的老游戏,比如Oregon Trail和DOOM,甚至TurboTax 1997,以防你在那一年的报税表上迟到18年。据Satya说,Olive归档数字对象的潜力几乎是无限的;该系统应该能够跟上计算领域的巨大变化,比如量子计算机的发展,甚至二进制的拒绝。要运行一些过时的计算机程序,未来机器只需模拟硬件,当程序添加到归档文件中时,最初模拟的是旧程序。

目前,Intel的x86兼容硬件主宰世界。地球上几乎每台个人计算机都使用某种x86体系结构的变体,这是一组指令,控制着几乎所有基本的硬件行为,从读取源代码到分配内存。出于必要,英特尔已使其体系结构完全向后兼容。Satya认为,由于x86的无处不在,它在不久的将来将继续发挥重要作用。然而,一千年后,一切似乎都有可能。但是橄榄应该能够通过添加新的模拟层来继续存档。“我们相信,无论什么能取代英特尔x86,都有很多为它编写的遗留软件,为x86编写模拟器是迟早会发生的事情。如果没有其他人,维护橄榄“我能做到,”他说。“只要有仿真,就可以分层。在公元5000年,如果我们试图运行2015年编写的东西,我可能[使用]五层仿真。”

所有的计算能力…到目前为止在未来…只是作为一个穿着牛仔裤短裤的橙色有袋动物在丛林中奔跑。


*更正:文章最初说PlayStation 4是在2015年底推出的,但现在还没有出现。


大卫·舒尔茨是一名自由撰稿人,报道各种生物和科学。他微博@dshultz14

46条评论-加入讨论