为了不让朋友圈失传,这群人正在备份整个互联网

国际新闻 浏览(1378)

《银河系漫游指南》的作者道格拉斯亚当斯曾经提出了一个有趣的科学技术三定律:“在我出生时已经存在的任何科学技术都是未来共同世界秩序的一部分;

15岁至35岁之间出生的任何技术都是革命性的产品,将改变世界。

任何在我35岁以后诞生的技术都是违反自然规律的,将会受到上帝的谴责。

这三条定律嘲笑随着年龄的增长,人们对新事物的接受度下降,互联网的快速发展进一步加速了这一过程。

今天,两代人之间的代沟已经从10年缩短到5年甚至更短。95岁以后,他们甚至可能不理解00岁以后的俚语。对于出生在网络时代的年轻人来说,他们长大后不再看同样的电视剧、卡通和小说,所以他们的共同记忆会越来越少。

你明白上面的对话吗?

互联网加速了人与人之间的代沟。另一个影响是互联网的记忆被更快地遗忘。

据统计,网页的平均寿命约为100天(实际感知较短)。由于天涯和网易博客的关闭,80后和90后的年轻人随时可能消失。没有人期望流行的社交平台会见证你度过这个世纪。

“互联网之父”温顿瑟夫担心“21世纪将成为信息黑洞”正在成为现实。与此同时,也有一群像西西弗斯这样的网民在互联网的角落里打捞碎片,与互联网的灭亡作斗争。

生活在互联网侏罗纪时期的第一代网民

最近,一个有趣的帖子出现在外国论坛红迪网上,要求一些“老年网民”告诉今天的年轻人,如果他们真的生活在那个时代,他们会遇到什么挑战。

事实上,网络1.0时代还不到30年,但已经是互联网的侏罗纪时代。在网页的“只读”时代,人们无法在互联网上记录自己的状态,所以要了解早期网民的生活状态只能依靠这些“互联网活化石”。

如果你不相信我,看看红迪帖子上的一些流行答案。如果你有共鸣,你也不能年轻。

你一定不知道拨号上网有多痛苦!除了忍受烦人的噪音,你还得等8分钟才能打开一个又一个网页。如果你的家人在中间拿起电话,前面的等待将是徒劳的。

当第一代互联网用户拨号上网时,英美烟草还没有上市,也没有什么网站可供浏览。在线聊天室也只有两种功能:群聊和单聊。

至于网上购物、音乐和视频流媒体服务,当然是不可能的,所以当时人们的生活状况是这样的:

如果一件产品没有出现在你社区附近的连锁店货架上,你不仅买不到,甚至不知道它的存在。人们讨厌商业广告,但这几乎是大多数人理解新产品的唯一方式。

当你在收音机里听到一首最喜欢的歌时,你最好希望DJ会告诉你这首歌的名字,否则你可能永远不知道这首歌的名字。

如果你在电视上看到一部即将上映的电影,你只能在进入电影院时看到电影的预告片。

然而,这也意味着如果你想偷一首歌或一部电影,你必须冒入店行窃的风险,而不是移动鼠标。

记得你买的第一盘磁带吗?

这些老网民的话语拼凑了这一代年轻人在那个时代互联网生活中的印象,而以怀旧为主题的社交账户如

千禧机器人在中国如雨后春笋般涌现。

正如该报道的头条所说,“我想从20世纪和21世纪的裂缝中抢救一些有趣的东西,分享一些属于20世纪90年代末和00年代初的记忆。”

在这个以视窗98启动页面为头像的账号下,你可以看到童年时的各种流行物品,比如数码霸王龙机和Takuma singer。每一个微博都成为无数80后和90后分享怀旧记忆的地方。

这些帖子带来了许多互联网本地人从未听说过的东西。这些老网民贡献了一些关于互联网过去的口述历史。然而,这些记录毕竟是支离破碎的,并很快淹没在快速更新的社交媒体时间线下。

不久前,豆瓣网友“碰撞-现金-汽车”的故事在网上流传,感动了很多人。在黑胶工作室《好奇心日报》的一份报告中,提到了碰撞-现金车的故事:“从前有一个叫碰撞-现金车的人,他从2008年开始给豆瓣添加音乐项目,并为以前从未听过的唱片制作标签。他是一个前所未有的有点传奇色彩的人。从2008年到2016年,“冲突-现金-汽车1”在网站数据库中创建了6,108个音乐项目,标志着371个派别。"没有人知道他是如何找到这些音乐的,也许是下载的,或者是黑胶和光盘."2016年,网民得知了他的死讯。他真正的职业是保安。

当一个豆瓣网民把这份报告的截图发给豆瓣电台时,许多豆瓣网民开始讨论碰撞-现金-汽车。一名豆瓣网民称碰撞现金车为“中国音乐界的大和尚”。

用这位豆瓣网民的话说,Clash-Cash-Car对互联网的最大贡献是将各种少数民族记录转录成MP3,上传到下载平台,并在豆瓣为每条记录写下相关信息。

虽然这可能涉及版权问题,但它客观上促进了某种亚文化的普及,就像一个盗版电影网站胖鸟电影(Fat Bird Film)不久前引起了热烈的讨论。正是像“冲突-现金-汽车”这样的网民无私地将互联网上零散的信息分享到一个易于索引的数据库中。

正如另一个“互联网活化石”和菜头所说,“在古代中国,人们不仅使用互联网,还参与互联网的建设。”今天,一代又一代的网民创造并共享互联网。

但是即使像维基百科这样的网络百科全书也只能记录一小部分互联网。然而,有些人确实试图备份整个互联网,即互联网档案库,这是美国的一个非营利数字图书馆。

互联网档案馆旨在保存人类在互联网上创造的所有文明。自1996年成立以来,它收集了大量网页、视频、音频、软件和电子书。目前,档案馆已经收集了3510多亿个网页。

其中一个最重要的项目叫做回航机。时间机器每小时都会通过网络爬虫抓取每一个网页并存档(声明不允许抓取的网站除外),所以你可以每天甚至每小时访问每一个网页,就像回到过去一样。

阿里巴巴2000年3月3日的网页

互联网档案馆有100多名员工,每天扫描数百本进入全球公共领域的书籍,并将它们上传到档案馆的服务器。只要是不涉及版权问题的媒体文件,就可以在网站上免费下载,而互联网档案的口号是:分享世界上所有的知识。(普及所有知识)

在过去的20年里,互联网档案已经多次强调了它们的价值。“。由于南斯拉夫解体而失效的“余”域名被保留了下来,维基百科上每天都有大量无效的引用链接。

此外,2014年马航MH17飞机因导弹袭击坠毁后,负责攻击社交网站的武装领导人的帖子在发布后不久就被删除了。目前,互联网档案已将其纳入“乌克兰冲突”系列文件。

今天,有无数的帖子或文章由于各种原因在互联网上完全消失的例子,而档案则防止了互联网的一些历史因时间而消失。

不久前,前音乐和社交巨头Myspace在迁移服务器时几乎丢失了2016年前用户上传的所有内容。幸运的是,互联网档案包括一些Myspace音乐文件,这使得一些音乐家能够保留他们早期的作品。

除了网络档案,越来越多的组织加入了这个行列。例如,推特上的所有推文都将被纳入美国国会图书馆。2003年,许多国家的国家图书馆和互联网档案馆也成立了国际互联网保护联合会。

这些每天都在备份互联网的人自然成为了互联网历史记忆的守护者。

易腐互联网

随着互联网的普及,每天都有大量的数据被添加进来。根据国际数据中心的数据,中国去年产生了7.6兆字节(约7.6兆字节)的数据,预计到2020年全球数据量将达到44兆字节。

▲谷歌数据中心的机房

更不用说是否有一个组织能够持续备份如此大量的数据,即使可以,也不意味着互联网上的信息可以完整地记录下来并传递给后代。

即使是互联网档案也无法阻止网页抓取器的网页。只要一个名为“robots.txt”的文本文件被添加到网页的根目录中,档案的时间机器就会停止对网站进行索引,例如百度就不能被包括在内。

此外,在移动互联网时代,信息被各种应用程序分割成孤立的孤岛。微信、微博、颤音等主流社交平台上的信息无法通过搜索引擎找到,也不会被互联网档案所抓取。

keso在《易逝的互联网》中提到,在过去,由于强大的搜索引擎以及网络索引和缓存技术,许多人认为任何曾经出现在互联网上的内容都会永远存在于互联网上,但事实并非如此。

一方面,由于对互联网的严重依赖,我们几乎很难消除互联网上的痕迹。因此,在许多公共事件发生后,人们将成为“人肉”。另一方面,我们也很难在各种网络平台上保存个人数据,例如您无法备份和导出朋友和微博。

这也会导致大量的网页或应用程序数据随着平台的消失而消失。最近,有网易博客和熊猫直播。自互联网诞生以来的几十年里,已经有无数的互联网公司倒闭,包括已经积累了1000多万用户的大型平台。

即使互联网平台仍然存在,数据丢失也可能是由各种事故造成的。例如,丢失了5000万首歌曲的Myspace和谷歌的电子邮件Gmail,由于更新中的一个错误,意外删除了40,000多个账户。被称为“互联网之父”的

TCP/IP协议的共同发明者之一温顿瑟夫认为,21世纪可能成为一个信息黑洞,不是因为数据将会丢失,而是因为未来的人们可能根本无法读取数据。

温顿瑟夫说,在1000年或更长的时间里,人们可能无法阅读当前的数据。为了了解曾经主导市场的WordPerfec文件格式,几年前,视窗系统不再支持它。

虽然云计算现在被认为是未来的趋势,但你可能不知道提供云服务的技术公司,如谷歌、亚马逊和微软,实际上正在使用磁带备份大量数据。

业内许多人相信磁带将是数据存储的未来。人类备份信息的媒介将回到从古代石头到纸张,从硬盘到云的离线磁带。毕竟,互联网上的一切仍然很容易消失。

我不知道100年后我是否能看到这篇文章?

[来源:爱范儿]