关于人类与信息易逝性的对抗,我听过一个恢弘的故事。
年,缅甸国王担心英军入侵,为了守护最重要的信息,他在皇家首都曼德勒建造了一个特殊的寺院,下令将整部巴利文大藏经刻在大理石板上,每个石板都放在一个圣祠里。也就是说,整座寺院本身,就是一本页的书。倘若从上方俯瞰,每个圣祠的造型,以及连接他们的路径,都仿佛构成了一个庞大的数据库,也仿佛是在向后人发表胜利宣言:时光易逝,信息永存。
但是,关于信息的易逝性,我也听过一个悲观的说法。
年,互联网数据传输协议的缔造者之一,谷歌副总裁温特·瑟夫(VintCerf),抛出了一个令人为之一颤的疑虑:他担心随着数字技术的不断迭代演化,今天人类保存在互联网上的图片,文档,文件等信息可能彻底丢失,在进入一个数字黑暗时代后,未来的人类可能根本没有关于21世纪的历史记录。
无需赘言,温特·瑟夫对于黑暗时代的隐喻,在现实中是指中世纪早期的西欧。在这一时期,古罗马文明被战争破坏,万幸的是,在战争夹缝中生长起来的教会,保存了大量古罗马的文字,哲学,制度,法律,司法等文明的火种,成为整个西罗马帝国坠毁后幸存的黑匣子。
温特·瑟夫担心的,是当互联网成为人类文明和社会记忆的新载体,未来的人类,找不到21世纪的黑匣子。
这种担忧不无道理。从甲骨文算起,到把文字落于纸上,再到印刷术与工业影像,一代有一代信息之体。最新一代就是互联网,而相较于书本文明,信息边际成本的大幅降低,让互联网信息规模呈指数级增长,这么说吧,如今每天诞生的数据量,大概相当于人类从公元元年至大约一千年产生数据的总和。
信息的爆炸式增长,也让互联网的记忆被迅速遗忘,《纽约客》一篇文章曾写道:如今网页的平均寿命大概为天,哈佛法学院年的一项调查就显示,《哈佛法律评论》和其他期刊中有超过70%的链接已经不再指向最初引用的信息,美国最高法院意见中的这一比例也达到50%。
信息的速朽不止于公共记忆,每个人的私家互联网记忆,也可能因为平台的消亡而消亡。当MySpace,GeoCities和Friendster都已经改头换面或被迫出售时,数以百万的账号被先后删除。
但纵然如此,许多人仍有所怀疑:数字黑暗时代真的会来么?
我是不太相信的,依我之见,未来没有温特瑟夫描述的那般暗黑,因为在打捞互联网记忆碎片这件事上,人类正在凝聚难得的共识。
01
很多人开始相信,在某些公共福祉上,互联网是有记忆的。
先讲一个暖心的故事。
在《好奇心日报》一篇文章中,提及了一位叫做Clash-Cash-Car的豆瓣网友的故事:曾有个叫作Clash-Cash-Car的人,他从年开始往豆瓣不断增添音乐条目,为之前从未被人听过的唱片建立标签,规模前所未有,是一个有点传奇的人。年-年,「Clash-Cash-Car1」在网站资料库内建立个音乐条目,标注共个派别,「没人知道他是如何找到这些音乐的,可能下载,或者黑胶和CD」。年,网友得知他去世。他的真实职业是一名保安。
这个故事感动了不少人,有人将他称为中华音乐圈的扫地僧,正是他这样一个个有趣的灵魂,存续着互联网上即将消逝的碎片化信息。
对信息的留存,不止崛起于微末,许多机构也在做系统性的努力。
在美国,年成立的互联网档案馆(InternetArchive)就致力于实现全球互联网信息的收集,存储和获取:至今收集大量的网页,视频,音频,软件和电子书;目前档案馆已收录超过亿个网页。
年,12个国家机构还共同成立国际互联网保存联盟(IIPC),中国国家图书馆也在年加入。
除了非营利组织,科技公司也希望将自己创造的海量信息,变成某种集体记忆。比如,Twitter上的部分推文(譬如涉及美国政策变化等公共事件),就会被收录到美国国会图书馆。
在中国,从年起,国家图书馆就开始采集和保存互联网资源,不久前还开启互联网信息战略保存项目,希望建设覆盖全国的分级分布式中文互联网信息资源采集与保存体系,通过与其他机构的合作,推动互联网信息的社会化保存与服务,项目首家合作机构是新浪,这意味着,与被收录到美国国会图书馆的Twitter类似,你发的微博很可能也会被收录在国家图书馆的资料库里。
当然,许多人也不禁好奇,无论是美国的互联网档案馆还是中国的国家图书馆,他们这样千方百计,防止互联网失忆,究竟有何意义?
02
如前所述,倘若不加干预,互联网信息注定速朽。之于个体,这似乎并无大碍,甚至只关乎情怀。
但之于共同体,由于互联网如实反映着某段时期政治,经济,文化和社会等方面的发展脉络,对数据的采集与保存,势必可以加速推进数据资源共享开放和开发应用,并且能在很大程度上深化政府数据和社会数据关联分析,提高宏观调控,市场监管,社会治理和公共服务的精准性和有效性。
甚至在一些社会学学者眼中,留存国民的数字记忆,能够将其凝聚和提炼为同一文明共同体的公共记忆,从而最终成为国家建构的一部分。
然而,保存数字记忆,并非一桩易事。尤其伴随移动互联网时代的到来,信息被散落在一座座APP孤岛,也因如此,任何机构都无法自包自揽,必须自下而上地调动社会力量。这也是为什么在互联网信息战略保存项目中,信息数据将由共建主体保存,国图会与共建主体联合进行分析,服务于政策决策,学术研究等非商业用途。
不难发现,在人类向数字化生存的跃迁中,图书馆也在完成蜕变,前阿根廷国家图书馆馆长,作家博尔赫斯说过一句脍炙人口的名言:天堂应该是图书馆的模样,但在许多人看来,这座图书馆最好是以数字形式存在,而且最好是由我们每个人共同创造。
事实上,就像美国国会图书馆所说:Twitter是通讯,新闻报道和社会趋势的历史记录的一部分,这些可以作为国会图书馆现有文化遗产的补充,国家图书馆也同样看重新浪的信息规模和样式,截至去年12月,新浪网累计发布新闻数量超过2.1亿条、多媒体内容超过13亿、互动总量超过80亿,微博近10年来全站发布的博文超过亿条、多媒体内容超过亿,评论互动总量近0亿。
这些公开发布的信息都将进入互联网信息战略保存基地保存,其中尤以微博数据最具社会价值。不同年龄,不同地域,不同教育和文化背景的普通用户发布的信息,占据了微博博文的绝大部分,这些鲜活的个体记忆在过去可能会随着时间的流逝而消失,但今后将被保存,与媒体、大V、明星等声音一起记录社会发展,发挥为政策决策和学术研究提供多元参考的价值,也为从公众视角开展历史和社会研究提供难得的资料,最终成为这个国家的公共记忆。
而在我看来,这些碎片化的数据资料,除了拥有当下的社会价值,也为后人提供了重新审视历史的机会。因为在某种意义上,每个时代信息的传播与存储能力,会在潜移默化中影响后人的历史观。
我还记得,上大学时,一位颇具厚黑气质的学长,跟我讲过一句不知从哪里扒来的金句,大概是说:历史是由最好和最坏的人创造,大多数平庸之辈,只负责繁衍种族。
我当年暗自折服于他的深刻,如今却早已理解他为何如此狭隘:从信息传播角度,由于传播技术和传播成本的原因,在很长一段时间,相对单一的信息结构让人们对历史的还原更侧重于名人视角,对信息的保存也更侧重于专业作品,所谓平庸之辈的微弱声响,也被宏大叙事的扩音器笼罩。
幸运的是,在传播技术更高,传播成本更低的今天,当人们从不同维度,努力完成对互联网记忆的打捞,我相信几十甚至上百年后,当后辈们研究21世纪的中国历史时,就不仅能看到最好和最坏的人,还能看到国民视角下的人间百态。
这个时候他会发现:历史,其实是由每个人创造,由每一位国民的真情实感创造。