通过《万物皆无序》看ICT环境下信息组织的任务与挑战
随着我们创造在不受实体限制的只是世界中行得通的新原则,信息不仅仅只想要自由——它还想要无序。 ——戴维·温伯格
进入21世纪之后,计算机技术的发展日新月异,信息的载体也从在现实生活中存在的纸张等由原子构成的事物变成了存在虚拟空间里的各种流。而随着信息不再受实体的限制,我们对信息的组织方法也产生了巨大的改变。以前,我们的物质世界组织信息的方式都会有一个唯一“合适”的标准,也就是说,某一样事物该待在哪里是有规定的,都能找到属于它自己的位置。现在,比起制定一个唯一的标准,我们更倾向于根据我们自身的兴趣爱好来为事物进行排序,也就是让每一样东西待在对于我们来说最便于使用的地方——并不限定于一处。
戴维·温伯格在他的《万物皆无序:新数字秩序的革命》中说明了信息组织的发展过程,并将整个世界的秩序分为一阶、二阶和三阶。一阶秩序指的是我们现实生活里的事物,即我们对事物本身的整理;二阶秩序时我们有了元数据——即描述事物的信息,但这些元数据还是需要记载在卡片上,仍然受到现实生活原子物体的限制;进入三阶秩序后,我们开始有了数位,信息不再需要记载在一个特定的实体上,而是储存在虚拟空间中,这时我们的元数据可以比事物本身所包含的内容还要多得多。从这时开始,信息开始从我们曾经给它列出的条条框框中挣脱出来, “树叶”不再安分地待在本来的地方,而是通过无数的链接建立联系,从“树”变成了“网”。
从字母表出现之后,有很多东西都采用字母排序法,比如百科全书、音乐播放列表等等。这种排序方法或许能满足那些明确地知道自己想要什么的人,但并不是所有人在搜索的时候都会明确的知道自己想要什么。这也表明——
“发现”你想要什么,与“找到”你知道自己要的东西,至少也是同等重要的。——戴维·温伯格
也就是说,严格地遵循某一种组织标准来对信息进行组织并不能适用在每一个用户身上。而且,在这个技术飞速发展的社会下,信息量的大小呈爆炸式增长,固定的组织标准根本没有办法适应整个社会的变化——比如杜威的十进制。诚然,现在大多数图书馆使用的都是这种组织方式,但是戴维指出,这个方法在现在显得十分过时,而且也出现了很多错误。那为什么不改过来呢?戴维在他的书里给出了答案——并不是不想改,实际上,这个规则一直在进行小幅度的调整,但是如果要进行一次改头换面的大改的话,涉及的面会非常的广,世界各地的管理员们都有要重新给书籍贴上新的标签,而且说不定在他们把新标签都贴上之前又出现了新的变化。
综上所述,在数字化的时代,我们已经不像以前那样需要专家来为我们制定一个权威的标准。我们组织信息的方式,取决于我们打算如何使用它们,或者说,我们如何理解它们。但是理解和知识本身是基于个体的,个体间的不同会让组织的方式呈现出千变万化的态势——我认为《明朝那些事儿》是属于历史类的书籍,而你觉得它应该待在小说架子上——这些不同的认知直接呈现出来就是我们在给事物分类(完全按照个人意愿)时会出现各种各样的类别,也就是我所理解的无序。即在我看来,三阶秩序下的混乱无序指的是标签的混乱、信息组织方式的混乱。而现在我们的数字化世界,正充斥着这种混乱——当然,这也没什么不好。
那么,基于上面对三阶秩序混乱无序的理解,对于ICT环境下信息组织的任务和挑战,我觉得有以下三点——在开始讨论这个之前,先来看看百度百科对ICT环境的定义:
ICT是信息、通信和技术三个英文单词的词头组合(Information Communications Technology,简称ICT) 。它是信息技术与通信技术相融合而形成的一个新的概念和新的技术领域。
第一个挑战:数据的整理和归类。信息经过提炼数据获得,这也意味着,对数据的整理和归类对于信息的组织来说有着很大的影响。我们如何对获得的数据进行整理决定了我们最后能获得什么样的信息。而我们需要获得的信息又与我们需要做的事情息息相关,也就是说,由于个人需求的不同,数据的整理归类方式也会多种多样,而如何从这一堆堆混乱的数据中选取可以满足不同用户的信息需求的那一堆数据,就需要我们在最开始的整理和分类时进行考虑。比如说,在面对像图片网站Flickr上的那些海量的图片文件时,我们应该怎么才能更好地完成对这些图片的处理,是像Flickr那样完全由用户提供标签?或者由网站管理者根据自己的知识和经验来对这些图片进行分类?还是通过其他的什么方法?这些都是我们在提供信息之前所要考虑的。
第二个挑战:信息的描述。我们决定信息的描述的方法也就决定了我们需不需要元数据,需要哪些元数据。前面说过,不同用户对于同一事物也会由于其本身的差异而产生不同的理解。很显然,当我们试图了解某一样事物时,我们都会先尝试给它下一个定义,正如戴维所说
知识的第一要务就是识别定义标准。
但是如何去定义事物是一个具有很大争议的过程,你很难说清楚为什么这个东西要这么定义。而且在三阶秩序里,信息需要无序,而无序的信息就代表着它是没有疆界的。在这种情况下,如何去向用户准确的描述出这个信息,就更难了。而若是不为信息添加用来描述它的元数据,就会使得信息陷入一种比现在的混乱更混乱的状态——完全任由个人发挥会使这些信息没有统一性。尤其是在法学、化学等较为严谨、非此即彼的学科,混乱的信息将会带来很大的问题。所以,如何去描述我们提供的信息,把握混乱和有序之间的平衡点也是我们在进行信息组织的过程中遇到的挑战。
第三个挑战:信息与信息之间的联系。亚马逊商城通过各种各样的超链接将你从这本书带到另一本书,这种关联功能不仅让你了解到这两本书之间可能存在的关系,也能让你探索到与之相关的其他信息。也就是说,它带来了一种拓展搜索的方法,可以更好地帮助我们发现我们“想要什么”。另一方面,在我们平时生活中谈话时总是会自行加入一些“隐式信息”来帮助我们理解对方话语中的一些信息,这体现在数字化世界中,就表明我们需要通过某些关联的信息来告诉我们某个事物的含义。也就是说,我们需要通过信息之间的联系来深入了解某一样事物。但是,信息之间的关联越多,整个信息网的结构就会越复杂,如何在信息组织的过程中处理好这种“混乱的联系”,就是我认为的ICT环境下信息组织的第三个挑战。
我们处于一个三阶秩序的数字时代,处处都充满了信息,但这也意味着有很多信息对我们来说其实是冗余的,而解决信息冗余的方法,就是使用更多的信息来对其管理,这就导致了混乱的产生。但是由于数字世界的独特性,我们往往看不到这些混乱。用戴维的话来说
我们所唯一能见到的三阶混杂无序,就是混杂无序的各种各样的排序。
在这种情况下,我认为我们要做的信息组织其实就是从这些混杂无序的排序中选取一些符合接受我们服务的用户的需求的方案,或者说,为用户提供一种在我们控制得了的情况下让他们自行对内容进行排序的方法。而在这个过程中,上述的三个挑战会贯穿始终。最后引用一段戴维的话来对信息组织企业所提供的服务进行总结——
在真正混杂无序的世界中,成功的企业除了它们试图销售给我们的东西之外,什么都不拥有;所有其他的,都是我们的。