时髦的新词“图表”是否会取代仍在使用但却显得有些过时的“互联网”或“网络”?我并不试图为此下结论。我敢打赌,“博客”一词一定是一个谦逊的人发明的。但我的结论并不重要。蒂姆·伯纳斯-李(Tim Berners-Lee)在他发布的《巨型全球图表》(Giant Global Graph)中,用了很时髦的“图表”一词,给出了我见到过的、对“语义网”最好的总结——我想部分原因在于他并不谈论语义。
他的论点很值得转述。以下内容重述了他的观点,并加入了我对语义网和Web3.0的总结。
第一阶段:
当前信息传播演进的第一阶段是与电脑联机。我们称这种联接为网络群之间的网络,或者互联网。联机阶段的互联网有用但很枯燥——有点像没有电话的电话系统。如果你要订机票的话,最好的办法是联接航空公司的电脑。联机系统的积极参与者得采取开放的姿态——互联网上的电脑必须乐于中转其他人的数据包。在联机系统中,单机并不能完全控制它的数据包(这与电话系统是不同的)。
第二阶段:
信息数字传播的第二阶段是联接文件和网页,而这就是网络。在第二阶段,可以进入关于你航班的页面或文件,而非航空公司主页。信息分辨率的细化使系统更为有用。但是,想要在这个信息的竞技场有所表现,参与人员需要公开并分享他们的网页,那些登陆后才能显示页面的设置往往会弄巧成拙,而且你也不能限制那些联接着你的文件的网络链接。新手们往往会在上述几个方面误操作。当你网页的内容被复制粘贴时——有时是部分,有时是搜索引擎索引的全部——你得心胸开阔地接受它。这是个信息共享化的阶段,但联接的价值基本上都获得了普遍认同。
第三阶段:
我们现在处于第三阶段开端的收尾之处。在这一阶段,我们继开始联机共享电脑和文档之后,开始了共享文档中的数据。我们联机共享各自文档中的内容及其相关信息,并主动制作链接。因此,我们现在可以直接联入航班信息,而非之前的航空公司电脑或者航班页面。数据已被拆分成便于在任何网络设备上阅读的形式,事实上,当这一阶段正确完成时,信息就可以被网络本身所包含,因为这时,它不再以英文等语言文字呈现,而是以一种一般语义形式存在。这种普遍形式是存在于数据库中的。其实,你可以将此阶段理解为全球数据库。
拥有我们这个世界的数据访问权,是与那些被以三个首字母作为简称的互联网技术的发明与自由应用分不开的,比如XML、RSS、API、RDF和OWL。这些都是在网络上交流和共享数据的标准。仅仅依靠使用RSS服务来聚合网站中的内容,能够完成的工作都是惊人的。另一项极受赞赏的使能技术是API,该网关允许庞大数据的可控共享,通过一般的网络效应,它能尽可能地释放数据的力量,即使用数据的人越多,其价值就越大。正如前两阶段,人们挣扎着克服对共享的恐惧,而相较于电脑或文件共享,数据共享使人们更加亲密,因此也更容易让人感到恐惧。但是,学习如何共享数据将是下阶段网络的发展方向。这一阶段,数据共享全部的真正价值建立在从深层链接、深层联系和自由(必须是合理化的)释放个人宝贵数据中涌现出的价值上,而那些能够放手共享信息、并理解以上价值的将是从中获利最大的技术和组织。
以下是蒂姆·伯纳斯-李的表述:
共享邀请方的控制力在减弱。事实上,在每一个层级——网络、万维网或图表——为了获取更大的利益,我们已经让渡了一些控制。让你的数据与别人的数据相连,在某种程度上有点像放手。这仍然不是送给别人一些他们没有权限的数据,而是让它们与来自同层级网站的数据相连接,也就是让我们的数据与来自其他应用程序的数据相连。
第四阶段:
顺便说一句,我不认为第三阶段是历史的终结,或是故事的结尾(我已经学会了质疑那些三段论的历史)。我认为我们可以迈向第四阶段,即趋向于连接起事物本身的阶段。你想把关于某物的所有数据都嵌入其中,你想要把位置的信息嵌入到位置本身中去。其实,你想要联接的并非航空公司的电脑,也不是航班页面,更不是航班数据,而是航班自身。理想的情况下,我们可以连接到嵌入式数据处理程序及飞机的原始信息,连接到机舱里的特定位置——所有这些我们称之为“航班”的复杂项目和服务。我们最终想要的,就是物联网。
在物联网中,我们制造的所有东西都包含一条连接链——虽然还有段路要走,但我相信我们能够创造它。数据的互联网——全球数据库——正在加速建设中。据我所知,这正是人们理想中语义网的样子。这是因为,为了共享,信息被从自然语言中提取出来,并被简化为截然不同的信息元素,而后进行标签,放至数据库。在这一基础形式中,它可以被以数以千计的新方式重组为有意义(具语义)的信息分子。但当它还停留在浅层的未注明的原始文件状态时,这些新方式则毫无用处。
我想数据的这种共享式提取也是人们所理解的Web3.0。在这个版本的网络层中,数据激增、流动并在网站间扩张,就像它出于大型数据库或大型机器中一样。我的网站索取了来自爱丽丝和鲍勃的稳定数据流,通过以新的(语义学的)方式重组的过程,这些数据增加了价值,而后,我将我自己组织好的数据流发布出去,使它们成为别人消费的原始数据。这种数据生态系统在一种开放的交互系统下运行,即使并非所有数据都被共享或公开,但这也是一种经双方同意的的协议。
一个运行良好的语义网、全球数据库、巨型全球图表、Web3.0,将让数百万看起来更聪明的服务成为可能。我不会重复告诉每个网站谁是我的朋友,一次就够了。如果我的名字出现在文本中,它就会知道那是我。我所在的城镇也将成为网络上的城镇——一个拥有可定义字符的地方——且别的字符不能替代。这种遍在性使任何我所在城镇的消息都链接到关于这个城镇的真实信息。网站看起来更聪明了,这表现在它“知道”更多东西——并不是以一种有意识的方式,而是表现在程序化方式上。呈现在网络上的概念和物品将能够互相指认并了解对方——以一种它们现在还不可用的基本途径。
细节很重要。哪项协议成功?哪个标准有效?哪个公司保持多数优势?——这些都是未知数。政策细节也很重要。文档和电脑作为所有物,不像数据那么不可预断,因为数据是出名的难以标定所有权的。再有就是难以界定的身份问题。如果网络知道你总是你,那么“你”是谁?如果绝对的个人服务的代价是绝对的个人透明度,那么它们与绝对的个人监视又有什么区别?
语义网的灵活性将使很多人焦躁不安。尽管它将与人类保持很大的距离,但它对事及对人的无所不知仍然会使很多人畏缩不前,并推迟其发展。我只能指望孩子们会喜欢上它了。
2007年11月29日