元数据的可计算化反 I

The Computability of Metadata (Part 1)

Posted by Jamin Chen on January 3, 2018

元数据,如果按字面释义,是最基本的数据。元,即初始、本源之意。在数据领域,元数据(Metadata)指“描述数据的数据”,记录了一个数据集的基础信息。

如果把数据集比作一个人的话,元数据就像是一张肖像简笔画。一个人能够通过画面认识另一个人(比如杨过在古墓迷恋上神仙姐姐的画像,并倾慕爱恋),是因为画已记录了此人的主要特征;同时这一认知过程又是不完备的,因为那只是一张梗概,缺少骨肉,丢失细节。但这足以说明,通过元信息这一梗概,我们足以抓住被描述主体的主要部分。

本文笔者试图探索有关元数据的两个方面的问题,一是元数据在我们人类理解世界这一过程中所扮演的角色,另一个对于打破我们人类社会面临的信息壁垒、数据孤岛,元数据提供了怎样一种途径、以及如何发挥作用。

带着上述简笔画的例子,让我们类比一下人类大脑处理外界信息的过程。由于我们生活在三维世界中,遥远的祖先和我们现在一样,首先感知到的关于这个世界的元信息便是“长-宽-高”。通过对空间尺寸的感知,形成了对外界陌生物体的第一印象,并积极调动经验知识,对这一几何尺度做出最初的判断,如形态、重量等,进而通过细节观察,判断出对方是石头亦或狮子,安全亦或危险,并作出大脑的应激反应。(对于更高维,有兴趣读者可以独自探索下,一种形象的例子在科幻小说《三体》黑暗森林中有描述)

这一思维过程,通常倏忽急逝,随着个人年龄的增长,经验的增多,这一过程更加熟练。但是不经意间,在这一过程中我们多次调用了大脑对于“元信息”的处理能力,并可以总结为“元信息–知识–元信息”的处理模式。

首先,通过感官如眼睛,人类脑不断摄入外界的细节信息,这些细节作为描述被观察对象的局部元信息,源源不断地被大脑吸收,并不断地与大脑中已储存的经验知识进行对比判断,与经验完美符合的部分,大脑往往选择忽略,并潜意识加固已有的知识,也就是常说的“熟视无睹”。

但是对于异常的部分,例如带来惊喜、惊讶、恐惧的感觉,通常会刺激大脑对这一知识进行进一步处理。当代认知理论认为,大脑会对由大量局部细节信息构成的整体进行删减,形成一般性的知识,并转化为另外一种形式的元信息,记录在大脑神经元之中,以备下次调用,这便是我们所说的“经验”。

当然,这些元信息如何表达、以及被我们大脑存储,依然是我们种族的重要待解谜之一。

这种元信息记录的方式,不妨假设为大脑处于自我保护的一种“偷懒”行为。一来降低身体的能量消耗,毕竟处理和记忆更多的信息,需要消耗更多的体能。二来随着神经元的代谢,旧的知识会消失或消退,为新的知识记忆腾出空间,这意味着“元信息模式”有助于利用有限的大脑资源,记录更多的经验知识。

这种信息处理模式,在数字信息爆发的时代,同时构成了人类的认知负担,抑或局限。