元数据的可计算化反 III

The Computability of Metadata (Part 3)

Posted by Jamin Chen on August 6, 2018

一点有关链接数据到图模型映射的思考: Mapping from Linked-Data Model to Labeld Property Graph

仅仅是一些思考片段,省略了很多背景知识,比如关联数据、元数据、知识表示、图计算等等。不求看官解,自娱耳。有兴趣的可以探讨。

OWL/RDFS/RDF是目前为止,普遍被业界接受的一种描述性链接数据范式。其优势在于描述知识的方法灵活,科研和工业界支持程度好,数据源兼容性高。劣势在于其被设计为一种能够被机器方便处理的语言,面向人的设计不够友好。人类的知识具有多样性。试想,如果重新设计一种描述人类知识元语的方法,在考虑灵活性和表达性两个方面,势必要有所取舍和平衡。因此知识元语的描述方法上,我们暂且接受链接数据模型(Linked-Data Model, LDM)。

标记属性图(Labeled Property Graph, LPG)以图的方式描述数据,更加接近人类的思考方式。另外,图处理和分析技术的发展,无论OLAP或OLTP,目前的理论和工程成就主要集中在LPG上。这是一个巨人的肩膀。我们应该踩在这个坚实的肩膀向上攀登。

未来的知识计算引擎,如果基于LPG的理论进行设计,从LDM到LPG模型的转化和处理将是一条必经之路。基于此,同时缺少一个用于LPG模型进行知识推理的引擎,这不属于图计算引擎的范畴,因此是一个新的领域。该领域理论研究虽然不新,但是工程创新始终未有突破。一个可能的原因在于知识计算并未到达临界点,未能够引起重视。这里存在一个机会。

Neo4j已经开始集成这样的能力,Grakn直接抛弃LDM另起炉灶,设计了一种语义范式。虽然Grakn能够针对自定义的语义范式进行深层次优化,在笔者看来,Neo4j的做法更加明智。尽管各有优劣,但是这些做法都不够系统化、规范化、理论化。所支持的场景依然对用户有较高的要求。需要使用者深刻理解LDM、并且能够人为映射到LPG框架上。如果能够实现自动化,这将成为未来知识计算引擎的助推器之一。(注:Neo4j和Grakn分别为图计算的老牌悍将和知识计算引擎新秀。)