元数据的可计算化反 III

一点有关链接数据到图模型映射的思考: Mapping from Linked-Data Model to Labeld Property Graph

仅仅是一些思考片段，省略了很多背景知识，比如关联数据、元数据、知识表示、图计算等等。不求看官解，自娱耳。有兴趣的可以探讨。

OWL/RDFS/RDF是目前为止，普遍被业界接受的一种描述性链接数据范式。其优势在于描述知识的方法灵活，科研和工业界支持程度好，数据源兼容性高。劣势在于其被设计为一种能够被机器方便处理的语言，面向人的设计不够友好。人类的知识具有多样性。试想，如果重新设计一种描述人类知识元语的方法，在考虑灵活性和表达性两个方面，势必要有所取舍和平衡。因此知识元语的描述方法上，我们暂且接受链接数据模型（Linked-Data Model, LDM）。

标记属性图（Labeled Property Graph, LPG）以图的方式描述数据，更加接近人类的思考方式。另外，图处理和分析技术的发展，无论OLAP或OLTP，目前的理论和工程成就主要集中在LPG上。这是一个巨人的肩膀。我们应该踩在这个坚实的肩膀向上攀登。

未来的知识计算引擎，如果基于LPG的理论进行设计，从LDM到LPG模型的转化和处理将是一条必经之路。基于此，同时缺少一个用于LPG模型进行知识推理的引擎，这不属于图计算引擎的范畴，因此是一个新的领域。该领域理论研究虽然不新，但是工程创新始终未有突破。一个可能的原因在于知识计算并未到达临界点，未能够引起重视。这里存在一个机会。

Neo4j已经开始集成这样的能力，Grakn直接抛弃LDM另起炉灶，设计了一种语义范式。虽然Grakn能够针对自定义的语义范式进行深层次优化，在笔者看来，Neo4j的做法更加明智。尽管各有优劣，但是这些做法都不够系统化、规范化、理论化。所支持的场景依然对用户有较高的要求。需要使用者深刻理解LDM、并且能够人为映射到LPG框架上。如果能够实现自动化，这将成为未来知识计算引擎的助推器之一。（注：Neo4j和Grakn分别为图计算的老牌悍将和知识计算引擎新秀。）

元数据的可计算化反 III

The Computability of Metadata (Part 3)

CATALOG

FEATURED TAGS

FRIENDS