欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

知识图谱

程序员文章站 2022-06-12 17:13:57
...

知识存储

  • 带JSON扩展的关系数据库(首选):关系数据库 + JSON是最好的(小规模)知识图谱存储选择。可用工具多、稳定性好、速度快、可join、容易演化。优先推荐使用PostgreSQL 9.3以后版本,直接支持JSON https://www.postgresql.org/docs/9.4/static/datatype-json.html。用Psycopg包操作PostgreSQL http://initd.org/psycopg/docs/
  • 图数据库(TinkerPop stack, Neo4j,OrientDB)
  • RDF数据库
  • 其他选择

知识表示

  1. JSON和YAML,易读知识的艺术
  2. RDF和OWL
    推荐Turtle语法,简洁。最简单的表示是(subject, predicate, object),以空格隔开,’.’结束,示例如下:
    <http://example.org/#spiderman> <http://www.perceive.net/schemas/relationship/enemyOf> <http://example.org/#green-goblin> .
    处理代码如下:
In [1]: from rdflib import Graph
INFO:rdflib:RDFLib Version: 4.2.2

In [2]: g = Graph()

In [3]: g.parse("rdf.nt", format="nt")
In [5]: len(g)

In [6]: import pprint

In [7]: for stmt in g:
   ...:     pprint.pprint(stmt)

可以执行sparql来查询三元组。

知识图谱构建

  1. 不同来源的数据可追溯
  2. 版本更新做好测试