欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

知识图谱实例简介

程序员文章站 2022-03-04 13:08:45
...
  • 语言知识图谱

WordNet:155, 327个单词,同义词集117,597个,同义词集之间由22种关系连接;

from nltk.corpus import wordnet as wn
color = wn.synsets('white')
print(color)
[Synset('white.n.01'), Synset('white.n.02'), Synset('white.n.03'), Synset('white.n.04'), Synset('white.n.05'), Synset('white.n.06'), Synset('white.n.07'), Synset('white.n.08'), Synset('white.n.09'), Synset('egg_white.n.01'), Synset('white.n.11'), Synset('flannel.n.03'), Synset('whiten.v.01'), Synset('white.a.01'), Synset('white.a.02'), Synset('white.s.03'), Synset('white.s.04'), Synset('white.s.05'), Synset('white.s.06'), Synset('white.s.07'), Synset('blank.s.01'), Synset('white.s.09'), Synset('white.s.10'), Synset('ashen.s.01'), Synset('white.s.12')]
print(color[0])
Synset('white.n.01')
print(wn.lemma('white.n.02.white').antonyms())
[Lemma('black.n.01.black')]
  • 事实性知识图谱

OpenCyc: 23.9万个实体,1.5万个关系属性,209.3万个事实三元组

DBpedia:400多万实体,48,293种属性关系,10亿个事实三元组

YAGO2 :980万实体,超过100个属性关系, 1亿多个事实三元组

ownthink:中文知识图谱,超过10亿节点的中文知识图谱,https://www.ownthink.com/

复旦大学中文知识图谱:http://kw.fudan.edu.cn/apis/cndbpedia/

POST http://shuyantech.com/api/cndbpedia/ment2ent?q=纳兰性德
{"status": "ok", "ret": ["纳兰性德", "纳兰性德(清朝词人)", "纳兰性德(电视剧《康熙秘史》中人物)", "纳兰性德(长篇历史小说)", "纳兰(梁羽生小说人物)"]}

POST http://shuyantech.com/api/cndbpedia/avpair?q=纳兰性德
{"status": "ok", "ret": [["中文名", "纳兰性德"], ["别名", "纳兰容若"], ["别名", "纳兰成德"], ["国籍", "清朝"], ["民族", "满族"], ["出生地",
"北京(中国首都)"], ["出生日期", "1654年"], ["逝世日期", "1685年"], ["职业", "词人"], ["信仰", "儒释道"], ["主要成就", "清词三大家之一"], ["主要成就", "满清第一才子"],
["主要成就", "第一学者"], ["代表作品", "通志堂经解"], ["代表作品", "侧帽集"], ["代表作品", "饮水集"], ["代表作品", "渌水亭杂识"], ["父亲", "纳兰明珠"], ["妻子", "卢氏"],
["妻子", "官氏"], ["妾", "颜氏"], ["妾", "沈宛"], ["性别", "男"], ["代表作品", "《通志堂集》 《侧帽集》"], ["生平赞誉人", "王国维"], ["妻子", "卢氏:官氏"], ["妾",
"颜氏:沈宛"], ["DESC",
"纳兰性德(1655年-1685年),叶赫那拉氏,字容若,满洲正黄旗人,原名成德,避太子保成讳改名为性德,一年后太子更名胤礽,于是纳兰又恢复本名纳兰成德。号楞伽山人。清朝著名词人。父亲是康熙朝武英殿大学士、一代权臣纳兰明珠。 母亲爱新觉罗氏是英亲王阿济格第五女,一品诰命夫人。其家族——纳兰氏,隶属正黄旗,为清初满族最显的八大姓之一,即后世所称的“叶赫那拉氏”。纳兰性德的曾祖父,是女真叶赫部首领金石台。金石台的妹妹孟古,嫁努尔哈赤为妃,生皇子皇太极。\n自幼饱读诗书,文武兼修,十七岁入国子监,被祭酒徐文元赏识,推荐给内阁学士徐乾学。十八岁参加顺天府乡试,考中举人。十九岁参加会试中第,成为贡士。康熙十二年因病错过殿试。康熙十五年补殿试,考中第二甲第七名,赐进士出身。\n拜徐乾学为师。他于两年中主持编纂了一部儒学汇编——《通志堂经解》,深受皇帝赏识,为今后发展奠定基础。\n他的词以“真”取胜:写景逼真传神。词风“清丽婉约,哀感顽艳,格高韵远,独具特色。”著有《通志堂集》、《侧帽集》、《饮水词》等,\n纳兰性德于康熙二十四年(1685年)暮春抱病与好友一聚,一醉一咏三叹,而后一病不起。七日后,于康熙二十四年五月三十日(公元1685年7月1日)溘然而逝,年仅三十岁(虚龄三十有一)。"],
["CATEGORY_ZH", "人物"], ["CATEGORY_ZH", "文学家"], ["CATEGORY_ZH", "文化人物"], ["CATEGORY_ZH", "作家"], ["CATEGORY_ZH", "清朝"]]}


POST http://shuyantech.com/api/cndbpedia/value?q=武汉大学&attr=地址
{"status": "ok", "ret": ["湖北省武汉市珞珈山街道八一路299号"]}
  • 领域知识图谱

Kinships:描述人物之间的亲属关系,104个实体,26种关系,10,800个三元组

Cora:论文及引用关系知识图谱,2,497个实体,7种关系,39,255个三元组

UMLS:统一医学语言系统(Unified Medical Language System,UMLS)是美国国立医学图书馆持续开发了20多年的巨型医学术语系统,涵盖了临床、基础、药学、生物学、医学管理等医学及与医学相关学科,收录了约200万个医学概念,医学词汇达到500多万个。下载地址:https://www.nlm.nih.gov/research/umls/licensedcontent/umlsknowledgesources.html

  • 自动发现知识图谱

NELL: 519万实体,306种关系, 5亿候选三元组
Knowledge Vault: Google通过算法自动搜集网上信息,通过机器学习把数据变成可用知识。目前,Knowledge Vault 已经收集了 16 亿件事实,其中,2.71 亿件是“可信的事实”。这里的可信是说,Google 把新事实与已掌握知识对照后,认为其准确的可能性是 90%。