人工智能知识图谱

知识图谱概论-王昊奋

2020-03-14  本文已影响0人  Viterbi

知识图谱与语义技术概论

知识图谱(KG)的概念

知识图谱(KG)得益于Web的发展(更多的是数据层面),有着来源于KR、NLP、Web、AI多个方面的基因。知识图谱(KG)的概念演化如图:


1.png

知识图谱是2012年后的提法,基础还是语义网和本体论

知识图谱的本质包含:

知识图谱由文本(Texts、Documents)的链接到对象(Objects)的链接
知识图谱(KG)的作用:

知识图谱的深度学习的区别:
人的大脑依赖所学的知识进行思考、逻辑推理、理解语言。
可以将深度学习和知识图谱比作是“聪明的AI”和“有学识的AI”。

典型的知识库介绍

CYC 常识知识库

7.png

Wordnet:词典知识库

8.png

ConceptNet:常识数据库

9.png

Freebase

10.png

Wikidata:目标是构建全世界最大的免费知识库

11.png

DBPedia:早期的语义网项目

12.png

YAGO:集成了Wikipedia、WordNet、GeoNames三个来源的数据

13.png

Babelnet:类似于WordNet的多语言词典知识库

14.png

NELL:是卡内基梅隆大学开发的知识库

15.png

微软的Concept Graph:以概念层次体系为中心的知识图谱

16.png

OpenKG:中文知识图谱资源库

17.png

cnSchema:开放的中文知识图谱Schema

18.png

知识图谱相关技术简介

19.png

知识表示

知识表示研究怎样用计算机符号来表示人脑中的知识,以及怎样通过符号之间的运算来模拟人脑的推理过程。

基于数理逻辑的知识表示

25.png

知识图谱分布式 表示

在保留语义的同时,将知识图谱中的实体和关系映射到连续的稠密低维的向量空间


30.png

知识抽取

知识抽取流程NLP+KR

31.png

知识抽取的主要方法

知识工程

基于本体的抽取

基于模型的抽取

模型:SVM,logistic model,条件随机场,LSTM循环神经网络

知识存储

知识问答(KBQA)

KBQA(Knowledge-Based Question Answering )基于知识库的问题回答
以直接而准确的方式回答用户的自然语言的提问的自动问答系统,将构建下一代搜索引擎的基本形态。


32.png

KBQA的基本实现流程

33.png

知识推理

知识推理,基于已知的事实推出未知的事实的计算过程。大部分搜索引擎都已经支持一定的推理能力。例如百度输入,姚明的女儿的妈妈的老公

知识推理的方法分类

按解决方法分类:

按照推理类型分类

基于描述逻辑的推理

描述逞辑( description logic )是一种用于知识表示的送辑语言和以其为对象的推理方法,主要用于描述概念分类及其概念之间的关系。描述逆辑是当前语}义网发展中本体的理论基础。
主要方法:

基于统计规则挖掘的推理

34.png

基于表示学习与神经网络的推理

35.png

知识融合

知识融合,其它相关叫法: Record Linkage , Entity Resolution , Data L inking , Knowledge Fusion , Entity Alignment … …
都是指在不同数据集中找出同一个实体的描述记录,主要目的是对不同数据源中的实体信息进行整合,形成更加全面的实体信息

知识融合典型工具Dedupe

Dedupe ,基于 Python 的工共包,实现 T 包括 fuzzy matching , deduplication , entity resolution 在内的常见任务。主要处理流程是先对所有 records 通过 Clustering / Blocking 的方法进行分组,然后在组内部通过计算相似度特征和机荞学习分类模型对任一一对 records 进行预浏是否为同一实体。
适合于两个数据集有相似的结构,如果两个数据集的实体属性个数差异很大,不建议采用。

知识融合典型工具LIMES

Limes : A Time 一 Efficient Approach for Large 一 Scale Link Discovery on the Web of Data . IJCAI20 13
专门针对镬接数据 Linked Data 设计的健接框架,不要求两个数据集的实体共有相似的结构
可灵活配置匹配规则,白定义距离计算模型,也支持基于 Active Leaming 的机荞学习方法

知识众包

知识图谱典型应用案例

知识图谱的案例涉及:医疗健康、金融、电商、出版、农业、政府、电信、数字图书馆等领域。

36.png 37.png 38.png 39.png 40.png 41.png 42.png 43.png 44.png
上一篇 下一篇

猜你喜欢

热点阅读