【知识图谱】RDF理解以及Neo4j初次尝试
正文之前
上上周,终于被我们实验室的一个小老板收编了。后续应该就是安安静静的当一个搞研究的博士新人了。。暂定方向可能是下面三个:
- 知识图谱
- 自然语言处理
- 图数据库
加入了课题组的最大的改变,大概就是我的生活成了ddl驱动式了。一周一次的组会,两周一次的汇报~ 简直是达摩克利斯之剑,悬在头上催着我奔走。不过昨儿个第一次汇报,feel还不错~ 所以今儿个有时间来复兴简书了.
不过说真的,简书现在都些什么鬼当道啊。。。完全没有以前那种大家都在看的味道了。。本来带点社交属性还挺好,现在好了~全是卖课的。。。。乌烟瘴气。。
正文
知识图谱是什么?
知识图谱是结构化的语义知识库,用于以符号形式描述物理世界的概念及其相互关系。基本组成单位是【实体--关系--实体】或者是【实体--属性--属性值】等三元组。实体之间通过关系相互链接,构成网状的知识结构。
知识图谱有什么作用?
知识图谱最早被应用于搜索引擎领域,Google公司为了提高用户在搜索时,搜索殷勤返回的答案质量以及用户查询的效率,与2012年5月16日发不了第一版的知识图谱。而后,在国内外都有很多的效仿者开始进入这个行业。
如今知识图谱广泛应用于聊天机器人,推荐系统等方面,而在金融、农业、电商、医疗健康、环境保护、工业制造场景等各种不同的垂直领域,得益于知识图谱的先验知识的特性,均得到了广泛的应用。
说的抽象点,知识图谱就是把离散的符号表述,变成了连续的向量表示的巨大的知识网络图。
知识图谱如何实现?
下面是技术架构和工作流程,首先从各种数据源中得到我们想要的知识。然后经过一定的处理得到知识表示。而我的主要两个领域,我觉得,图数据库主要应用于知识存储方面,而NLP自然语言处理,则是主要作用于知识挖掘和后期的知识推理中。
经过知识表示,进入到知识融合。主要有实体对齐和知识加工部分,这儿昨天报告的时候老师还特地给我点正了。。感谢老师~
后面是质量评估以及最终的知识图谱应用。我自己也不清楚,不多说了。
下面是我这阵子看教程、博客等地方的知识图谱的思维导图架构。。肯定看不清楚的。。。所以。我就装个比。。
资源描述框架RDF
这里我懒得多说了。。打字好辛苦,从ppt上复制来的都是图片,见鬼了。。前面的字都是我一个个敲进来的啊。。。我还要看论文。。不多费时间了。。直接上图。。力求高清。。
图数据库Neo4j
这玩意可真是个好东西。。当然,我老师说这玩意也就给外行玩玩。主要是用户友好,实际性能就。。反正意思就是。。我以后就玩玩就好,这东西深入不得。。毕竟是商业化的产品了。。
至于下头的那个数据,就是指一个人,要找到他的所有的某个深度(几层关系)的朋友,在不同形式的数据库下要多少时间。反正就说明图数据库的实用性吧
这是我自己瞎鸡儿玩的东西
跟着例程跑的结果,你还别说,好看,好用。。虽然效率是硬伤
二三直接被老师建议pass了。。悲伤
正文之后
溜了溜了、、再看会论文找人吃东西去。。then happy time