@产品产品经理

知识图谱管理平台主要功能简介

2019-12-31  本文已影响0人  兔小旋

一、知识定义

知识定义,也称数据描述规范(Schema),是知识图谱数据生产所必需的一套规范。“知识定义”用于描述规范化数据的结构。拥有一套完善的数据描述规范,也是计算机理解知识的必要条件。建立“知识定义”是创建知识图谱的首要步骤。知识图谱的所有构建策略全部依赖于知识定义进行。知识定义的是否准确与全面将直接影响知识图谱的构建效果,为了保证图谱知识的丰富与全面,定义的知识类目及属性(Schema)应尽量全面的覆盖到知识文档中数据的类别和属性。知识定义与图谱构建紧密相关,请不要频繁修改,一旦修改则需要重新进行图谱构建。

概念管理

一个概念,是一类实体的统称定义概念及属性有三种方式,分别为:手动新建、导入预置概念、导入自定义概念;在概念编辑框中的“名称”文本框里填写概念的名称。概念名称只能是字母、数字、下划线组成的合法字符串。如应急预案、应急专家;

概念属性管理

一个概念可以有多个属性,每个概念都有默认属性“name”,单击“新增属性”可添加属性文本框,在文本框中填写概念对应的属性。属性只能是名称只能是字母、数字、下划线、中划线或者中文字符组成的合法字符串。定义概念属性是,需要定义属性值等数据类型,数据类型有文本、日期时间、日期、时间、数字、浮点、整数、单位数值、枚举、URL。如概念应急专家下,有专家姓名、专家年龄等属性,专家姓名的属性值定义为“文本”;专家年龄定义为“数字”类型。

概念关系管理

创建的其他类目来建立边关系,如应急专家-处置案例-灾害事件。建立概念间的关系后,即可以进行多边的查询和推理,如,处置XX大地震的专家是来自哪个城市的。

预览本体

在KGMS图谱管理平台创建本体后,您可以预览描述本体信息的结构图

可以查看本体内,各个概念的上下位关系,也可以针对单个概念,概念和关系的名称和属性。

编辑本体

您可以通过编辑本体信息,更新本体,以适应业务变化。

导出本体

针对在KGMS图谱管理平台创建的本体,在本体列表中,可以选择导出本体。

删除本体

针对在KGMS图谱管理平台创建的本体,您可以删除本体以适应业务变化

图谱构建

图谱构建过程,是将原始数据,转化为图谱数据的过程,主要包含以下几个主要步骤:

数据导入

数据是知识图谱的基础。可以支持以下几类数据。

多行紧凑json文件该类型为结构化数据输入格式。文件中,每一行为一个完整的紧凑(单行)JSON字符串。文件名需以.json结尾,如“input.json”。

多行单句文本文件该类型为非结构化输入格式。文件中,每一行为一个自然语言短句,文件名需以.txt结尾,如“input.txt”。

符合要求的二维表格,以.xlsx, .xls格式结尾

传统数据库导入,如mongo、mysql数据库

知识抽取

信息抽取是从导入的基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系(即:spo三元组)。导入数据后,需要配置信息抽取,信息抽取分为普通抽取和预置算法抽取。抽取后的结果将会予以展示,您能够查看本次图谱生产中所有的数据源文件,列表中会显示文件名称、抽取实体数量,您可以查看到该文件(或数据库)中抽取出的全部实体、属性、属性值,以及该实体的属性值所在的位置信息。

属性映射

属性映射使将文档中抽取出的属性映射到“知识定义”阶段所定义的属性上,用来解决知识抽取出的属性名称与“知识定义”阶段的属性名称不一致的问题。如:“生日”映射到“出生日期”。通过配置属性映射的策略(将文档中抽取出的属性映射到“知识定义”阶段所定义的属性上)使所有的产出数据完全符合“知识定义”的格式与规范。更新属性映射规则后,需重新进行图谱构建,方可生效。

数据清洗

数据清洗:针对日期、数值、文本类属性值制定清洗规则,对齐数据表示结构(符合数据类型约束)。如:“2019-12-12“,处理为“2019年12月12日”。更新清洗规则后,需重新进行图谱构建,方可生效。

消歧归一

消歧归一是系统会根据策略判断两个或多个实体描述是否为同一实体。如是,会将其融合为一个实体。如“深圳”归一到“深圳市”。更新归一规则后,需重新进行图谱构建,方可生效。

图谱管理

针对已经创建的知识图谱,可以预览不同结构形式的知识图谱,还可以基于已有图谱,通过全量和增量操作更新图谱,通过复制配置快速创建图谱。

预览图谱

针对已创建的知识图谱,您可以以本体为单位查看,该本体下的实体关系情况,不同类型实体的数量、不同关系的数量;以不同结构形式预览指定实体的知识图谱。

全量&增量更新图谱数据

针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。也可以进行增量数据的更新

编辑图谱数据

您可以通过编辑实体属性或属性值信息,更新图谱,以适应业务变化

导出图谱数据

针对在KGMS图谱管理平台创建的图谱,在图谱管理中列表中,可以以实体为单位导出图谱数据;

删除图谱

针对在KGMS图谱管理平台创建的图谱,您可以删除实体或属性以适应业务变化;

复制图谱

当您希望创建与已有图谱类似的新图谱时,您可以复制原有知识图谱的相关配置,快

速创建新的图谱。复制配置操作指在已有图谱配置的基础上更改配置信息,重新创建一个知识图谱。

图谱服务

实体查询服务

针对在KGMS图谱管理平台创建的图谱,您可以根据实体名称,查询实体的属性及外延的关系,可通过显示步长,控制查询结果的展示。

关系&属性查询服务

针对在KGMS图谱管理平台创建的图谱,您可以根据实体及关系,查询某实体符合有某一类或多类关系的全部实体,如:查询出南山区针对火宅场景的全部预案;查询出应急专家为“张三”,且发生时间在2019年的地震情况;

图谱统计

统计符合某一条件的全部实体数、关系、;统计火宅发生最多且救援时间最长的城市;统计各区域台风应急预案数量;

多实体关系发现

找到多个实体之间的关联关系,找到统计路径数或最短路径,作为多实体关系紧密程度的判断依据;最短路径也常用于最短线路规划;

上一篇下一篇

猜你喜欢

热点阅读