地震会商技术系统地震数据专家[DataEQ]

DatistEQ之智能解析的三种取值方式

2021-01-21  本文已影响0人  了无_数据科学

在文章《DatistEQ之批量抽取仪器状态数据》中,简单介绍了智能解析节点的使用步骤,大家基本了解了解析模板设计器的使用方法,也让我们初步领略到智能解析强大批处理特性。本文在此基础上,进一步剖析智能解析点的取值方式。

在设计器的取值菜单栏中,有标题、说明块、向下内容、向右内容四个快捷创建取值模板的按键。它们基于数据区浏览区选中的单元格,自动创建相应的字段映射关系。在模板窗口中,我们也可以对自动创建的映射关系进行进一步的修改。

解析模板设计器

智能解析节点将Excel报表,抽象为标题块、说明块和内容块三类数据组织方式。

1、标题块

标题块,在取值过程中,起定位作用。如图中的“一、基础数据”,用于把当前的表单与其它的表单区分开来,但在数据解析结果中。

标题块对非常近似的表单解析有决定性意义。

标题块与说明块

2、说明块

说明块,行列都不具有扩展性,字段仅从表单中取一个值。如上图所示,“开始搬迁时间”对应的数据项目只有一个值。说明块的定义相对简单,一个标题单元格和一个取值单元格。

3、内容块

内容块,行或列具有扩展性,字段仅从表单中取多个值。根据数据扩展的方向不同,可以细分为向下内容和向右内容两个小类。

向下内容块
向下内容,常见的数据组织方式,标题位于表单的顶部,以行为单位组织数据,向下扩展表格的内容。

如图所示,物料的类型、数量、型号、单价等列标题信息,位于表格顶部。向下每一行数据为一个数据记录,表示具体的物品信息,其中物品行是不固定的。

向下内容 向下内容取值结果

向右内容块

向右内容块,以左右结构组织表单数据,标题区位置于表单的左侧,向右扩展,以列为单位组织数据。

如图所示,左侧定义多个物品的标题,右侧给出了每个人需求量,其中人数列是不固定的。

向右内容块 向右内容取值结果

本文对智能解析节点的模板设计过程中,三种取值方式进行剖析,将表单的数据组织方式抽象成三个类别,准确理解了它们之间的差别,才能够真正掌握智能解析节点这把利剑。

上一篇下一篇

猜你喜欢

热点阅读