元数据和数据元
由于最近在做主数据方面的项目,就去各论坛了解了一下有关主数据的姿势。这次来记录一下元数据和数据元的区别。
数据元(Data element):又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元。在特定的语义环境中被认为是不可再分的最小数据单元。
这个照我的理解啊,应该就是字段了。没毛病。
元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。
列举:
数据结构:数据集的名称、关系、字段、约束等;
数据集就暂且理解为一张表,(名称、关系、字段、约束,可以理解为表的字段、外键关系和索引)
数据部署:数据集的物理位置;就暂且理解为存储在磁盘上的物理路径吧...
数据流:数据集之间的流程依赖关系(非参照依赖),包括数据集到另一个数据集的规则;
质量度量:数据集上可以计算的度量;
度量逻辑关系:数据集度量之间的逻辑运算关系;
ETL过程:过程运行的顺序,并行、串行;
数据集快照:一个时间点上,数据在所有数据集上的分布情况;
星型模式元数据:事实表、维度、属性、层次等;
报表语义层:报表指标的规则、过滤条件物理名称和业务名称的对应;
数据访问日志:哪些数据何时被何人访问;
质量稽核日志:何时、何度量被稽核,其结果;
数据装载日志:哪些数据何时被何人装载;
就上面这些东西在百科上找的,写的比较抽象。以后在用的时候也许就能理解关于数据的数据
这句话的含义了。
数据元一般来说由三部分组成:
a)对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和行为遵循同样的规则。
b)特性:对象类中的所有成员共同具有的一个有别于其它的、显著的特征。
c)表示:它描述了数据被表达的方式。
元数据(Metadata)是描述其它数据的数据(data about other data),或者说是用于提供某种资源的有关信息的结构数据(structured data)。元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
元数据的基本特点主要有:
a)元数据一经建立,便可共享。元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要;
b)元数据首先是一种编码体系。元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。 元数据体系构建了电子政务的逻辑框架和基本模型,从而决定了电子政务的功能特征、运行模式和系统运行的总体性能。电子政务的运作都基于元数据来实现。其主要作用有:描述功能、整合功能、控制功能和代理功能。 由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。
摘自《GB/T 19488.1 电子政务数据元第1部分:设计和管理规范》
再说说两者的区别吧
数据元是用来装载数据的一个数据单元(字段)。
元数据是用来描述数据的数据,包括数据元。