数据质量

大数据Clouder认证:使用MaxCompute进行数据质量核

2018-03-12  本文已影响0人  柠檬红茶cc

数据质量基本介绍

什么是数据质量?

什么是数据质量管理?

为什么进行数据质量管理?

数据质量影响因素

数据质量问题类型

阿里云相关产品介绍

大数据计算服务MaxCompute

大数据计算服务(MaxCompute,原ODPS )由阿里云自主研发,提供针对TB/PB级数 据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。阿里巴巴的数据业务都运行在ODPS上。

数据开发Data IDE简介

大数据开发集成环境(Data IDE) ,提供可视化开发界面、离线任务调度运维、快速数据集成、多人协同工作等功能,为您提供一个高效、安全的离线数据开发环境。并且拥有强大的0pen API为数据应用开发者提供良好的再创作生态。

Data IDE操作界面

MaxCompute除了提供MaxCompute Studio客户端、odpscmd客户端进行开发外,还提供另外一种更为方便的操作界面DatalDE,DatalDE包含可视化的工作流界面及周期性任务调度、监控报警等,一方面降低用户使用ODPS的使用成本,一方面可以使用ODPS强大的大数据处理能力构建大数据云数仓。

Datal DE开发操作

通过DatelDE来实现数据质量监控,首先使用PC登录阿里云网页,在控制台里,选择大数据开发套件功能模块,选择对应的项目,进行开发操作。DatelDE主要包括数据集成、数据开发、数据管理、运维中心、项目管理、机器学习平台等功能模块,此次数据质量核查主要涉及数据开发、运维中心两大模块。

上一篇 下一篇

猜你喜欢

热点阅读