大数据,机器学习,人工智能玩转大数据大数据

数据产品经理入门必备一:需要掌握的专业名词

2020-04-04  本文已影响0人  DataToValue

数据产品经理入门从哪里开始呢,无分先后,有两部分知识是必须的,一是了解数据产品搭建的过程,二是掌握和熟悉工作中常用到的专业名词。

熟悉专业名词的一大作用,是日常跟业务方调研、产品内部讨论、技术团队沟通过程中,不会显得行外人听不懂,闹出笑话。

今天为大家介绍入门必备的一些常用名词,详细的汇总可以参考下图,以及平时更多的学习积累。

产品相关名词:

需求调研:针对需求对业务方进行调研,了解用需求背景、价值、痛点、应用场景等,是一个产品项目的开始阶段,也是极重要的环节。

BRD:商业需求文档,全称为Business Requirement Document,是基于商业目标或价值所描述的产品需求内容文档,其核心的用途就是用于产品在投入研发之前,由业务方对是否有价值进行决策评估。

MRD:市场需求文档,全称Market Requirement Document,属于产品项目过程中的“过程性”文档,一般由产品经理来撰写,起一个“承上启下”的作用,“向上”是承接业务方需求,介绍解决思路,“向下”是给开发团队讲清楚产品项目的价值。

PRD:产品需求文档,是将商业需求文档(BRD)和市场需求文档(MRD)用更加专业的语言进行描述,把业务需求转换成产品设计文档,让开发团队能够看得懂。

UI:用户界面设计,User Interface,指对产品进行交互、操作逻辑、界面美观的整体设计。

联调:主要指前后端接口联调,即各开发团队把前后端代码调通。

提测:开发完成后提交给测试同学。

测试用例:测试人员根据产品经理的PRD所撰写的测试流程及事项。

设计走查:设计师针对前端交付的线上系统,与UI设计进行比照和检查。

技术相关名词:

API:应用程序接口,全称是Application Programming Interface,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问原码,或理解内部工作机制的细节。

JSON:JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。

E-Charts:是一个使用 JavaScript 实现的开源数据可视化库,涵盖各行业各类型图表,非常强大。

Highcharts:是一个用纯JavaScript编写的一个图表库,能够很简单便捷的在web网站或是web应用程序添加有交互性的图表,并且免费提供给个人学习、个人网站和非商业用途使用。

Ant Design:是一整套企业级UI设计语言和组件库,支持react.js、vue.js、angular.js,更多工具大家可以自行探索。

数据相关名词:

数据仓库:Data Warehouse,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建,为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制和提高收益。

ODS/DW/DM:数据仓库的整理架构,各个系统的元数据通过ETL同步到操作性数据仓库ODS中,对ODS数据进行面向主题域建模形成DW(数据仓库),DM是针对某一个业务领域建立模型,具体用户(决策层)查看DM生成的报表。

OLAP:联机分析处理,OLAP是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。与OLTP(联机事务处理)相比较,OLAP更强调大数据量的数据分析。OLAP的基本分析功能有上卷、钻取、切片/切块、旋转。

Kylin:是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。Kylin提供与多种数据可视化工具的整合能力,如 Tableau,PowerBI 等,令用户可以使用 BI 工具对 Hadoop 数据进行分析。

Hadoop:Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce。HDFS是一个分布式文件系统:引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode,对数据进行分布式储存和读取。MapReduce是一个计算框架:MapReduce的核心思想是把计算任务分配给集群内的服务器里执行。通过对计算任务的拆分(Map计算/Reduce计算)再根据任务调度器(JobTracker)对任务进行分布式计算。

HIVE:HIVE是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。

机器学习模型分类:机器学习领域主要有以下三种任务类型,监督型,半监督型和无监督型。监督学习的目标是学习一个函数,已知该函数的样本数据和输出值的情况下,尽最大可能拟合输入和输出间的关系。半监督学习旨在使用从少量标记数据点所学的知识来标记未标记的数据点。无监督学习中不存在标注过的样本输出值,因此其目标是推断一组数据样本中的内部结构。

无监督模型:无监督模型发现数据内在结构。无监督学习中最常见的任务是聚类,表示学习和密度估计。在这些任务,是希望在无明确提供的标签的情况下了解数据的内在结构。常见的算法包括k-means聚类、主成分分析和自动编码器。由于没有提供标签,因此在多数无监督学习方法中没有用于比较模型性能的具体方法。

监督模型:监督学习模型拟合输入与输出。当我们想要将输入映射到输出标签或回归,又或是将输入映射到连续输出,监督学习通常将其作为分类任务完成。监督学习中的常用算法包括逻辑回归、朴素贝叶斯、人工神经网络、支持向量机和随机森林。在回归和分类中,目标是找到输入数据的特定关系或结构,以便有效地生成正确的输出数据。

半监督模型:学习未标记和标记的数据点。半监督学习介于监督和无监督学习之间。半监督模型旨在使用少量标记的训练数据和大量未标记的训练数据。通常用于标签数据价格高昂和或有恒定数据流的情况下。

一些商业数据产品:

Google Analytics:是Google的一款免费的网站分析服务,功能非常强大,只要在网站的页面上加入一段代码,就可以提供丰富详尽的图表式报告。

Growing IO:是基于无埋点技术的用户行为分析数据产品,提供数据采集和分析技术,由前 LinkedIn 美国商业分析部高级总监张溪梦创立。

Power BI:Power BI是由微软推出的一整套商业智能解决方案,它能够挖掘数据中的信息,快速准确地生成可以交互的可视化报表,从而帮助企业做出明智的业务经营决策。

Tableau:Tabeau是世界上最强大的用于可视化分析数据的商业智能工具,致力于帮助人们查看并理解数据,快速分析、可视化并分享信息。

Data To Value,致力于数据产品领域的分享和交流,用数据创造价值。欢迎关注!

上一篇下一篇

猜你喜欢

热点阅读