Spark权威指南读书笔记(六):高级分析与机器学习
2020-12-06 本文已影响0人
kaiker
高级MLib概念
转换器
是将原始数据以某种方式进行转换的函数,归一化、与处理都由转换器进行
估计器
可以作为数据初始化的转换器
基于数据训练模型的算法也称作估计器
评估器
允许我们根据某种效果评价指标
流水线
流水线允许设置相关转换的数据流,并以估计器结束
流水线式机器学习工作流
是将原始数据以某种方式进行转换的函数,归一化、与处理都由转换器进行
可以作为数据初始化的转换器
基于数据训练模型的算法也称作估计器
允许我们根据某种效果评价指标
流水线允许设置相关转换的数据流,并以估计器结束
流水线式机器学习工作流