为什么现在机器学习突然如此火爆
为什么现在机器学习突然如此火爆
而今机器学习的改进大致在两个方面,一方面是软件,就是算法方面,从最小二乘法出发,到贝叶斯思想。另一方面就是硬件,一是采用并行计算,比如GPGPU,FPGA;二是分布式计算,比如Apache的Hadoop,把任务划分成多个相同的线程,在大型集群中运行应用程序。
为什么现在机器学习突然如此火爆谈机器学习总以为全是那些复杂的数学推导。这倒不全对。大数据有好处也有劣处。好处是海量,而坏处是冗余。你获得的海量数据可能只用一个特征便可实现回归或者聚类。往往将数据输入模型训练前,对数据的准备工作要耗费整个流程百分之八十的时间。
爱上数据,而非学到算法。
在数据处理阶段的硬件层次,曾多采用异构架构进行算法加速。一是多核CPU.二是专用硬件,要么用ASIC流片,要么用FPGA设计大规模并行加速器。而在软件层面,你用Python也好,Java也好,不过是利用架构的接口给你提供了一个易用的框架。
为什么现在机器学习突然如此火爆在统计学看来,机器学习不过是统计学的应用罢了,他们忽视了实际的工程思想,在懂业务的人看来这就是特征学习的大思想,又忽略了数理逻辑。
在机器学习中,赢得胜利不是因为开发出了一个新算法,往往在于对数据巧妙的预处理,归一化,以及组合现有方法。因为实测表明,在数据足够大足够好的的情况下,最终采用不同算法的影响微乎其微。这是数据为王的思想。也是近来数据分析师岗位大热的原因。
为什么现在机器学习突然如此火爆对于我们普通人而言,在开始学习机器学习前总是畏难,所谓困难,总是会者不难。拿数据的思想来看,我们大多数人可能很少有机会成为分子,甚至可能一生都是分母。这里要谈到逆商,就是敢不敢不断接受打击,不断接受不可能,不断逆水行舟。在这个过程中会慢慢认清自己。
选择没有错,初心没有错,更重要的是不能骗自己。努力成为海量数据中那个偏差或者方差足够大的样本,也是很有意思的一生。