机器学习中的“理解”

2020-12-18 本文已影响0人也尘

机器学习中的“理解”

机器学习是迷人的，不仅仅因为它是人工智能的一个重要分支，也不仅仅是它取得了诸如Alpha Go等前所未有的成绩，更不仅仅是因为它汲取了数学，统计学和计算机学科等多种学科的精髓，它的迷人之处在于，划时代意义的理念应运而生：先前计算机“被动”接受信息和规则，从而生成结论的过程，被 “主动” 探求解决方案的全新模式取而代之。“学习”这一人类所独有的行为，参与到一大堆的电子元器件中，变革思维方式的同时赋予了机器生命。

毋庸置疑，优秀的科学成就，丰富的社会知识以典籍方式代代传承，人们的观念在互相影响下薪火相传。“学习”，“探索”并没有在继承中泯灭，反而更加凸显出重要和主导的作用，这些富有行动力的词语，使得人们理解社会，懂得他人和自己的行为变得切实和脚踏实地。

在解读机器学习的起源时，有一条理由格外突出：现实世界的情景过于复杂，人们很难总结出表述清楚的规则。人们在试图获取内在关系未果的尴尬境地，由“告诉”转向让机器“探索”，殊不知，这一举动恰恰是回归了人类认识世界的最原始，最朴素，最可信赖的办法。

2017年5月阿尔法围棋（AlphaGo）击败排名第一的围棋世界冠军柯洁，完美收官，走下神坛，进入博物馆。自此之后，机器学习的理念不失时机走到前台，走进人们的视野。

阿尔法围棋是机器学习应用的成功典范。在它的后台，程序员一改往日教习围棋规则的做法，采用让机器研习，浏览过往大量比赛棋局，“自我”总结，掌握取胜的办法。以往的大量棋谱是支撑阿尔法围棋学习的坚实的数据基础。

机器学习的核心使命是：基于历史数据获得“隐藏“在其中的关系，然后利用习得的规则，预测未来数据的结果。

机器学习中的“理解”

“理解”（understanding），“探索”（exploration）是整个机器学习过程中，出现频度最高的词，是再怎么强调都不为过的动作。 “数据理解”（data understanding）是一个非常重要的步骤，它的使命是理解目前所有基础数据的现状，比如数据的分布，格式等等，以此来决定使用什么样的算法，采用什么样的变化，以期达到最好的模型性能。实践而来的经验告诉工程师，成功的机器学习项目至少要花费70%-80%的时间和精力理解和处理数据。大量成熟的算法和工具，使得数据理解和处理如虎添翼，即便是细枝末节，例如空白数据，同样把理解扩展到了极致：数据缺失类型，缺失对模型产生的影响，选取合适的办法去填充数据。防患于未然，从一开始就杜绝”garbage in, garbage out“（中文直白翻译为：垃圾进，垃圾出）。

在机器学习的核心步骤“建立模型”，“理解“更是被发挥得淋漓尽致。算法的设计尽显人们在日常生活中的思维路径：有的模型使用”贪婪“算法，有的算法比较相似性，有的算法设法加大异质的距离……设计使得模型有了更多的信赖基础。

如果说传统的计算机应用是一个板起面孔，强行塞给你已有观点的严肃的“家庭教师”，秉承“我所的是对的”的风格，机器学习更像是一个娓娓道来的咨询师，给你解释每一步的原因和结果：这是我们的数据，有什么样的缺陷，我们将会做什么样的补救，我们这么做是基于什么样的原因；使用这个模型是基于这样的考虑，它会有什么样的优缺点，我们是如何取长补短的；学习得到的关系是这样的，准确度是多少，哪些因素起了多大的作用，这样的结果是否满足要求，这个模型还可以做怎样的调整等等……每一步尽在有理有节的解释中，选择与拒绝，客户真的可以心悦诚服。

在最后，用一个小小的例子结束机器学习如何专注于“理解”。故事讲述的是德国和美国的自动驾驶团队在设计紧急避让时的分歧：德国团队倾向汽车失控时撞向少年，避开颤巍巍的老太太，他们的理由是保护女士优先，而美国工程师直接把汽车指向老太太，他们在强调利益最大化，年轻人的未来优先于生命将尽的老人。

闪烁着主观能动的活力和人文情节的智慧在机器学习中随处可见，未来会因更多的“理解”而美好！

机器学习中的“理解”

机器学习中的“理解”

猜你喜欢

热点阅读