“火炬上的深度学习”之缘起
无论你愿不愿意,人工智能时代都已经来临。
从一开始,这个时代就展现出了一些不同寻常的特征。比如,如今的学术发展前沿已经从高校和研究院所转移到了科技巨头企业;再比如,一些人工智能创业公司在进行基础科学研发。这里面最典型的代表就是Google旗下的Deep Mind公司,他们简直就是一支基础科学研究团队,而不像商业公司。同样的道理,人工智能的教育和培训也存在着许多与以往的教育和培训不同的地方。
说起人工智能培训,我不得不对如今所呈现的这种鱼龙混杂的状态感到忧虑。目前,绝大部分人工智能培训都可以分成两类,一类是响应国家号召,面向中小学的人工智能教育。说实在,这类教育可能更多地应偏向于编程或机器人教育,而这和人工智能还是是两码事儿。由于目前的人工智能开源工具尚没有出现类似Scratch这样简化的平台,所以要让小学生学会使用TensorFlow还有相当长的路要走。
另外一类就是面向IT工程师转型的教育培训。这类培训面临的一个最大问题就是到底教什么、学什么?学算法吗?可是如果你真正接触人工智能的相关工作就会发现,绝大多数公司需要的并不是开发算法的人,而是那些清洗数据、处理数据、有丰富调参经验的工程师。换句话说,真正应该教的,面向就业的东西就应该是各式各样的清理数据、调参的工程经验。然而,这些东西又是很难用授课的方式来教的,因为面向毫无经验的学员,你罗列了一套一套诸如Dropout、BatchNorm等技巧不仅对他们毫无用处,反而会让他们感到厌倦。
那就带着他们做项目呗。对于一个师徒制的小团体来说,带着几个学生承接一个项目来做应该是没有问题的。但是,这似乎并不能算是教育或培训了,而更多的是工程开发。所以,Kaggle选择的就是数据科学竞赛这种形式来对接产业中的项目需求和需要练手入门的程序员们,而没有走培训教育的道路。(www.kaggle.com)
正是对这些问题的思考,以及目前人工智能培训中的痛点,我带领着集智AI学园的小伙伴们开发了《火炬上的深度学习》课程,尝试为人工智能教育提供一套不同以往的解决方案。我认为人工智能教学更主要的不是算法,更不是只有在实际的工程中才能用得着的那些优化Trick,而是对算法更深层次的理解以及对实际问题的建模思路。当你能够在更高的维度掌握算法和建模思路的时候,你就会自然知道如何来套用哪一系列的优化技巧来解决问题,因为你已经从本质上对人工智能有了透彻的了解。
比如,在《火炬课》上的《单车预测器》一节之中,我讲解了如何解剖一个简单的神经网络。
通过手动编程,我们可以窥探一个神经网络内部的运作机理,从而发现什么时候神经元会被激活,以及它所对应的数据之中的特征会是什么。这一节的内容受到了学员们的一致好评。对神经网络的解剖不仅仅破除了他们头脑中无法打开神经网络黑箱的迷信,也帮助他们更透彻地理解了神经网络是如何绕开传统的If else编程,而实现从数据中自动探测模式的。
面对大部分学员都缺乏实操经验的问题,《火炬课》为他们精心设计了一系列小项目。这类项目首先与真实工程非常不同:你不需要超大规模的运算和数据就能解决,甚至可以在自己的笔记本电脑上跑一两小时而完成;另一方面,这类项目又具有足够的难度,以使得你必须掌握一定的技巧,对相关算法和技术理解到一定程度才能完成。在科学中,这种项目被称为最小模型,我们就是让学员进行大量的最小模型训练从而理解深度神经网络的工作原理。
换句话说,我们的课程更注重站在第一性原理的角度来思考人工智能,而不仅仅是对它的简单应用。
我认为,这种具备了基本分析问题素质的人才是人工智能时代最稀缺的人才!
也许你会说,我不需要理解原理,只要懂得如何调用那些机器学习平台不就可以玩转深度学习吗?为什么非要懂得里面的原理呢?如果你真的实践过深度学习项目就会发现,编写一个深度学习算法最主要的工作就是把数据转换成神经网络能够处理的张量,而你所要做的就是根据不同的实际问题选择不同的数据形式。这一看似不起眼的步骤,在很大程度上决定了你模型的效率。就比如说,给你一串字符,你用什么张量形式喂给神经网络呢?你可以选择独热编码的方式,也可以先将字符嵌入为向量,还有可能简单的采用词带模型来描述它。不同的方法会因条件、问题而异,也会深刻影响到后续问题的解决效率。
在《火炬》课中,我会突出另一个重点是,要学会将表面不相关的问题全部转化成标准的机器学习问题,从而用现成的模型来解决。未来,我甚至想专门设计一门课就叫做“机器学习建模”,它与传统的数学建模课很像,但不同的就是我们的模型全部都采用机器学习。
也许你会嘲笑我说,这种教学方法过于书生气。真正热爱研究探索的人才不会用你来教,人家早就自学成才了;抑或是那些工程师需要的就是混口饭吃的技术,而不需要更多理解理论层面的东西,所以你的课不会有市场。
从我接触到的学生、学员还有更多的集智粉丝来看,事实并不是这样的。有很多高校中的研究生甚至博士生完全学不到类似人工智能、大数据这样的知识。高校中的课堂内容绝大部分还是相当陈旧的课本知识,而且大部分都过于强调理论而不是实战。所以,这些中国的“精英学子”并不像我们想象的那样风光,他们对业界的最新技术与工程师们一样渴求。
另一方面,我接触过的好学的工程师比比皆是。有太多的人不满足于掌握简单的技术,他们更对基础科学充满了好奇和兴趣。现在这个时代技术更新太快,无论是多么高的高手都会有一种焦虑感,这种焦虑促使他们开始反思从工程化思维到科学思维的跃迁。
我们的课程满足了这些人的需求,而我认为这样的人必将会成为未来中国创新式社会的主流。
我坚信就像人工智能时代终将取代互联网时代一样,未来的高科技行业会越来越多地体现出基础研究和应用研究再到市场的无缝融合。这意味着,科学研究的能力将会更加平民化。未来,小学生就足以撰写像模像样的科研论文。我力图做的事,也正是将这种科研能力尽可能地赋予更多的人。
微信公众号:swarmAI
集智AI学园QQ群:426390994
学园网站:campus.swarma.org