当机器也会学习时,你呢?
学习有用吗?
学习确实是人类文明发展过程中最神秘也最引人入胜的话题之一,尽管我们每时每刻都在学习,却也无法给出一个精准的定义。很多人说八零九零应该是被学习这个小妖精整蛊整的最惨的一代。小时候,老师会告诉我们好好学习将来能当好社会主义接班人。长辈也会说好好学习,将来你的生活会好得多。于是,我们就曾天真的在认真写作业背课文和当社会主义接班人之间建立了一个含糊不清的心里联系,虽然说从来没人提过具体的接班流程,但我们很清楚作为接班人的收入肯定不低。二三十年转瞬即逝,无数曾经被冠以种子选手的大学毕业们窝在北上广深N+1环外的出租房里百无聊赖地刷着微博朋友圈。看着当年班里那位不学无术的杀马特现在正戴着青年企业家光环与媒体记者笑谈着B轮C轮IPO,苦涩与无奈又一次涌上心头。说好的接班人身份迟迟未来,能收到的是房东催缴房租的最后通牒和银行无比友善的扣款通知。学习到底有用吗?
八零九零的确是人类发展史上最理智的一代,互联网技术革命引发了空前的信息大爆炸,进而激发了个体主动求知的欲望。同时,可接触信息量和信息传递渠道的大幅增加也在进一步强化着个体对信息有效性和真实度的判断能力,这也是使得八零九零后的一代更具判定是非能力,也更加明智的重要原因。尽管蜗居陋室,尽管无房无车,但无数年轻人依然能做到在创业和事业的道路上坚守职业理想,坚持终身学习。这确实令人钦佩。
信息时代下的学习
毫无疑问,学习是有用的,至少我们大家都还坚信这一点。这个世界想活下来很容易,难的是不断地实现和坚守职业理想。其实达尔文进化论的基本原则同样适用于职业发展领域-适者生存。在信息化和全球化的作用下,产业和技术更新换代的速率已远远超过从前任何时期。比如,东罗马帝国依靠希腊火和坚固的君士坦丁城墙能压制对手近千年,大英帝国靠大舰巨炮这一成不变的制胜法典也称洋霸海数百年。而今天,一个逆向工程也许就能把美帝的全球鹰无人机克隆出来,IPhone才发展二十多年便已强敌环伺,Uber还没能在大陆一展身手就转头把业务抛给滴滴。在这个信息技术大革命时代,谁也别想一劳永逸的牛逼下去。只有如同饕餮吞食一样永不停息地从外部市场吸取信息,甚至是主动拓展并向外部推广知识,个体才有可能在知识竞争的丛林中不断生存下去。既然是讲生存,那就一定要有方法,每当你遇见一个比你更优秀的人,他到底有什么与生俱来的聪慧和运气呢?
命运这个话题我不敢臆断,毕竟我们的已知科学相对于整个宇宙发展而言,连微粒估计也算不上。但我相信智慧和视野一定与信息的获取有关。但这里指的的是对未来有用的准确信息,如果你的前辈只是单纯地告诉你要听他们的经验和建议却说不出所以然来,亦或是他们自己久未暴露在现代市场环境之下,我觉得他们说的话你可以听听就好了。是的,你需要前者的建议去获取信息资源和思考方法,但更要把目标集中到那些在当下市场上取得一定成就并能坚持拓展出新知识领域的行业前辈身上。另外,有人要问我了,既然你说智慧与信息的获取有关,我在这个程序员职位上写了五年代码,也写了五十多万行,也没事就去创业咖啡坐坐和大牛聊聊风投和想法之类的,你说为啥员工配股,加薪升职都没我啥事? 可事实是,你就是再写100万行代码估计还无济于事,为啥?您干了六年一直用着同样的算法和套路,您写的文档已经过时到大家不翻看点历史文献都看不懂的地步了,别人用一年就学完了您六年才积累下来的那点经验。还记得史总在今年早些时候提过要赶走巨人里的老兔子吗?不主动去迎合外部市场的技术趋势,那只能迅速沦为知识丛林中的一只兔子。其实这种残酷的竞争只是基于一条很简单的市场准则-公司收益最大化。不能带来最大化收益,那就只有被淘汰。外部市场行情很复杂,但规则也很简单粗暴。没错,也许你真的可以去抱怨企业家为了利益最大化而不讲情面,但你唾弃的资本家们已经在继员工和用户之后,把“剥削”的重点拓展到机器身上了。
来自机器学习的启示
由于职业的关系,我常常在思考学习到底是什么,其实,学习应该是一个认知世界的流程,在认知过程中,个体主动或被动获取的信息被存入大脑中的数据库,在日积月累的过程中,大脑主动形成了一系列思维习惯,进而帮助我们对信息进行归类和判定,当然这种判定和归类也会基于一定程度上的主动推断(猜测)行为。比如我们看到小孩画的老鹰知道这是老鹰,尽管很抽象但我们依稀可分辩,基于印象中的老鹰形象,我们推断出这很有可能是一只老鹰而不是一只猴子。当你问小孩这是不是老鹰,而小孩如果说是的话,这就是一次成功识别。同时,这一次的成功识别又会进一步强化你对老鹰这个概念的认知。当你下一次看到差不多或更加抽象的老鹰图像时,你也会判定出那确实是一只老鹰,而不是一只猴子或其他的东西。更有甚者,如果你对老鹰这个概念的理解足够深的话,你还能进行更详细的判定,比如说种群之类的。这就是信息认知和认知强化的循环过程,也是我们学习的过程。随着信息技术的发展,我们人类终于把机器也纳为知识传授对象。2012年后各种关于机器学习的论调喧嚣之上,一夜之间,似乎所有的App应用供应商都在谈论这个有趣的问题 (真心不知道这是否和2012人类末日的预言相关)。
首先,我们想通过机器来完全模仿大脑是不实际的,人脑的神经元个数达到150亿以上,有报告甚至称会出现200亿的情况,而即便是加州理工实验室里的大型分布式电脑也只能模拟亿量级的神经元。更别说人类自己对大脑机理的研究到现在也只是摸索出冰山一角。所以现行的机器学习只限于提高系统对部分事物的识别能力, 而很难加载主观判断意识,而那些基于心灵的潜意识则更加无法被系统模拟出来。当然,说到这里,大家也不用担心自己未来会被机器取代,但这里想强调的一点是:我们可不可以在探索机器学习的道路上,也为人类本身找到一些有效的学习方法和理念。
现有的机器学习理念主要有三种:有监督学习,无监督学习和强化主动学习。有监督学习的原理流程如下:
道理很简单,有监督学习本质上就是一个求出函数(思考模式)的思想,我们先将用于训练的数据D,预设结果B(专家知识经验等),和特征X,输入系统,让计算机反解出一个函数分布(思维模式和流程) y=F(X)。在输入了一系列的判定流程(函数)后,计算机被动形成了一个思考模式,当我们再重新输入来自真实世界的数据时,计算机便能够根据输入变量X,求解Y的值(判定结果)。这种思维很类似于幼儿的学习过程,需要依赖人进行主动的引导,并输入大量的现有数据和预设结果。实现监督学习所需的技术目前相对成熟,可是人类自己都没有能力去预知所有的情况,机器又如何知晓呢? 而且依靠计算机自主获取外部数据并经行全面分析和判定的无监督学习现在还无法实现。怎么办?这就引出另一个解决方案,强化自主学习,即通过引入较少量的数据,帮助机器先找到分析目标的特征(如行为)和结果之间的联系。具体来说,就是通过引用贝叶斯分析框架,先给定尽可能多的预设结果,后面再根据现实世界中的数据分析,给程序注入各种结果发生的可能性(后验概率),而后让计算机具备基于概率推断结果的判定能力。比如前文中提到的关于猴或鹰的判断本质上就建立在对概率的分析之上。现实中这种思维的应用领域很多,比如,某学习平台想为其用户推荐偏好内容,那么我们就先要搞清楚数据库中与该用户行为相关的数据里是否具备某些规律(比如,浏览的主题,发布者,关注者,浏览频率,互动参与度,评论内容等),这就是可以用强化自主学习的思想去解决的问题。
从上文其实可以看出机器学习有两个重要的组成部分:判定思维(函数)和数据,而不管是主动学习还是监督学习,数据量与判定流程的存量对机器判定结果的准确性具有决定性的意义。我们已经谈到过,人脑要比计算机复杂的多,同时也具有更强的感知能力,那么机器获取人工判定思维的方法是否也可以应用在我们自身的职业学习过程中呢,当然,人非机器,但知识判定的原理相同,都需要丰富的准确信息和辨识外部环境对个体影响的能力。知识科技的年代,信息是存在于人类社会中最广泛的资源,但正如我们之前提到的那样,只有精确的,最贴近外部真实市场的信息,才是我们应该积极获取的。还是那个猴子和鹰的例子,如果你的前辈从小就向你灌输错误的认识,比如,告诉你这就是猴子,且通过强硬的惩罚措施(如再错打手),来强化你的认识,你日后又如何能进行准确辨识。
另外一点就是要强调及时更新思维和知识渠道的重要性,就机器而言,由于外部市场在快速变化,用户偏好也在以更快的速度向前移位。如果这个算法或判定流程已无法精准定位客户偏好,那么这个判断程序就有待被重塑。这道理同样适用于职业学习。学则立,怠则废,技术信息要更新,思维方式和信息获取渠道也要及时更新。当然,这也正体现出终身学习的重要意义。其实职业学习中没有太多的好习惯或坏习惯之分,能做到坚持接纳和使用多样的信息获取渠道,坚持学习不同的思维方法,坚持获取并思考不同行业领军者的建议。这就是学习过程中最有效的好习惯。