序章(2)“电子石器时代”

2019-03-13  本文已影响0人  BA蓬莱传说

美国StarRaiser战队的配置,已经几乎成为了全球数据科学战队的蓝本,成为一种模式化的定义。

StarRaiser Config:

Jason Smith(STA):队长兼任statistician,负责提供统计学原理、模型支持。

Horris Chan(SCR):Scraper。负责全网数据抓取,应对各大数据门户平台的反爬措施有丰富的经验,擅长大规模分布式爬虫项目开发与部署。

Leon Tensor(MLA):Machine Learning Algorithm。负责模型训练、优化、调试工作,对于现有模型有着深刻的认知,并且具备自主开发新模型的能力。

York Williams(HE):Hardware Expert。负责底层优化设计,从硬件层面对算法性能做进一步提升,喜欢越过操作系统,自己调度CPU任务。


    “丫的,这不是宇宙梦之队吗?还玩什么呢?”

    于嘉麟放下还没组装完的主机,把视线投向外面的全息投屏。

    与杭州直线距离1200公里的北京,黑色的钢铁巨人林立,阳光静静地照着这个曾经古色古香、别有韵味的城市。

    行政区划改革已有几十年的时间,北京除政治以外的其他职能已经差不多悉数分散到城区周围的卫星地带,人口也不再那么拥挤。西三环、四环之间的一个特殊的地方——人们至今仍然喜欢管它叫“中关村”——仍然留在了这里。蓬勃的创业公司在资本之间迂回,死的死,跑的跑,有的则成为了钢铁巨人中的某一个,进行着新一代内核的研发,又或者是分布式计算的研究。大规模集群之间的同步,资源调配与性能优化……还有一堆棘手的问题,还有很多新兴的领域,还有很多热钱可以挣,还有无穷无尽的人想要搭上时代的顺风车。

    智院三年级生,于嘉麟,在这里找了一份组装和调试主机的实习。

    计算设备仍然基本没有跳出冯·诺伊曼体系,但是设计框架已经发生了翻天覆地的变化。由于大量的数据和资源被存放在云端,PC主机变得轻捷很多,不再有大量的卡槽和乱七八糟的总线系统,也没有各种花里胡哨的外部设备和人体学输入设备。取而代之的是,充分忽略自己身为PC的主体,而突出云社区下一个“终端”的角色。换句话说,PC的网络发现功能和数据通讯能力更加强大和完备。此刻在于嘉麟组装的主机中,肉眼可见的主要元件只有两个:一个是由中科院计算所主持研发的ICTCAS-XX60,业内交流一般称为”蚩尤2060“机芯;还有一个就是基于新一代https协议的无线网卡,与传统的https不同,传统的Secure Socket Layer是需要申请证书以证明服务器的用途类型,当证书与服务器相符的时候,客户端才会选择信任并进行握手过程,进行数据包加密传输。但新一代https协议中,安全证书是动态的,每次链接将会生成一个临时uid用于签名。带宽总没有够用的时候,在这个数据总量几乎不可数的年代,安全性的需求被提到了前所未有的高度。数据即是资源,数据即是金钱。即便开源和共享仍然是珍贵的精神,但海量数据若被用作歪门邪道,后果不堪设想。

    至于在那个时候,在几十年前,“云”是点状的,提供云主机的互联网、通信公司利用自己在世界各地的服务器设置节点,供用户部署自己的网站、应用程序和服务,其实叫做“远程主机”更为合适。CPU的设计制造由Intel,AMD等公司垄断,x86指令集是计算机的最高原则。互联网产业被几大巨头瓜分,中小企业纷纷进行站队,形成一个又一个派系,尽管他们在许多业务上都存在着商业竞争。而又由于电脑不够便携,人们还离不开执行通讯功能的手机,尽管手机的通讯功能已经被极大地淡化,变成一个娱乐工具。大量的电子设备从厂里喷涌而出,又从人们手中变为电子垃圾变成废品回收难题。到处都是学术处女地,甚至于像无监督聚类这样的问题,随便在算法中改个距离的描述方式,就能发一篇核心期刊文。各种技术迅猛发展,迅猛到几乎粗放,互联网产业热钱大量涌入,势头远高于其他传统产业,无论是投机者还是即将踏入社会的学生,人们纷纷一股脑扎进这团泡沫中,追寻着一个个名词,狂欢,每个人都认为自己在向未来进发,下一秒说不定就能创造奇迹,将科幻片中描绘的壮丽景象变成现实。

    这个疯狂又有点错乱的年代,现在被人们称为“电子石器时代”。对传统硬件仍然有很强的怀旧和执着,对于计算机与互联网、甚至是代码本身极为狂热的人,人们喜欢把他们叫做“电子石器时代原住民”。

    于嘉麟勉强算一个。

    即便是在智院这样的地方,像于嘉麟这样有实际动手装机能力的人也是少之又少。因为人们认为这种能力是廉价的,是不必要的。绝大多数人都认为,计算机和代码只是工具,并且永远不可能摆脱工具的属性。像电子石器时代那样把时间花费在工具本身上是错误的做法。在这种思想的影响下,大多数的开发者都只活跃在应用层面,对于底层知之甚少,甚至不会去自己敲代码,因为5GL人工智能自动生成代码构建项目大行其道,并且这样的框架和开源实现汗牛充栋。这大概也是为什么量子计算时代迟迟没有到来,冯·诺伊曼体系迟迟没有被突破的原因。

    就像是小孩子们从小就学会了在电子设备上打游戏,像于嘉麟这样喜欢搭积木的孩子,就只能一个人玩。

    “不过话说回来,StarRaiser的HE真是厉害过头了啊,竟然会精细到自己去手动调配每个任务”,于嘉麟一边嘟囔着一边把机箱盒盖上,翻来覆去的摆弄。

    在StarRaiser的世界一线劲旅中,HE的角色常常没有那么光鲜亮丽,但叫他们“无名英雄”似乎并不为过。底层上的突破,有时就好像推倒了一面墙。队员们围绕算法不厌其烦地折腾,试图使其收敛到全局最优,对0.000001的提高也会谢天谢地。但底层的临门一脚,可能让整个计算过程的速度有质的飞跃,并且有可能做到让输入、训练、预测完全并行,实现真正意义的”Online Learning“。

    无名英雄很重要吗?对于战队而言,当然,对于观众而言,可有可无,对于幕前英雄而言,不值一提。

    尽管许多战队都急缺高水平的HE,但没人喜欢吃力不讨好,更没人喜欢默默无闻当韭菜。就像电子石器时代,对于高级技工的长期需求紧缺一样。

    “要是能像王巡方老大哥一样有能力solo,就好了。“于嘉麟今年大三,却还没有参加过一次DCWC。对于智院的学生来说,这无疑也是一个流动着财富,闪烁着荣耀的party。

    快要毕业了,于嘉麟能肆无忌惮地做自己喜欢的事的时间越来越少了。

    北京中关村,冷酷的黑色钢铁矗立,但没人知道这里建筑里的人在想些什么。是各怀鬼胎,还是各抱其志。没人知道。

上一篇 下一篇

猜你喜欢

热点阅读