【朝花夕拾】-【经济学人】- 孜孜不倦的机器学习
The learning machine
【The Economist】 April, 2019
翻译练习:青澄青果
(注:本文仅用于英语翻译练习和单词学习之用)




众所周知亚马逊有一个长达六页的备忘录。高管们每年必须写这么六页纸列出年度商业计划。不过不那么广为人知的是其中必须包括一项:如何利用”机器学习“?据亚马逊管理人透露,公司不希望看到的答案是“没怎么想”。

“机器学习”是一种人工智能采纳的通过挖掘数据分析模式从而做出预测的方式。1999年杰夫威尔加入亚马逊时公司开始采用机器学习。威尔如今已经是二号人物,是杰夫贝索斯的副手,他成立了一个专家组专门研究亚马逊的内部程序从而提高工作效率。


威尔将科研人员安插入各个业务部门,把公司的自我评估和改进的循环程序固定化。不久,这个程序就引入了机器学习的算法;第一个算法推荐了客户可能喜欢的书籍。随着贝索斯的雄心勃发,自动化系统的世事洞明也就显得尤为重要。

尽管那些技术巨头们利用一切时机吹捧自己公司人工智能的杰出表现,诸如:脸书的脸部识别软件,苹果的siri智能语音控制功能,和Alphabet的无人驾驶和围棋大师等技术,与此不同的是亚马逊在机器学习方面采取了低调的态度。不错,亚马逊的Alexa智能语言助理是在和苹果的siri抢夺市场,而且亚马逊还在云平台提供预测服务。


但是算法保持公司立于不败之地的关键在于其不断利用信息反馈精简自身运算程序。这个反馈闭环和面向客户的人工智能是同样的:1、建立服务,2、吸引客户,3、收集数据,4、计算机分析和学习数据,其处理数据规模之大已经远非人力之所及。

波特先生的算法
想象一下亚马逊的订单履行中心。亚马逊在北美就有100多个在全球有超过60个这种大型物流仓库,它们是这个拥有2070亿美元在线业务电商的中枢。这些中心存储和发送亚马逊在线销售的产品。在西雅图郊外的一座物流中心里,包裹在运送带上嘁哩喀喳地被高速运送着。


运送带发出的噪音震耳欲聋,整座物流中心中杳无人烟。在一个足球场大小的格兰围起的区域内码放着成千上万的黄色立方体搁架,每个只有六英尺(1.8米)高。亚马逊称之为货舱。成百上千个机器人则忙碌着穿梭于其间,有时滑入底部拖来拖去。

虽然牙膏、书籍、袜子之类的看似被漫不经心地摆放,不过在算法的监控和指挥下所有程序都进行的井井有条。

人工,或在公司的专用术语中称为“伙伴”,则在机器人的围栏场外工作。他们时而捡起机器人送过来的货舱,时而把货舱装满,然后由机器人送走储存。他们每次都要用手中的条形码扫描仪扫描这些货舱和物品,便于软件跟踪系统做出纪录。


负责开发这个算法的人名叫布莱特波特,他是亚马逊的首席机器人科学家。波特的团队就是威尔先生派出的优化物流中心的一队人马。波特专注于处理“货舱间歇”,即指人工等待机器人拖拽货舱到达人工所在工位的时间。

越少越短的货舱间歇则意味着更少的停工时间更快的物流,和更快的运抵客户。波特的团队不断尝试优化方案,但是在付之于实施时则较为谨慎。机器人围栏区域一旦发生拥堵,后果是灾难性的。


亚马逊网服中心则是另外一个核心基础设施。它支撑着亚马逊高达260亿美元的云计算业务,让众多公司无需自备服务器就可以拥有自有网站和运营应用软件。

网服中心主要利用机器学习预测计算需求。当终端客户蜂拥涌入某客户的服务系统时,如果计算能力不足会导致运算错误,如果终端用户打不开页面还会导致丢单。网服中心的负责人安迪杰西说“任何时候我们都不能说缺货了。”

为了保证从不缺货,杰西的团队需要处理客户的数据。亚马逊并不能看到服务器上托管的数据,但是可以观察每个客户的数据流量、在线连接的时长和数据流的稳定性。正如在物流中心中一样,元数据被输入机器学习的模型中,随之就可以获得它的预测,得知何时何地会有客户需求。

网服中心最大的客户之一就是亚马逊自己。亚马逊主业之外最重要的就是预测。客户需求过高,网服中心就设计了新的被称为Inferentia的芯片执行指令来满足需求。杰西认为新芯片可以帮助亚马逊在运营机器学习这个模型时节省成本,同时会吸引客户使用云服务。

杰西说“我们坚信芯片带来的成本节约和效率提高上的改变是数量级的。”Alexa智能语音识别系统将是最大的受益者。

最近尝试算法的是亚马逊无人商店业务。成百上千的监控探头从上俯视监控着客户,同时把图像数据转换为3D图像,可以在客户拿取商品时跟踪他们的手、臂动作。系统可以读取客户拿取的货品,还可以在客户离开商店时列出清单,发送到他们的亚马逊账户请求付款。无人商店负责人底里普库玛强调系统只是在跟踪客户的肢体动作。


系统并未采用脸部识别技术识别他们的身份并关联他们的亚马逊账户。而是通过客户进门时刷一个亚马逊账户条形码完成身份识别的。系统将所有的3D图像归结到这个刷读的亚马逊账户。不得不对机器学习赞扬几句,它们要处理来自上百个摄像头的数据来判断一个客户所购买的物品。所以那些有小偷小摸习惯的人就算了吧,他们还想再偷偷摸摸顺走东西可就哄不了这么聪明的系统了。


人体跟踪系统的技术也在物流中心被采纳。亚马逊正在测试一个内部称作“耐克意图识别”的系统,用于跟踪物流中心的“伙伴”的动作,就像它们检测那些无人商店里的客户一样。系统将检测伙伴捡拾和摆放到货架上的所有动作。

这样就可以摆脱手持条形码读取器。这种人工扫描其实费时费力。如果工人们可以随意随机摆放物品而系统可以读取跟踪,则是最为理想的。效率永远是追求的目标,物流速度最大化一直以来是公司的目标。波特认为”工人们那么做是很自然的事。“

亚马逊在收集客户信息上的谨慎方式使得它侥幸免过一劫,而脸书和谷歌则因此受到政府的审查。亚马逊对于客户数据的收集运算仅仅出于改进客户体验的目的。

亚马逊从不在讨好终端客户和商业客户之间的灰色地带运营。终端用户和商业客户的角度不同:人们希望免费使用社交媒体和搜索功能,广告商已经支付了脸书和谷歌费用,从而商业客户可以使用客户信息。对于亚马逊而言,这二者基本一致,或者干脆就是一样。(虽然它也在考虑广告业务)

监管部门唯一顾虑的是亚马逊在核心业务领域在线销售和云计算的市场支配地位。这种市场支配力是由机器算法帮助建立的,看起来毫无削弱的迹象。
