AI 项目落地应用指南--序

2020-01-17  本文已影响0人  lonelygo

本系列文章原文发布于Github,感谢Star,欢迎Fork与PR。
GitBook提供了更好的阅读体验。
知乎专栏会首先更新。

同志们可以不点赞不关注,但是有好工作机会可以推荐的嘛,欢迎私信,不要矜持、不要害羞啊,哈哈哈。

前言

离开老东家快一年了,在半休息半工作的轻量负荷下,终于可以系统的做一点事情:1、把快给管理荒废了的撸码捡起来;2、补补DeVOps这条Pipeline各种工具生态发展;3、看看React,VUE,Flutter这些之前根本没有精力去看的东西;4、从数学到理论系统性的看看DL的东西;5、看心情,瞎琢磨。

同时,在各路猎头的热情对接下,和一些国内AI领域的公司有过工作岗位的沟通与面试,基本上分为以下几类:

也算聊了不少家,皆无果。究其因,无非就是人家看不上我我看不上人家这两种。

一方面年龄40+,在当下这个环境,这是最大的竞争劣势;另一方面多年的工作重心在产品、架构、项目以及技术管理上,写代码这件事基本给废了;再一方面,虽然16年开始上手AI,Demo也一手做出来了,项目也交付了,但不是科班,显然没有扎实的DL基础;最后,怎么说呢,也许就是个靠嘴干活的渣渣。

所以我关注的机会,更多的是需要技术支撑的高综合技能要求的方向,而不是“计算机视觉研究员”、“高级程序员”这种明显力不从心的岗位。实际的无果原因基本是:大多数沟通或者面试,聊着聊着要么“跑偏了”,要么实在是无法继续下去了,继续下去只能是互相浪费时间,只能想办法快速结束,具体有以下几种情形:

其实,所有的面试,我都是做好准备“”在DL的算法、框架、超参和手写代码的问题上。但,很不幸,这些问题真不多,只有一次,Caffe大概看了看,没实际用过,问题确实不知怎么回答;没有一家对我之前落地的项目感兴趣,详细追问一些工程、产品和算法实现(调参、backbone network的选择依据,这些还是有人问到的)以及对项目的复盘与反思等。对此,略感惊讶。

五年前,不提Big DataHadoop出门都不好意思跟人打招呼,这两年公司不想办法往AIBlock Chain方向靠,都不好意思更新网站,在这个热闹非凡,热点轮转的时代,以上种种意想不到的情况,在一定程度上来说,也是必然。

之前2、3年基本少有人对 AI 落地非常关心,“豪华团队 + Paper + 比赛刷榜”就是一个团队最好对背书,不管是谁的钱,投资总是需要考虑回报这件事的,在大方向都转向比拼落地能力的2019年,为什么没有感觉到这个行业对于落地的急迫,依然有对豪华团队的迷之自信,可看看知乎的这个问题:清华AI四大公司PonyAI、RealAI、Face++、商汤未来能否达到Google、微软的高度?。必须要说,对于这些横跨学术与产业的顶尖人才的贡献,我是无比敬佩,IT领域也算混了二十年,从来没见过哪个方向有如此强大的开源与分享动力,框架、论文、实现代码、权重与参数(预训练模型)大家你争我抢,毫无保留的都给社区随便用,Google的推动更是不可忽视(从开源协议来说,大多都是没法商用的,比如ImageNet下载申请协议的第一条就是Researcher shall use the Database only for non-commercial research and educational purposes,做CV的有几家能全部避免使用ImageNet的相关产物?为了下数据集,找在学校任教的同学、朋友借edu邮箱,前几年估计很多产业界的人都干过这样的事情)。用半年业余加班时间就能从0开始做出检测算法,跑出来Demo,活着爬出销售挖的坑,没有这些开源分享,就算有“飘柔”般的自信和“梁静茹”给的勇气,这事情也是想都不敢想的。

其实,对于非AI领域的公司积极拥抱AI,出现的各种理解与认识偏差,是能理解的(毕竟,我就是摸着石头一步一步往前走的),但是对于Scientists坐镇的AI公司,现阶段也不缺钱,工程化、产品化落地情况依然不乐观,这件事我是有点困惑的。

对于AI的落地,我相信,一定会有:“训练几个 model 搭几个 inference 的 APIs,业务去调用不就好了么?”这样的简单想法存在。我的理解是:对于AI这个“边缘”技术领域,如何从解决一个特定问题的构想到最终的工程化落地的产品、项目,虽然看起来都是写代码,但是和我们传统的软件开发过程、产品思考、交付能力要求相比,还是有较大差异的。

基于自己的理解,结合近期与微信群、知乎上的一些“陌生人”聊天过程中的收获,以及工作以来对售前、产品、研发、咨询、交付与技术管理的认识与实践,入门DL后的学习探索与项目落地交付实战,还有近一年来较为深入的阅读、学习与思考,把我对于如何实现Shift AI models to real world products的一孔之见与相关实践经验组织为一个较为系统的知识体系回馈给社区,同时,我相信写作过程也是对相关知识领域的认知程度的梳理与再学习过程。

考虑到我的知识背景局限性(熟悉B/G项目和产品,略懂CV和监督学习),所以内容和其中的一些建议与案例,更倾向监督学习、CV在B/G端的产品与项目落地,对于机器学习的NLP、RL等领域以及像推荐算法这些在线学习的互联网方向的应用,争取也能做一些建议。

最后,笔者才疏学浅,文中难免有错误、偏差与疏漏之处,望不吝指正与补充。

目录

一、概述 - Draft completed

二、机器学习项目过程 - Draft completed

三、机器学习项目团队组成 - Draft completed

四、产品经理的工作挑战 - Draft completed

五、项目售前与解决方案 - Draft completed

六、产品/项目启动

七、数据采集、标注与管理

八、训练与调试

九、模型部署与测试

十、机器学习的 DevOps

十一、项目交付

上一篇下一篇

猜你喜欢

热点阅读