如何评估一个机器学习的入职者的水平?
除了面试者简历上的项目,竞赛,论文等硬货之外,斗胆先答两条思路,然后再推10多个专栏供大家挑选题目,首先看两条思路。
一,分等级
直接将被试者分为几个水平,斗胆将学习深度学习的同志分为5大境界,分别是白身,初识,不惑,有识,不可知,下面一个一个道来,以计算机视觉方向为例。
1 白身
所谓白身境界,就是基本上什么都不会,还没有进入角色。在这个境界需要修行的内容包括:
(1) 熟练掌握linux及其环境下的各类工具的使用
(2) 熟练掌握python及机器学习相关库的使用
(3) 掌握c++等高性能语言的基本使用
(4) 知道如何获取和整理,理解数据
(5) 掌握相关的数学基础
(6) 了解计算机视觉的各大研究方向
(7) 了解计算机视觉的各大应用场景
(8) 了解行业的优秀研究人员,知道如何获取最新的资讯,能够熟练阅读简单的技术资料
如果掌握了这些,那么就从白痴,不,是白身境界晋级了。怎么判断这个境界呢?可以参考以下的文章,看看掌握的如何。
AI白身境界系列完整链接:
第二期:【AI白身境】Linux干活三板斧,shell、vim和git
第五期:【AI白身境】搞计算机视觉必备的OpenCV入门基础
第六期:【AI白身境】只会用Python?g++,CMake和Makefile了解一下
第九期:【AI白身境】入行AI需要什么数学基础:左手矩阵论,右手微积分
第十二期:【AI白身境】究竟谁是paper之王,全球前10的计算机科学家
2 初识
所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法。在这个阶段,需要修行以下内容。
(1) 熟练掌握神经网络
(2) 培养良好的数据敏感性,知道如何正确准备和使用数据
(3) 至少熟练掌握一个深度学习框架的使用
(4) 熟悉深度学习模型的基本训练和调参,网络设计
(5) 掌握归一化,激活机制,最优化等对模型性能的影响
(6) 能熟练评估自己的算法,使用合适的优化准则
这是这一个系列的文章
AI初识境界系列完整链接:
第三期:【AI初识境】近20年深度学习在图像领域的重要进展节点
第六期:【AI初识境】深度学习模型中的Normalization,你懂了多少?
第七期:【AI初识境】为了围剿SGD大家这些年想过的那十几招
第八期:【AI初识境】被Hinton,DeepMind和斯坦福嫌弃的池化,到底是什么?
第十期:【AI初识境】深度学习模型评估,从图像分类到生成模型
第十二期:【AI初识境】给深度学习新手开始项目时的10条建议
3 不惑
进入到不惑境界,就是向高手迈进的开始了,在这个境界的重点就是进一步巩固知识,并且开始独立思考。如果说学习是一个从模仿,到追随,到创造的过程,那么到这个阶段,应该跳过了追随,进入了创造的阶段。
如果是在学校读研究生,就要能够发表水平不错的文章,如果是在公司做业务,就要能够提出正确且快速的解决方案,如果是写技术文章,就要能够信手拈来原创写作而不需要参考。
这个阶段需要修行以下内容:
(1) 熟练玩转数据和模型对一个任务的影响
(2) 能够准确的分析出模型的优劣,瓶颈
(3) 对于新的任务能够快速寻找和敲定方案
(4) 拥有各种各样的深刻理解深度学习模型的技能,从可视化到参数分析等等等
(5) 能够优化模型到满足业务的需求,实现工业级落地
(6) 了解行业的最新进展,并在某些领域有自己的独到理解
AI补惑境界系列链接:
第二期:【AI不惑境】网络深度对深度学习模型性能有什么影响?
第四期:【AI不惑境】学习率和batchsize如何影响模型的性能?
4 有识
到这里,就步入高手境界了。可以大胆地说自己是一个非常合格的深度学习算法工程师甚至是研究员了,在自己研究的领域里处于绝对的行业前沿,对自己暂时不熟悉的领域也能快速地触类旁通。
无论是眼界,学习能力,还是学习态度都是一流水平,时而大智若愚,时而锋芒毕露,当之无愧的大师兄。
5 不可知
最后一个境界,就是不可知境界,超出我能描述的范围了。举一个例子,马文·闵斯基,既可以让AI生,又可以让AI死,这样的人是不会遇到的,放心好了。
如果你不认可这个分等级的,OK,来一个简单一点的,问细节。
二,问细节
问容易被面试者忽略的很小,但是又很重要的问题,这些问题通常有这些特点:
技术相关
足够聚焦
容易被忽视
普通但是不简单
可以引申很多思考
这里提供几个。
做过图像分类项目或者看过文章的小伙伴们应该都知道,在论文中进行各类方法的比较时,要求使用同样的数据集。而为了公平的比较,网络的输入大小通常都是224*224的大小,那为什么呢?
【AI-1000问】为什么深度学习图像分类的输入多是224*224
(2) 相信大家也都知道LeNet5这个经典的卷积神经网络,它有3个全连接层,输出维度分别是120,84,10,不知道大家知不知道为什么倒数第2个全连接层的维度是84呢?
【AI-1000问】为什么LeNet5倒数第二个全连接层维度为84?
做图像处理的我们应该都知道,OpenCV是我们必备的一个工具,我们在使用OpenCV读取图像时你应该也发现了读取出来的数组居然是BGR格式,而不是我们听的最多,用的最多的RGB格式,这是为什么呢?
【AI-1000问】为什么OpenCV读取的图像格式是BGR?
从某些时刻开始,小卷积开始流行,那么小卷积到底相比大卷积有什么优势呢?
大家都知道有测试集和验证集,这两个到底是有什么不同的定位呢?
问他10个小问题,看看能答出来几个,要是只能答出来两三个,那就说明基础不扎实了,能答出来八九个,那说明很踏实,这样的人是可以干活的。你说这些问题太简单,没问题,那就找更难的呗。我只是想说,简单问题看基础,比什么都合适。
以上内容不满意,那就再加内容,问问对这些掌握地怎么样。
研究方向相关等
模型解读系列文章(更新中):
第一期:【模型解读】从LeNet到VGG,看卷积+池化串联的网络结构
第二期:【模型解读】network in network中的1*1卷积,你懂了吗
第三期:【模型解读】GoogLeNet中的inception结构,你看懂了吗
第六期:【模型解读】resnet中的残差连接,你确定真的看懂了?
第十二期:【模型解读】浅析RNN到LSTM
第十三期:【模型解读】历数GAN的5大基本结构
模型训练经验
问问这些,是不是掌握的还可以,还是能看出很多基础的,如果想知道更加,有三AI生态欢迎你。