【一旸的面试流水账】奇虎360
1.【实习】信息流
时间:4月10号左右
形式:一共三面,2轮技术面,1轮HR面
1面(技术面)
做个自我介绍吧~
聊聊项目吧~
详细问了毕设项目
给文字广告配图的实际场景,相关的解决办法
C++的考察
要求看懂(线上C++,线下python的模式)
Static 作用
类名 花括号初始化 是一种什么构造方式?……?
2面(技术面)
做个自我介绍吧~
图像描述生成项目
算法
二叉树 节点和的最小值与路径
3面(Hr 面)
保研or考研?
家乡在哪里
今后发展规划呀(留京,行业)
简历上这些项目是实验室项目吗
这些项目是基于兴趣吗?
项目的完成人数(独自 or 团队)
竞赛的一些成绩
可实习时间
有没有其他公司的投递与面试
有没有考虑过国企等
技术线路规划(专一技术 or 也有产品的可能)
自我评价
有什么问题想问我嘛
整体2小时,包括等待
2.【校招】人工智能研究院
(1)第一位打开我github的面试官
(2)面试考察得比较深,包括一些语言背后的深层机制
(3)由于对python的一些机制不是很了解,很快就达成了一致,吾非你所求,一面挂
3.【补录】搜索部门
时间:1月19号
形式:2轮技术面,1轮HR面
一面
自我介绍
毕设项目,强调了虽然和图像相关,但主要做nlp算法
第一份实习的工作简单问了几句
第二家实习,自编码器部分问了几句
出一个问题:如果有很多文章标题,如何提取关键词(假设标签全部在标题中,不考虑语意层面)
我的回答:
1)最简单:词频。一种是先分词,再统计词频,第二种是不分词,直接统计串出现的频率(适合新词发现)
2)tf-idf 计算词的权重,权重大的作为关键词,提取出来
3)作为序列标注问题来解答。
那序列标注有哪些解决途径?
1)HMM模型。
模型假设有(1)当前时刻状态只与前一时刻有关(2)当前发射只与当前状态有关
模型(pai,A,B),分别的意义…
用维特比算法来求解。
2)CRF模型。
模型上…样的,与HMM在模型假设上的不同点…
之前有用过工具包,通过人工提取一些特征(uni特征,bi-特征等等),训练模型
3)目前最先进的是 CNN+LSTM+CRF模型
优点:不用自己提取特征;准确度高
CNN有什么好处?
我的回答:可以弥补LSTM的历史信息遗忘问题,每个词的位置是平等的
(面试官补充,可以不分词,省去了分词上的误差)
算法题:
用C写 strcopy
(写得很烂,面试官不断提点)
二面
一个目光炯炯有神的工程小哥哥~
简单问了下简历,没有任何为难
HR面
很和善,常见套路问题,以及如果发offer,接受意愿如何