2017/09/28 面试

2017-09-28  本文已影响0人  小神同学

智慧芽 面试:

  1. 简单描述一下协程的运作原理。(在 "关于协程" 中有描述)
  2. 协程在遇到发送IO请求时是如何运作的?如何把io请求挂起的?(在 "关于协程" 中有提到用 await)
  3. 关于机器学习,有一个应用场景:爬取到了很多专利,以及专利描述,然后有一个列表记录所有专利的分类,如何对爬取到的专利进行分类?(无监督的情况:爬取到了专利,但是没有对他们有做过分类;有监督的情况:爬取到的专利打上了分类标签)
  4. 关于爬虫的部署和监控,如果有100个网站需要爬取,如何管理和部署这些爬虫?如果有一只爬虫死了,如果监控到是哪一只爬虫死了?
  5. 分布式爬虫,分控制端和client端,如果控制端死掉了,如何防止client崩掉?
  6. python,如何实现单例?
  7. 你能想到有什么反爬虫的机制?
  8. 在学习完机器学习课程以后,如何在实际操作中运用?

----------------- 2017/10/02 更新 ------------

  1. crontab 在执行定时任务时, 每一条命令是顺序执行的还是并行执行的? 如果第一条命令报错了, 后面的命令还会不会执行?
上一篇下一篇

猜你喜欢

热点阅读