网络爬虫文章采集/发布流程

2016-11-24  本文已影响92人  InitialX

Step1:
IT:
编辑抓取规则
抓取并保存至文件目录各网站一个目录,目录下包含:抓取的文章,所有文章汇总列表

上传文件到svn服务器

Step2:
审稿人:
打开svn文章库,复制文章列表(excel表)到本地
筛选出所需文章,修改文章列表

 3.  发送文章列表至**编稿人**

Step3:
编稿人:
接收当日文章列表
打开svn文章库,根据文章列表下载对应文章到本地
编辑、上传文章至网站,做好备份(建议将每日上传文章建立对应的文件夹)

附录:
火车采集器帮助手册:http://www.locoy.com/index/guide#软件简介.html,使用者有基本的HTML基础即可上手,高级功能参考帮助手册亦可顺利完成.

上一篇下一篇

猜你喜欢

热点阅读