爬虫笔记(4)并发多进程

2016-12-16  本文已影响0人  无事扯淡

在python中,多线程并不能利用CPU的多核性能。为进一步提高爬虫性能,使用多进程是有必要的。多进程要比多线程要复杂一些,难点主要在进程间通讯的问题。系统将会分成服务器和客户端,服务器负责与各个进程进行通讯、存储数据以及分配任务。客户端负责从服务器接收任务,将采集的数据传送到服务器。

1.multiprocessing使用入门

python多进程模块multiprocessing,与多线程模块threading类似。

from multiprocessing import Process
def subprocess(name):
    print name
def main():
    p = Process(target=subprocess,args=('hello',))
    p.start() #启动进程
    p.join() #等待进程结束
if __main__=='__main__':
    main()
上一篇 下一篇

猜你喜欢

热点阅读