Python3 多进程编程 - 学习笔记
-
python3 多进程编程(multiprocess programming)
-
python多线程的通信
- 进程对列queue
-
python3 多进程编程(multiprocess programming)
为什么使用多进程
python中的多线程其实并不是真正的多线程,不能充分地使用多核cpu的资源,此时需要使用需要使用多进程解决问题。
具体用法
python中的多进程是通过multiprocessing
模块来实现的,和多线程的threading.thread
类似,利用multiprocessing.process
来创建一个进程对象。进程对象的方法和线程对象的方法类似,也有start(), join()等。
-
直接启用
代码实例
import multiprocessing from time import sleep def clock(interval): i = 0 while i<5: i += 1 print(f"run >>> {i}") sleep(interval) print("ending!") if __name__ == '__main__': p = multiprocessing.process(target = clock, args = (1,)) p.start() p.join()
运行结果
run >>> 1 run >>> 2 run >>> 3 run >>> 4 run >>> 5 ending!
-
继承自
multiprocessing.process
调用与多线程使用方法类似
- 直接继承process
- 重写run函数
- 类实例可以直接运行
代码实例
import multiprocessing from time import sleep class clockprocess(multiprocessing.process): def __init__(self, interval): super().__init__() self.interval = interval def run(self): i = 0 while i<5: i += 1 print(f"run >>> {i}") sleep(self.interval) print("ending!") if __name__ == '__main__': p = clockprocess(1) p.start() p.join()
运行结果
run >>> 1 run >>> 2 run >>> 3 run >>> 4 run >>> 5 ending!
-
守护进程
- 设置该进程为守护进程,即认为此进程不重要,主进程结束后,该进程随即结束。
- 用法
process.daemon = ture
未使用守护进程
import multiprocessing from time import sleep def clock(interval): i = 0 while i<5: i += 1 print(f"run >>> {i}") sleep(interval) print("ending!") def run(): p = multiprocessing.process(target = clock, args = (1,)) p.start() if __name__ == '__main__': run() sleep(2) print("ending!")
运行结果
run >>> 1 run >>> 2 ending! run >>> 3 run >>> 4 run >>> 5 ending!
使用守护进程
import multiprocessing from time import sleep def clock(interval): i = 0 while i<5: i += 1 print(f"run >>> {i}") sleep(interval) print("ending!") def run(): p = multiprocessing.process(target = clock, args = (1,)) p.daemon = true p.start() if __name__ == '__main__': run() sleep(2) print("ending!")
运行结果
run >>> 1 run >>> 2 ending!
python多线程的通信
进程是系统独立调度核分配系统资源的基本单位,进程之间是相互独立的,进程之间的数据也不能共享,这是多进程在使用中与多线程最明显的区别。
所以要使用多进程来弥补python中多线程的不足,解决多进程之间的通信时关键。
进程对列queue
在python多进程中,queue其实就是进程之间的数据管道,实现进程通信。
生产者消费者问题
仓库(固定大小的中间缓冲区)
-
生产者
持续生产数据传入仓库
-
消费者
持续从仓库总提取数据
在实际运行时会产设的问题。生产者的主要作用是生成一定量的数据放到仓库中,然后重复此过程。
与此同时,消费者也在仓库消耗这些数据。该问题的关键就是要保证生产者不会在仓库满时加入数据,消费者也不会在仓库空时消耗数据。
joinablequeue
joinablequeue同样通过multiprocessing使用。
joinablequeue([maxsize]):就是一个queue对象,但允许项目的使用者通知生成者项目已经被成功处理。
maxsize是队列中允许最大项数,省略则无大小限制。
-
方法介绍:
joinablequeue与queue对象的方法一致,且之外还具有:
-
joinablequeue.task_done()
:使用者使用此方法发出信号,表示q.get()的返回项目已经被处理。如果调用此方法的次数大于从队列中删除项目的数量,将引发valueerror异常。 -
joinablequeue.join()
:生产者调用此方法进行阻塞,直到队列中所有的项目均被处理。阻塞将持续到队列中的每个项目均调用joinablequeue.task_done()
方法为止。
-
queue实例
-
使用joinablequeue实现生产者消费者模型
代码
import multiprocessing from time import ctime,sleep def consumer(input_q): print("消费开始:", ctime()) while true: # 处理项 item = input_q.get() print ("消费 >>>>>>>>>", item) # 此处替换为有用的工作 input_q.task_done() # 发出信号通知任务完成 sleep(1) print ("消费结束:", ctime()) ##此句未执行,因为q.join()收集到四个task_done()信号后,主进程启动,未等到print此句完成,程序就结束了 def producer(sequence, output_q): print ("生产开始:", ctime()) for item in sequence: output_q.put(item) print ("生产 >>>>>>>>>", item) sleep(1) print ("生产结束:", ctime()) if __name__ == '__main__': q = multiprocessing.joinablequeue() # 运行消费者进程 cons_p = multiprocessing.process (target = consumer, args = (q,)) cons_p.daemon = true cons_p.start() # 生产多个项,sequence代表要发送给消费者的项序列 # 在实践中,这可能是生成器的输出或通过一些其他方式生产出来 sequence = [1,2,3,4] producer(sequence, q) # 等待所有项被处理 q.join()
运行结果
生产开始: wed oct 16 22:06:11 2019 生产 >>>>>>>>> 1 消费开始: wed oct 16 22:06:11 2019 消费 >>>>>>>>> 1 生产 >>>>>>>>> 2 消费 >>>>>>>>> 2 生产 >>>>>>>>> 3 消费 >>>>>>>>> 3 生产 >>>>>>>>> 4 消费 >>>>>>>>> 4 生产结束: wed oct 16 22:06:15 2019
管道pipe
待续