python使用多进程的实例详解

程序员文章站 2022-04-16 09:10:03

python多线程适合io密集型场景，而在cpu密集型场景，并不能充分利用多核cpu，而协程本质基于线程，同样不能充分发挥多核的优势。针对计算密集型场景需要使用多进程，...

python多线程适合io密集型场景，而在cpu密集型场景，并不能充分利用多核cpu，而协程本质基于线程，同样不能充分发挥多核的优势。

针对计算密集型场景需要使用多进程，python的multiprocessing与threading模块非常相似，支持用进程池的方式批量创建子进程。

•创建单个process进程(使用func)

只需要实例化process类，传递函数给target参数，这点和threading模块非常的类似，args为函数的参数

import os
from multiprocessing import process
# 子进程要执行的代码
def task(name):
  print('run child process %s (%s)...' % (name, os.getpid()))
if __name__ == '__main__':
  print('parent process %s.' % os.getpid())
  p = process(target=task, args=('test',))
  p.start()
  p.join()
  print('process end.')

•创建单个process进程(使用class)

继承process类，重写run方法创建进程，这点和threading模块基本一样

import multiprocessing
import os
from multiprocessing import current_process
class worker(multiprocessing.process):
  def run(self):
    name = current_process().name # 获取当前进程的名称
    print('run child process <%s> (%s)' % (name, os.getpid()))
    print('in %s' % self.name)
    return
if __name__ == '__main__':
  print('parent process %s.' % os.getpid())
  p = worker()
  p.start()
  p.join()
  print('process end.') 
　　* 停止进程

terminate()结束子进程，但是会导致子进程的资源无法释放掉，是不推荐的做法，因为结束的时候不清楚子线程的运行状况，有很大可能性导致子线程在不恰当的时刻被结束。

import multiprocessing
import time
def worker():
  print('starting worker')
  time.sleep(0.1)
  print('finished worker')
if __name__ == '__main__':
  p = multiprocessing.process(target=worker)
  print('执行前:', p.is_alive())
  p.start()
  print('执行中:', p.is_alive())
  p.terminate() # 发送停止号
  print('停止:', p.is_alive())
  p.join()
  print('等待完成:', p.is_alive())

•直接创建多个process进程

import multiprocessing
def worker(num):
  print(f'worker:%s %s', num)
  return
if __name__ == '__main__':
  jobs = []
  for i in range(5):
    p = multiprocessing.process(target=worker, args=(i,))
    jobs.append(p)
    p.start()

•使用进程池创建多个进程

在利用python进行系统管理的时候，特别是同时操作多个文件目录，或者远程控制多台主机，并行操作可以节约大量的时间。当被操作对象数目不大时，可以直接利用multiprocessing中的process动态成生多个进程，十几个还好，但如果是上百个，上千个目标，手动的去限制进程数量却又太过繁琐，此时可以发挥进程池的功效。

pool可以提供指定数量的进程供用户调用，当有新的请求提交到pool中时，如果池还没有满，那么就会创建一个新的进程用来执行该请求；但如果池中的进程数已经达到规定最大值，那么该请求就会等待，直到池中有进程结束，才会创建新的进程来它。

import os
import random
import time
from multiprocessing import pool
from time import ctime
def task(name):
  print('start task %s (%s)...' % (name, os.getpid()))
  start = time.time()
  time.sleep(random.random() * 3)
  print('end task %s runs %0.2f seconds.' % (name, (time.time() - start)))
if __name__ == '__main__':
  print('parent process %s.' % os.getpid())
  p = pool() # 初始化进程池
  for i in range(5):
    p.apply_async(task, args=(i,)) # 追加任务 apply_async 是异步非阻塞的，就是不用等待当前进程执行完毕，随时根据系统调度来进行进程切换。
  p.close()
  p.join() # 等待所有结果执行完毕，会等待所有子进程执行完毕，调用join()之前必须先调用close()
  print(f'all done at: {ctime()}')

如果关心每个进程的执行结果，可以使用返回结果的get方法获取，代码如下

import os
import random
import time
from multiprocessing import pool, current_process
from time import ctime
def task(name):
  print('start task %s (%s)...' % (name, os.getpid()))
  start = time.time()
  time.sleep(random.random() * 3)
  print('end task %s runs %0.2f seconds.' % (name, (time.time() - start)))
  return current_process().name + 'done'
if __name__ == '__main__':
  print('parent process %s.' % os.getpid())
  result = []
  p = pool() # 初始化进程池
  for i in range(5):
    result.append(p.apply_async(task, args=(i,))) # 追加任务 apply_async 是异步非阻塞的，就是不用等待当前进程执行完毕，随时根据系统调度来进行进程切换。
  p.close()
  p.join() # 等待所有结果执行完毕
  for res in result:
    print(res.get()) # get()函数得出每个返回结果的值
  print(f'all done at: {ctime()}')

总结

以上所述是小编给大家介绍的python使用多进程的实现代码，希望对大家有所帮助

上一篇： RESTful api风格介绍

下一篇： c/c++ 图的最短路径 Dijkstra(迪杰斯特拉)算法

python使用多进程的实例详解

使用Python编写简单的端口扫描器的实例分享

举例详解Python中的split()函数的使用方法

浅析Python中的多进程与多线程的使用

Python字符串匹配之6种方法的使用详解

使用python语言,比较两个字符串是否相同的实例

python的格式化输出（format,%）实例详解

python ChainMap的使用和说明详解

使用python list 查找所有匹配元素的位置实例

详解使用Python处理文件目录的相关方法

Python使用dis模块把Python反编译为字节码的用法详解