欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python多线程编程入门详解

程序员文章站 2022-03-09 23:03:21
目录一、任务、进程和线程任务进程线程进程和线程的关系二、python既支持多进程,又支持多线程python实现多进程process进程类的说明python实现多线程线程类thread总结一、任务、进程...

一、任务、进程和线程

现代操作系统比如mac os xlinuxwindows等,都是支持“多任务”的操作系统。

什么叫“多任务”(multitasking)呢?简单地说,就是操作系统可以同时运行多个任务。例如你一边在用浏览器上查资料,一边在听mp3,一边在用word写文档,这就是多任务。

打开windows的任务管理器,可以直观的了解一下:

Python多线程编程入门详解

任务

(task)是最抽象的,是一个一般性的术语,指由软件完成的一个活动。一个任务既可以是一个进程,也可以是一个线程。简而言之,它指的是一系列共同达到某一目的的操作。例如,读取数据并将数据放入内存中。这个任务可以作为一个进程来实现,也可以作为一个线程(或作为一个中断任务)来实现。

单核cpu如何实现“多任务”

Python多线程编程入门详解

三个任务a,b,c在单个cpu上交替执行,逻辑上表现为三个执行实例并发执行,但实质物理上是串行执行。

多核cpu如何实现“多任务”

多任务的真正并行只能在多核cpu上实现,但是,一般而言,任务的数量多于cpu的核数,还是需要将多个任务轮流调度到每个核上执行。

单核与多核处理器(multi-core processor)示例

Python多线程编程入门详解

多核cpu:简单地说是将多个核心装载一个封装里,外观上看是一个处理器。

串行:一个处理完再一个。

并行:指两个或者多个事件在同一时刻发生。

并发:指两个或多个事件在同一时间间隔内发生。

例如:并发时你正在吃饭,吃到一半电话响,去接电话,接完后继续吃饭;并行时边吃饭边打电话。

进程

(process)常常被定义为程序的执行。可以把一个进程看成是一个独立的程序,在内存中有其完备的数据空间和代码空间。一个进程所拥有的数据和变量只属于它自己。

线程

(tread)则是某一进程中一路单独运行的程序。也就是说,线程存在于进程之中。一个进程由一个或多个线程构成,各线程共享相同的代码和全局数据 ,但各有其自己的堆栈。由于堆栈是每个线程一个,所以局部变量对每一线程来说是私有的 。由于所有线程共享同样的代码和全局数据,它们比进程更紧密,比单独的进程间更趋向于相互作用,线程间的相互作用更容易些,因为它们本身就有某些供通信用的共享内存:进程的全局数据。

进程和线程的关系

(1)一个线程只能属于一个进程,而一个进程可以有多个线程,但至少有一个线程。

(2)资源分配给进程,同一进程的所有线程共享该进程的所有资源。

(3)处理机分给线程,即真正在处理机上运行的是线程。

(4)线程在执行过程中,需要协作同步。不同进程的线程间要利用消息通信的办法实现同步。

二、python既支持多进程,又支持多线程

multiprocessing --- 基于进程的并行 — python 3.10.0 文档

threading --- 基于线程的并行 — python 3.10.0 文档

python实现多进程

在unix/linux下,mac系统是基于bsd(unix的一种)内核,都可以使用fork()调用实现多进程,python的os模块封装了常见的系统调用,其中就包括fork。例如:

import os
 
print('process (%s) start...' % os.getpid())
# only works on unix/linux/mac:
pid = os.fork()  #windows中不支持fork(),将报错
if pid == 0:
    print('i am child process (%s) and my parent is %s.' % (os.getpid(), os.getppid()))
else:
print('i (%s) just created a child process (%s).' % (os.getpid(), pid))
 

需要注意的是,上述代码在unix/linux、mac系统中可以运行,但在windows中运行报错:

attributeerror: module 'os' has no attribute 'fork'

因为windows没有fork调用,怎么办?

multiprocessing模块是跨平台版本的多进程模块。在windows上用python编写多进程的程序,可以使用multiprocessing模块。multiprocessing模块提供了一个process类来代表一个进程对象。

process进程类的说明

process([group [, target [, name [, args [, kwargs]]]]])

  • group:指定进程组,目前只能使用none
  • target:执行的目标任务名
  • name:进程名字,默认为process-n,n为从1开始递增的整数
  • args:以元组方式给执行任务传参
  • kwargs:以字典方式给执行任务传参

process创建的实例对象的常用方法:

  • start():启动子进程实例(创建子进程)
  • join():等待子进程执行结束
  • terminate():不管任务是否完成,立即终止子进程

process创建的实例对象的常用属性:

例如:

import multiprocessing
import time
 
# 跳舞任务
def dance():
    for i in range(3):
        print("跳舞中...")
        time.sleep(0.2)
 
# 唱歌任务
def sing():
    for i in range(3):
        print("唱歌中...")
        time.sleep(0.2)
 
dance_process = multiprocessing.process(target=dance(), name="myprocess1")
sing_process = multiprocessing.process(target=sing())
 
# 启动子进程执行对应的任务
dance_process.start()
sing_process.start()

执行结果如下图:

Python多线程编程入门详解

python实现多线程

多任务可以由多进程完成,也可以由一个进程内的多线程完成。

python的标准库提供了两个模块:_threadthreading,_thread是低级模块,threading是高级模块,对_thread进行了封装。绝大多数情况下,使用threading这个高级模块。

线程类thread

thread([group [, target [, name [, args [, kwargs]]]]])

  • group: 线程组,目前只能使用none
  • target: 执行的目标任务名
  • args: 以元组的方式给执行任务传参
  • kwargs: 以字典方式给执行任务传参
  • name: 线程名,一般不用设置

thread类提供了以下方法:

  • run(): 用以表示线程活动的方法。
  • start():启动线程活动。
  • join([time]): 等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
  • isalive(): 返回线程是否活动的。
  • getname(): 返回线程名。
  • setname(): 设置线程名。

启动一个线程就是把一个函数传入并创建thread实例,然后调用start()开始执行,例子:

import time, threading
 
# 新线程执行的代码:
def loop():
    print('thread %s is running...' % threading.current_thread().name)
    n = 0
    while n < 5:
        n = n + 1
        print('thread %s >>> %s' % (threading.current_thread().name, n))
        time.sleep(1)
    print('thread %s ended.' % threading.current_thread().name)
 
print('thread %s is running...' % threading.current_thread().name)
t = threading.thread(target=loop, name='loopthread')
t.start()
t.join()
print('thread %s ended.' % threading.current_thread().name)
 

执行结果如下图:

Python多线程编程入门详解

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!