欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python小白的数学建模课-B4. 新冠疫情 SIR模型

程序员文章站 2022-03-01 21:13:03
Python小白的数学建模课-B4. 新冠疫情 SIR模型 传染病的数学模型是数学建模中的典型问题,常见的传染病模型有 SI、SIR、SIRS、SEIR 模型。 SIR 模型将人群分为易感者(S类)、患病者(I类)和康复者(R 类),考虑了患病者治愈后的免疫能力。 本文详细给出了 SIR 模型微分方 ......

python小白的数学建模课-b4. 新冠疫情 sir模型


传染病的数学模型是数学建模中的典型问题,常见的传染病模型有 si、sir、sirs、seir 模型。

sir 模型将人群分为易感者(s类)、患病者(i类)和康复者(r 类),考虑了患病者治愈后的免疫能力。

本文详细给出了 sir 模型微分方程、相空间分析的建模、例程、结果和分析,让小白都能懂。

『python小白的数学建模课 @ youcans』带你从数模小白成为国赛达人。



1. 疫情传播 sir 模型

传染病的传播特性不可能通过真实的试验开展研究,因此需要针对不同的传染病传播方式和流行特点建立相应的数学模型,并对模型进行理论研究和数值模拟。通过研究发现传染病传播的特征阈值,就可以为预防和控制传染病提供数据支撑和防控策略。

1927年,w. kermack 在论文 “contributions to the mathcmatical theory of epidemics” 中研究了伦敦黑死病和孟买瘟疫的流行过程,创造性地提出了 sir 模型。

si 模型和 sis 模型将人群分为感染者(s类)和患病者(i类)两类人群,但大多数传染病的患者在治愈后就有很强的免疫力,终身或在一段时期内不再会被感染而变成病人。这类人群称为病愈免疫的康复者(r 类)。康复者已经退出传染系统,对于致死性疾病的死亡者也可以用该类别描述其传播特性。

sir 模型适用于具有易感者、患病者和康复者三类人群,可以治愈,且治愈后终身免疫不再复发的疾病,例如天花、肝炎、麻疹等免疫力很强的传染病。

Python小白的数学建模课-B4. 新冠疫情 SIR模型

sir 模型假设:

  1. 考察地区的总人数 n 不变,即不考虑生死或迁移;
  2. 人群分为易感者(s类)、患病者(i类)和康复者(r 类)三类;
  3. 易感者(s类)与患病者(i类)有效接触即被感染,变为患病者(i类);患病者(i类)可被治愈,治愈后变为康复者;康复者(r类)获得终身免疫不再易感;无潜伏期;
  4. 将第 t 天时 s类、i 类、r 类人群的占比记为 \(s(t)\)\(i(t)\)\(r(t)\),数量为 \(s(t)\)\(i(t)\)\(r(t)\);初始日期 \(t=0\) 时, s类、i 类、r 类人群占比的初值为 \(s_0\)\(i_0\)\(r_0\)
  5. 日接触数 \(\lambda\),每个患病者每天有效接触的易感者的平均人数;
  6. 日治愈率 \(\mu\),每天被治愈的患病者人数占患病者总数的比例,即平均治愈天数为 \(1/\mu\)
  7. 传染期接触数 \(\sigma = \lambda / \mu\),即每个患病者在整个传染期内有效接触的易感者人数。

sir 模型的微分方程:

\[\begin{cases} \begin{align} & n\frac{di}{dt} = n\lambda s i\\ & n \frac{dr}{dt} = n \mu i\\ & s(t) + i(t) + r(t) = 1 \end{align} \end{cases} \]

得:

\[\begin{cases} \begin{align*} & \frac{di}{dt} = \lambda s i - \mu i , &i(0)=i_0\\ & \frac{ds}{dt} = -\lambda s i , &s(0)=s_0 \end{align*} \end{cases} \]

sir 模型不能求出解析解,只能通过数值计算方法求解。



2. sir 模型的 python 编程

2.1 scipy 工具包求解微分方程组

sis 模型是常微分方程初值问题,可以使用 scipy 工具包的 scipy.integrate.odeint() 函数求数值解。

scipy.integrate.odeint(func, y0, t, args=())

**scipy.integrate.odeint() **是求解微分方程的具体方法,通过数值积分来求解常微分方程组。

odeint() 的主要参数:

  • func: callable(y, t, …)   导数函数 \(f(y,t)\) ,即 y 在 t 处的导数,以函数的形式表示
  • y0: array:  初始条件 \(y_0\),注意 sir模型是二元常微分方程组, 初始条件为数组向量 \(y_0=[i_0, s_0]\)
  • t: array:  求解函数值对应的时间点的序列。序列的第一个元素是与初始条件 \(y_0\) 对应的初始时间 \(t_0\);时间序列必须是单调递增或单调递减的,允许重复值。
  • args: 向导数函数 func 传递参数。当导数函数 \(f(y,t,p1,p2,..)\) 包括可变参数 p1,p2.. 时,通过 args =(p1,p2,..) 可以将参数p1,p2.. 传递给导数函数 func。

odeint() 的返回值:

  • y: array   数组,形状为 (len(t),len(y0),给出时间序列 t 中每个时刻的 y 值。

2.2 odeint() 求解 sir 模型的编程步骤

  1. 导入 scipy、numpy、matplotlib 包。
  2. 定义导数函数 \(f(y,t)\)。注意对于常微分方程(例如 sis模型)和常微分方程组(sir模型),y 分别表示标量和向量,函数定义略有不同,以下给出两种情况的例程以供对比。

常微分方程的导数定义(sis模型)

def dysis(y, t, lamda, mu):  # sis 模型,导数函数
    dy_dt = lamda*y*(1-y) - mu*y  # di/dt = lamda*i*(1-i)-mu*i
    return dy_dt

常微分方程组的导数定义(sir模型)

def dysir(y, t, lamda, mu):  # sir 模型,y=[i,s] 点的导数dy/dt
    i, s = y
    di_dt = lamda*s*i - mu*i  # di/dt = lamda*s*i-mu*i
    ds_dt = -lamda*s*i  # ds/dt = -lamda*s*i
    return np.array([di_dt,ds_dt])

python 可以直接对向量、向量函数进行定义和赋值,使程序更为简洁。但考虑读者主要是 python 小白,又涉及到看着就心烦的微分方程组,所以我们宁愿把程序写得累赘一些,便于读者将程序与前面的微分方程组逐项对应。

  1. 定义初值 \(y_0\)\(y\) 的定义区间 \([t_0,\ t]\),注意初值为数组向量 \(y_0=[i_0, s_0]\)
  2. 调用 odeint() 求 \(y\) 在定义区间 \([t_0,\ t]\) 的数值解。

sir 模型是二元常微分方程,返回值 y 是 len(t)*2 的二维数组。


2.3 python例程:si 模型、sis 模型与sir 模型的比较

# modelcovid3_v1.py
# demo01 of mathematical modeling for covid2019
# sir model for epidemic diseases.
# copyright 2021 youcans, xupt
# crated:2021-06-12
# python小白的数学建模课 @ youcans

# 1. sir 模型,常微分方程组
from scipy.integrate import odeint  # 导入 scipy.integrate 模块
import numpy as np  # 导入 numpy包
import matplotlib.pyplot as plt  # 导入 matplotlib包

def dysis(y, t, lamda, mu):  # si/sis 模型,导数函数
    dy_dt = lamda*y*(1-y) - mu*y  # di/dt = lamda*i*(1-i)-mu*i
    return dy_dt

def dysir(y, t, lamda, mu):  # sir 模型,导数函数
    i, s = y
    di_dt = lamda*s*i - mu*i  # di/dt = lamda*s*i-mu*i
    ds_dt = -lamda*s*i  # ds/dt = -lamda*s*i
    return np.array([di_dt,ds_dt])

# 设置模型参数
number = 1e5  # 总人数
lamda = 0.2  # 日接触率, 患病者每天有效接触的易感者的平均人数
sigma = 2.5  # 传染期接触数
mu = lamda/sigma  # 日治愈率, 每天被治愈的患病者人数占患病者总数的比例
fsig = 1-1/sigma
tend = 200  # 预测日期长度
t = np.arange(0.0,tend,1)  # (start,stop,step)
i0 = 1e-4  # 患病者比例的初值
s0 = 1-i0  # 易感者比例的初值
y0 = (i0, s0)  # 微分方程组的初值

print("lamda={}\tmu={}\tsigma={}\t(1-1/sig)={}".format(lamda,mu,sigma,fsig))

# odeint 数值解,求解微分方程初值问题
ysi = odeint(dysis, i0, t, args=(lamda,0))  # si 模型
ysis = odeint(dysis, i0, t, args=(lamda,mu))  # sis 模型
ysir = odeint(dysir, y0, t, args=(lamda,mu))  # sir 模型

# 绘图
plt.title("comparison among si, sis and sir models")
plt.xlabel('t-youcans')
plt.axis([0, tend, -0.1, 1.1])
plt.axhline(y=0,ls="--",c='c')  # 添加水平直线
plt.plot(t, ysi, ':g', label='i(t)-si')
plt.plot(t, ysis, '--g', label='i(t)-sis')
plt.plot(t, ysir[:,0], '-r', label='i(t)-sir')
plt.plot(t, ysir[:,1], '-b', label='s(t)-sir')
plt.plot(t, 1-ysir[:,0]-ysir[:,1], '-m', label='r(t)-sir')
plt.legend(loc='best')  # youcans
plt.show()

2.4 si 模型、sis 模型与sir 模型的比较

Python小白的数学建模课-B4. 新冠疫情 SIR模型

本图为例程 2.3 的运行结果,参数和初值为:\(\lambda =0.2,\mu=0.08,(i_0,s_0,r_0)=(0.0001,0.9999,0)\)

曲线 i(t)-si 是 si 模型的结果,患病者比例急剧增长到 1.0,所有人都被传染而变成患病者。

曲线 i(t)-sis 是 sis 模型的结果,患病者比例快速增长并收敛到某个常数,即稳态特征值 \(i_\infty=1-\mu/\lambda = 0.6\),表明疫情稳定,并将长期保持一定的患病率,称为地方病平衡点。

曲线 i(t)-sir、s(t)-sir、r(t)-sir 分别是 sir 模型的易感者(s类)、患病者(i 类)、康复者(r 类)人群的占比。图中易感者比例 s(t) 单调递减并收敛到非零的稳态值 \(s_\infty\),康复者比例 r(i) 单调递增并收敛到非零的稳态值 \(r_\infty\),患病者比例 i(t) 先上升达到峰值,然后再逐渐减小趋近于 0 。



3. sir 模型参数的影响

sir 模型中有日接触率 \(\lambda\) 与日治愈率 \(\mu\) 两个参数,还有 \(i_0、s_0\) 两个初始条件,共有 4 个可以调整的参数条件都会影响微分方程的解,也就是会影响患病者、易感者比例的时间变化曲线。其中的各种组合无穷无尽,如果没有恰当的研究方法、不能把握内在的规律,即使在几十、几百组参数条件下进行模拟,仍然只是盲人摸象、管中窥豹。

3.1 初值条件 \(i_0, s_0\) 的影响

下面考察初值条件 \(i_0, s_0\) 的影响。固定参数 \(\lambda=0.2, \mu=0.02\)不变,不同初值条件下 \(i(t), s(t)\) 的变化曲线如下图所示。

Python小白的数学建模课-B4. 新冠疫情 SIR模型

通过对于该参数条件下不同初值条件的单因素分析,可以看到患病者比例、易感者比例的初值条件对疫情发生、达峰、结束的时间早晚具有直接影响,但对疫情曲线的形态和特征影响不大。不同初值条件下的疫情曲线,几乎是沿着时间指标平移的。

这说明如果不进行治疗防控等人为干预,疫情传播过程与初始患病率无关,该来的总会来。

图中患病率达到高峰后逐步降低,直至趋近于 0;易感率在疫情爆发后迅速下降,直至趋近于 0。但这一现象是基于具体的参数条件 \(\lambda=0.2, \mu=0.02\) 的观察,无法确定其是否普遍规律。


3.2 日接触率 \(\lambda\) 的影响

首先考察日接触率 \(\lambda\) 的影响。固定参数 \(\mu=0.25, i_0=0.002,s_0=1-i_0\)不变,$\lambda = [0.2, 0.25, 0.5, 1.0, 2.0] $ 时 \(i(t), s(t)\) 的变化曲线如下图所示。

Python小白的数学建模课-B4. 新冠疫情 SIR模型

通过对于该条件下日接触率的单因素分析,可以看到随着日接触率 \(\lambda\) 的增大,患病率比例 \(i(t)\) 出现的峰值更早、更强,而易感者比例 \(s(t)\) 从几乎不变到迅速降低,但最终都趋于稳定。

对本图我们好像感觉到存在一些规律,但又似乎说不清,很难总结出来。即便总结出某些特征,也只能说是在该固定参数条件下的特征,不能说是 sir 模型的共有特征。即便反复地改变固定参数的取值或日接触率的范围,情况也差不多。


3.3 日治愈率 \(\mu\) 的影响

下面考察日治愈率 \(\mu\) 的影响。固定参数 \(\lambda=0.2, i_0=0.002,s_0=1-i_0\)不变, \(\mu = [0.4, 0.2, 0.1, 0.05, 0.025]\)\(i(t), s(t)\) 的变化曲线如下图所示。

Python小白的数学建模课-B4. 新冠疫情 SIR模型

通过对于该条件下日治愈率的单因素分析,可以看到随着日治愈率 \(\mu\) 的减小,患病率比例 \(i(t)\) 出现的峰值更强、也稍早,而易感者比例 \(s(t)\) 从几乎不变到迅速降低,但最终都趋于稳定。

对于本图的观察和分析情况与上图是差不多的,看起来内容更丰富,似乎也有规律可循,但很难说的清,只能做一些简单的描述。即便进行更多的模拟,情况也差不多。

这是因为,对于sir 模型这类微分方程,对结果具有决定性影响的特征参数,往往不是模型中的某个参数,而是多个参数特定关系的组合,因此仅从单因素实验很难充分反映模型中的内在特征。

不过,对于数学建模,通过几组单因素实验获得一系列曲线、图表,再从各个角度对结果进行一些描述和解读,就已经足够了。



4. sir 模型的相空间分析

4.1 sir 模型的相轨迹方程

sir 模型不能求出解析解,可以通过相空间方法来研究解的周期性、稳定性。

由于患病者比例 \(i(t)\) 和易感者比例 \(s(t)\) 都是时间 t 的函数,因此当 t 取任意值时都对应着 \(i-s\) 平面上的一个点,当 t 连续变化时对应着 \(i-s\) 平面上的一条轨迹,称为相轨迹。通过相轨迹图可以分析微分方程的性质。

对于 sir 模型,消去 dt 可以得到:

\[\frac{di}{ds} = \frac{1}{\sigma s} - 1 ,\; i(s=s_0)=i_0 \]

该微分方程的解为:

\[i = (s_0 + i_0) - s +\frac{1}{\sigma} ln \frac{s}{s_0} \]


4.2 python例程:sir 模型的相轨迹

# modelcovid3_v1.py
# demo01 of mathematical modeling for covid2019
# sir model for epidemic diseases.
# copyright 2021 youcans, xupt
# crated:2021-06-12
# python小白的数学建模课 @ youcans

# 2. sir 模型,常微分方程组 相空间分析
from scipy.integrate import odeint  # 导入 scipy.integrate 模块
import numpy as np  # 导入 numpy包
import matplotlib.pyplot as plt  # 导入 matplotlib包

def dysir(y, t, lamda, mu):  # sir 模型,导数函数
    i, s = y
    di_dt = lamda*s*i - mu*i  # di/dt = lamda*s*i-mu*i
    ds_dt = -lamda*s*i  # ds/dt = -lamda*s*i
    return np.array([di_dt,ds_dt])

# 设置模型参数
number = 1e5  # 总人数
lamda = 0.2  # 日接触率, 患病者每天有效接触的易感者的平均人数
sigma = 2.5  # 传染期接触数
mu = lamda/sigma  # 日治愈率, 每天被治愈的患病者人数占患病者总数的比例
fsig = 1-1/sigma
print("lamda={}\tmu={}\tsigma={}\t(1-1/sig)={}".format(lamda, mu, sigma, fsig))

# odeint 数值解,求解微分方程初值问题
tend = 200  # 预测日期长度
t = np.arange(0.0,tend,1)  # (start,stop,step)
s0list = np.arange(0.01,0.91,0.1)  # (start,stop,step)
for s0 in s0list:  # s0, 易感者比例的初值
    i0 = 1 - s0    # i0, 患病者比例的初值
    y0 = (i0, s0)  # 微分方程组的初值
    ysir = odeint(dysir, y0, t, args=(lamda,mu))  # sir 模型
    plt.plot(ysir[:,1], ysir[:,0])

# 绘图
plt.title("phase trajectory of sir models")
plt.axis([0, 1, 0, 1])
plt.plot([0,1],[1,0],'b-')
plt.plot([1/sigma,1/sigma],[0,1-1/sigma],'b--')
plt.xlabel('s(t)-youcans')
plt.ylabel('i(t)-xupt')
plt.text(0.8,0.9,r"$1/\sigma$ = {}".format(1/sigma),color='b')
plt.show()


4.3 sir 模型的相轨迹分析

Python小白的数学建模课-B4. 新冠疫情 SIR模型

上图为例程 3.2 的运行结果(\(\lambda =0.2,\mu=0.08,1/\sigma=0.4\)),是 sir 模型的相轨迹图。

图中每一条 i-s 曲线,从直线 i(t)+s(t)=1 上的某一初值点出发,最终收敛于 s轴上的某一点,对应着某一个初值条件下的患病者与易感者比例随时间的变化关系。

利用相轨迹图可以分析和讨论 sir 模型的性质:

  1. 任一条 i-s 曲线都收敛于s轴上的一点,即 \(i_\infty=0\),表明不论初始条件如何,患病者终将清零。
  2. 患病者比例在 \(s=1/\sigma\) 时达到峰值。若易感者比例的初值 \(s_0>1/\sigma\),患病者比例先增长,在 \(s=1/\sigma\) 时达到峰值 \(i_{max} = (s_0 + i_0) - (1+ln (\sigma s_0))/\sigma\),然后下降,终将清零;若易感者比例的初值 \(s_0<1/\sigma\),患病者比例单调递减,终将清零。
  3. 易感者比例单调递减,易感者的最终比例是相轨迹与 s轴在 (0,1/sigma) 内交点的横坐标。易感者最终比例虽然与初值有关,但集聚于靠近 i轴的区域,表明不论初始条件如何,大部分人都会感染疫情并康复。

对于小白来说,比较容易理解 2.4 节图中变量随时间的变化曲线,而对于本节相轨迹方法的思想、方法和图形都会觉得不容易理解,甚至感到困惑。虽然相轨迹的每一条线也对应着 t 从 t0 到 tend 的过程,但为什么要这么画,为什么轨迹这么怪怪的呢?

相轨迹图看上去比较怪,也不容易理解,是因为忽略时间轴而着重关注两个变量之间的关系,这种视角与我们日常观察问题和思考问题的习惯完全不同。也正是因为这个原因,相轨迹图能反映出时间变化曲线图中难以表达的一些重要特征。

例如,患病者比例在 \(s=1/\sigma\) 时达到峰值,即使把不同 \(\sigma\) 值下的患病者比例的时间变化曲线放在一张图中也无法观察到这一特征。进一步地,既然在 \(s=1/\sigma\) 时达到峰值,那么 \(s_0\)\(1/\sigma\) 的关系自然就成为重要的分界线,并在图中可以观察到分界线两侧具有明显不同的特征。

有了对这些特征的认识和把握,才能选择不同的参数条件,在时间变化曲线图上进行比较系统的比较。要知道 sir 模型中有 \(\lambda、\mu\) 两个参数,还有 \(i_0、s_0\) 两个初始条件,共有 4 个可以设置的参数都会影响微分方程的解,也就是会影响患病者、易感者比例的时间变化曲线。其中的各种组合无穷无尽,如果没有恰当的研究方法、不能把握内在的规律,即使在几十、几百组参数条件下进行模拟,仍然只是盲人摸象、管中窥豹。

看到这里,小白同学可能会对相轨迹研究的意义有所认识,但还是对这种分析方法难以理解望而却步。没关系,还记得我们在”09 微分方程模型“中说的吗:

不会从问题建立微分方程模型怎么办,不会展开参数对稳定性、灵敏度的影响进行讨论怎么办?谁让你自己做呢,当然是先去找相关专业的教材、论文,从中选择比较接近、比较简单的理论和模型,然后通过各种假设强行将题目简化为模型中的条件,这就可以照猫画虎了。



5. sir 模型结果讨论

最后,我们简单总结一下 sir 模型的特点:

  1. sir 模型是一个单向模型,易感者(s)不断转变为患病者(i),患病者(i)不断转变为康复者(r),因此易感者比例 s(t) 单调递减,康复者比例 r(i) 单调递增。
  2. \(s_0>1/\sigma\),患病者比例 i(t) 先增长,当 \(s_0=1/\sigma\) 时达到峰值,然后下降,最终为 0;若 \(s_0<1/\sigma\),患病者比例 i(t) 单调递减,最终为 0。
  3. 不论初始条件如何,患病者数量最终都会清零。
  4. \(1/\sigma\) 是传染病蔓延的阈值,满足 \(s_0>1/\sigma\) 才会发生传染病蔓延。因此,为了控制传染病的蔓延:
    • 一方面要提高阈值 \(1/\sigma\),这可以通过提高卫生水平来降低日接触率\(\lambda\)、提高医疗水平来提高日治愈率 \(\mu\)
    • 另一方面要降低 \(s_0\),这可以通过预防接种达到群体免疫来实现。

【本节完】

版权声明:

欢迎关注『python小白的数学建模课 @ youcans』 原创作品

原创作品,转载必须标注原文链接:()。

copyright 2021 youcans, xupt

crated:2021-06-12


欢迎关注 『python小白的数学建模课 @ youcans』,每周更新数模笔记
python小白的数学建模课-01.新手必读
python小白的数学建模课-02.数据导入
python小白的数学建模课-03.线性规划
python小白的数学建模课-04.整数规划
python小白的数学建模课-05.0-1规划
python小白的数学建模课-06.固定费用问题
python小白的数学建模课-07.选址问题
python小白的数学建模课-09.微分方程模型
python小白的数学建模课-b2.新冠疫情 si模型
python小白的数学建模课-b3.新冠疫情 sis模型