Linux内核:了解Linux内核抢占
目录
在配置Linux内核时,我们可以设置一些影响系统行为的参数。您可以使用不同的优先级,调度类和抢占模型。了解并选择正确的参数非常重要。
在这篇文章中,我将介绍不同的抢占模型,以及每种模型如何影响用户和内核行为
如果配置内核(使用make menuconfig),通常可以在内核功能子菜单中找到选项–抢占模型:
为了理解每个选项,让我们举个例子:
- 我们有2个线程-一个线程具有较高的实时优先级(50),另一个线程具有较低的RT优先级(30)
- 高优先级线程进入睡眠状态3秒钟
- 低优先级线程使用CPU进行用户空间计算
- 3秒后,高优先级线程将唤醒
这种情况既简单又合理,但是如果低优先级线程在高优先级处于休眠状态时调用内核代码会怎样?这取决于上面的配置
无强制抢占
仅当我们从内核返回时,才进行上下文切换。让我们举个例子:
- 我们有2个线程-一个线程具有较高的实时优先级(50),另一个线程具有较低的RT优先级(30)
- 高优先级线程进入睡眠状态3秒钟
- 低优先级线程调用持续5秒的内核代码
- 5秒后,低优先级线程从内核返回
- 高优先级线程将唤醒(延迟2秒)
让我们看一下代码:
内核代码–简单字符设备驱动程序:
#include <asm/uaccess.h>
#include <linux/fs.h>
#include <linux/gfp.h>
#include <linux/cdev.h>
#include <linux/sched.h>
#include <linux/kdev_t.h>
#include <linux/delay.h>
#include <linux/ioctl.h>
#include <linux/slab.h>
#include <linux/mempool.h>
#include <linux/mm.h>
#include <asm/io.h>
static dev_t my_dev;
static struct cdev *my_cdev;
// callback for read system call on the device
static ssize_t my_read(struct file *file, char __user *buf,size_t count,loff_t *ppos)
{
int len=5;
if(*ppos > 0)
{
return 0;
}
mdelay(5000); // busy-wait for 5 seconds
if (copy_to_user(buf , "hello" , len)) {
return -EFAULT;
} else {
*ppos +=len;
return len;
}
}
static struct file_operations my_fops =
{
.owner = THIS_MODULE,
.read = my_read,
};
static int hello_init (void)
{
my_dev = MKDEV(400,0);
register_chrdev_region(my_dev,1,"demo");
my_cdev=cdev_alloc();
if(!my_cdev)
{
printk (KERN_INFO "cdev alloc error.\n");
return -1;
}
my_cdev->ops = &my_fops;
my_cdev->owner = THIS_MODULE;
if(cdev_add(my_cdev,my_dev,1))
{
printk (KERN_INFO "cdev add error.\n");
return -1;
}
return 0;
}
static void
hello_cleanup (void)
{
cdev_del(my_cdev);
unregister_chrdev_region(my_dev, 1);
}
module_init (hello_init);
module_exit (hello_cleanup);
MODULE_LICENSE("GPL");
读取延迟5秒钟(延迟是一个繁忙的等待循环)并返回一些数据
用户空间代码:
#include<stdio.h>
#include<unistd.h>
#include<pthread.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
void *hi_prio(void *p)
{
printf("thread1 start time=%ld\n",time(NULL));
sleep(3);
printf("thread1 stop time=%ld\n",time(NULL));
return NULL;
}
void *low_prio(void *p)
{
char buf[20];
sleep(1);
int fd=open("/dev/demo",O_RDWR); // #mknod /dev/demo c 400 0
puts("thread2 start");
read(fd,buf,20);
puts("thread2 stop");
return NULL;
}
int main()
{
pthread_t t1,t2,t3;
pthread_attr_t attr;
struct sched_param param;
pthread_attr_init(&attr);
pthread_attr_setschedpolicy(&attr, SCHED_RR);
param.sched_priority = 50;
pthread_attr_setschedparam(&attr, ¶m);
pthread_create(&t1,&attr,hi_prio,NULL);
param.sched_priority = 30;
pthread_attr_setschedparam(&attr, ¶m);
pthread_create(&t2,&attr,low_prio,NULL);
sleep(10);
puts("end test");
return 0;
}
- 高优先级进入睡眠状态3秒钟。
- 低优先级线程休眠一秒钟,然后调用内核
- 高优先级是6秒后唤醒:
# insmod demo.ko
# ./app
thread1 start time=182
thread2 start
thread1 stop time=188
thread2 stop
end test
可抢占内核
在此配置中,上下文切换也在内核中按时完成,这意味着如果我们运行上述测试,我们将看到3秒钟后唤醒高优先级线程:
这意味着在此选项中,系统每秒将执行更多上下文切换,但更“实时”。在对实时性有要求的嵌入式系统上,最好使用此选项,但在通常异步工作的服务器系统中,第一个选项更好–上下文切换少– CPU时间长
输出:
# insmod ./demo.ko
#./app
thread1 start time=234
thread2 start
thread1 stop time=237
thread2 stop
end test
自愿内核抢占
在这种配置下,系统就像“没有强制抢占”那样工作,但是如果内核开发人员正在编写复杂的代码,则它负责不时检查是否需要重新调度。他可以使用may_resched()函数做到这一点
因此,在此示例中,如果要添加此“检查点”,我们将更改代码:
// callback for read system call on the device
static ssize_t my_read(struct file *file, char __user *buf,size_t count,loff_t *ppos)
{
int len=5;
if(*ppos > 0)
{
return 0;
}
mdelay(4000); // busy-wait for 4 seconds
might_resched();
delay(3000); // busy wait for 3 seconds
if (copy_to_user(buf , "hello" , len)) {
return -EFAULT;
} else {
*ppos +=len;
return len;
}
}
如果我们注释掉may_resched()行,它将总共延迟7秒钟,如果其他高优先级线程处于唤醒状态,则添加cond_resched调用将检查并执行上下文切换。将在5秒钟后调用(调用之前1秒钟,内核中4秒钟)
输出:
# insmod ./demo.ko
#./app
thread1 start time=320
thread2 start
thread1 stop time=325
thread2 stop
end test
完全实时抢占
如果您应用RT补丁 ,您将获得Hard实时内核。这意味着任何代码都可以阻止其他代码,如果您运行中断服务程序代码,并且需要处理更紧急的事情,它将阻止ISR代码。该补丁会更改以下内容:
- 将硬件中断转换为RT优先级为50的线程
- 将SoftIRQ转换为具有RT 49优先级的线程
- 将所有自旋锁转换为互斥锁
- 配置和使用高分辨率定时器
- 一些更小的功能
应用补丁后,您可以在菜单中看到另外两个选项:
选项“抢占式内核(基本RT)”用于调试(请参阅文档)
要进行上述所有更改,您需要选择最后一个选项–完全可抢占内核。
现在,如果您创建一个RT优先级大于50的线程,它将阻止中断
请注意,在此配置中,系统具有更多任务,并且每秒执行更多上下文切换。也就是说,CPU花费更多的时间来切换任务,但是我们可以按要求的任何最后期限(1毫秒或更长时间)