《Linux内核设计与实现》读书笔记——第一二章
20135301张忻
估算学习时间:共2小时
读书:1.5
代码:0
作业:0
博客:0.5
实际学习时间:共2.5小时
读书:2.0
代码:0
作业:0
博客:0.5
耗时估计的公式:Y=X+X/N ,Y=X-X/N
第一章 Linux内核简介
1.1 Unix的历史
- 由于Unix系统设计简洁并且在发布时提供源代码,所以许多其他组织和团体都对它进了进一步的开发。
- Unⅸ虽然已经使用了40年,但计算机科学家仍然认为它是现存操作系统中最强大和最优秀的系统。从1969年诞生以来,由Dennis Ritchie和Ken Thompson的灵感火花点亮的这个Unix产物已经成为一种传奇,它历经了时间的考验依然声名不坠。
1.2 追寻Linus足迹:Linux简介
1.3 操作系统和内核简介
处理器在任何指定时间点上的活动范围可以概括为下列三者之一:
- 运行于内核空间,处于进程上下文,代表某个特定的进程执行。
- 运行于内核空间,处于中断上下文,与任何进程无关,处理某个特定的中断。
- 运行于用户空间,执行用户进程。
1.4 Linux内核和传统Unix内核的比较
Linux内核和传统UNIX内核特点的比较
- Linux支持动态加载内核模块。
- Linux支持对称多处理(SMP)机制
- Linux内核可以抢占。
- Linux内核并不区分线程和其他的一般进程
1.5 Linux内核版本
命名规则:
1.6 Linux内核开发者社区
这个社区最重要的论坛:Linux kernel mailing list(lkml)
1.7 小结
第二章 从内核出发
这一章介绍Linux内核一些基本常识:从何处获取源码,如何编译它,又如何安装新内核。
2.1 获取内核源码
- 在Linux内核官方网站http://www.kernel.org,可以随时获取当前版本的Linux源代码,可以是完整的压缩形式,也可以是增量补丁形式。
- 除非特殊情况下需要Linux源码的旧版本,一般都希望拥有最新的代码。kernel.org是源码的库存之处,那些领导潮流的内核开发者所发布的增量补丁也放在这里。
2.1.1 使用Git
2.1.2 安装内核源代码
- 如果压缩形式是bzip2,则运行:
$ tar xvjf linux-x.y.z.tar.bz2 - 如果压缩形式是GNU的zip,则运行
$ tar xvzf linux-x.y.z.tar.gz
解压后的源代码位于linux-x.y.z.目录下。 - 何处安装源码:内核源码一般安装在/usr/src/linux目录下。
2.1.3 使用补丁
- 内核版本在不断更新,增量补丁可以作为版本转移的桥梁。
- 优点:节约了带宽,还省了时间
- 要应用增量补丁,从你的内部源码树开始,只是运行:
$ patch p1 < ../patch-x.y.z - 一般说来,一个给定版本的内核补丁总是打在前一个版本上
2.2 内核源码树
内核源码树由很多目录组成,而大多数目录又包含更多的子目录。源码树的根目录及其子目录如表所示。
目录 描述
arch 特定体系结构的源码
crypto Crypto API
Documentation 内核源码文档
drivers 设备驱动程序
fs VFS和各种文件系统
include 内核头文件
init 内核引导和初始化
ipc 进程间通信代码
kernel 像调度程序这样的核心子系统
lib 通用内核函数
mm 内存管理子系统和VM
net 网络子系统
scripts 编译内核所用的脚本
security Linux安全模块
sound 语音子系统
usr 早期用户空间代码 (所谓的 initramfs)
2.3 编译内核
2.3.1 配置内核
- 在编译内核之前,首先你必须配置它。
- 可以配置的各种选项,以CONFIG_FEATURE形式表示,其前缀为CONFIG。
- 配置选项既可以用来决定那些文件编译进内核,也可以通过预处理命令处理代码。
- 这些配置项要么是二选一,要么是三选一。二选一就是yes或no。比如说CONFIG_PREEMPT就是二选一,表示内核抢占功能是否开启。三选一可以是yes、no或module。Module意味着该配置项被选定了,但编译的时候这部分功能的实现代码是以模块(一种可以动态安装的独立代码段)的形式生成。在三选一的情况下,显然yes选项表示把代码编译进主内核映像中,而不是作为一个模块。驱动程序一般都用三选一的配置项。
2.3.2 减少编译的垃圾信息
- 我们希望在编译时看到错误和警告信息,但对匆匆掠过屏幕的垃圾信息不感兴趣,可以用下面的技巧来实现愿望:
make > some_other_file - 一旦需要查看编译的输出信息,可以查看这个文件。不过,因为错误和警告都会在屏幕上显示,所以你需要看这个文件的可能性不大。事实上,我只不过敲入如下命令
$ make > /dev/null
这就把无用的输出信息重定向到永无返回值的黑洞/dev/null。
2.3.3 衍生多个编译作业
- 为了以多个作业编译内核,使用以下命令:
$ make -jn - 这里,n是要衍生的作业数,在实际中,每个处理器上一般衍生一个或者两个作业。例如,在一个双处理器上,可以输入如下命令:
$ make –j4
2.3.4 安装新内核
- 模块的安装是自动的,也是独立于体系结构的。以root身份,只要运行:
% make modules_install
就可以把所有已编译的模块安装到正确的主目录/lib下。
2.4 内核开发的特点
Linux内核编程与用户空间内应用程序开发的差异
- Linux内核编程时不能访问C库
- Linux内核编程时必须使用GNU C
- Linux内核编程时缺乏像用户空间那样的内存保护机制。
- Linux内核编程时浮点数很难使用。
- 内核只有一个很小的定长堆栈。
- 由于内核支持异步中断、抢占式和SMP,因此必须时刻注意同步和并发。
- 要考虑可移植性的重要性。
2.4.1 无libc库抑或无标准头文件
- 大部分常用的C库函数在内核中都已经得到实现了。比如说操作字符串的函数组就位于lib/string.c文件中。只要包含<linux/string.h>头文件,就可以使用它们。
- 在所有没有实现的函数中,最著名的就数printf()函数了。内核代码虽然无法调用printf(),但它可以调用printk()函数。
2.4.2 GNU C
内核开发者使用的C语言涵盖了ISO C995标准和GNU C扩展特性。
- 内联(inline)函数
- 内联汇编
- 分支声明
2.4.3 没有内存保护机制
- 如果一个用户程序试图进行一次非法的内存访问,内核会发现这个错误,发送 SIGSEGV,并结束整个进程。
- 内核中发生的内存错误会导致oops,这是内核中出现的最常见的一类错误。
- 内核中的内存都不分页。
2.4.4 不要轻易在内核中使用浮点数
- 在执行浮点指令时到底会做些什么,因体系结构不同,内核的选择也不同,但是,内核通常捕获陷阱并做相应处理。
- 和用户空间进程不同,内核并不能完美地支持浮点操作,因为它本身不能陷入。
2.4.5 容积小而固定的栈
- 内核栈的准确大小随体系结构而变。在x86上,栈的大小在编译时配置,可以是4KB也可以是8KB。
- 从历史上说,内核栈的大小是两页,这就意味着,32位机的内核栈是8KB,而64位机是16KB,这是固定不变的。
- 每个处理器都有自己的栈。
2.4.6 同步和并发
- Linux是抢占多任务操作系统。内核的进程调度程序即兴对进程进行调度和重新调度。内核必须对这些任务同步。
- Linux内核支持多处理器系统。
- 中断是异步到来的,完全不顾及当前正在执行的代码。
- Linux内核可以抢占。
2.4.7 可移植性的重要性
- Linux是一个可移植的操作系统,
- 必须把体系结构相关的代码从内核代码树的特定目录中适当地分离出来。
2.5 小结
内核的确是一头独一无二的猛兽:没有内存保护,没有靠得住的libc,小的堆栈,庞大的源码树。Linux内核遵循它自己的游戏规则,以大人物的架势运行, 运行足够长的时间后才停止,打破了我们惯以为常的习俗。尽管如此,内核不外乎就是一个程序,它与我们司空见惯的程序没有多大区别。不必望而生畏:直面它、呼唤它、摆布它。