Linux Namespace
目录
- linux namespace
- uts namespace
- ipc namespace
- pid namespace
- mount namespace
- user namespace
- network namespace
linux namespace
linux namespace 是kernel的一个功能,用于隔离系统资源。比如说pid,user id 等。(可以想象一下变成语言变量的命名空间)这样我们就可以将
进程,网络接口,挂载点以及用户做一个隔离。
比如说我们在同一台主机上,需要将资源分给多个类似于root的用户,而且要将其隔离开来互不影响。在我们不去使用多台主机的情况下这里namespace就
派上了用场。使用namespace可以做到uid级别的隔离,也就是说我的ubuntu账户id为5.针对我虚拟化出来一个namespace,在这个namespace了里我有
root用户的权限。在这个系统外,我就是一个普通的用户。甚至都不能访问系统外部。
除了user namespace,pid也可以被虚拟。从用户角度看,我的第一个进程pid是1。但是从系统的角度看这个1只是一个映射关系。他也许在系统上的pid
是5或者x。父命名空间可以看得到子命名空间的状态等等,但是反过来确实不行的。这样下来,我们可以虚拟处多个pid是1的进程但是在父命名空间来看他
们的pid就是a,b,c...等。(这里字母代指数字,)
linux一共实现了6中不通类型的namespace
type | system call parameters 系统调用参数 | kernel version |
---|---|---|
mount namespace | clone_newns | 2.4.19 |
uts namespace | clone_newuts | 2.6.19 |
ipc namespace | clone_newipc | 2.6.19 |
pid namespace | clone_newpid | 2.6.24 |
network namespace | clone_newnet | 2.6.29 |
user namespace | clone_newuser | 3.8 |
namespace的api主要使用如下3个系统调用。
- clone() 创建新进程。根据系统调用参数来判断是哪些类型的namespace被创建,而且他们的子进程也会被包含到这些namespace中。
- unshare() 将进程移出某个namespace。
- setns() 将进程加入到某个namespace。
uts namespace
uts namespace 主要是用来隔离nodename和domainname两个系统标识。在utsnamespace中每个namespace允许有自己的hostname。
使用go来实现
package main import ( "os/exec" "syscall" "os" "log" ) func main() {// cmd := exec.command("sh") //可以理解为进程的名称 cmd.sysprocattr = &syscall.sysprocattr{ cloneflags: syscall.clone_newuts, } cmd.stdin = os.stdin cmd.stdout = os.stdout cmd.stderr = os.stderr if err := cmd.run(); err !=nil{ log.fatal(err) } }
exec.command("sh")用来指定被fork出来的新进程内的初始命令,默认使用sh来执行。
使用clone_newuts这个标识符去创建一个uts namespace。go帮我们封装了对clone方法的调用,在这段代码执行后就会进入sh的环境。
uts以下是测试
- 使用root权限去执行该代码
- 使用pstree -pl 查看进程树
可以看到我们新产生的进程和它的id
- 输出当前进程的pid使用 echo $$
- 可以验证uts namespace 使用 readlink/proc/
- 验证修改hostname 使用 hostname -b
可以看到pid
可以看到uts的namespace
可以验证修改后的hostname
综上:uts namespace达到的预期的效果,的确可以对hostname进行隔离。
ipc namespace
ipc namespace用来隔离system v ipc 和 posix message queues。每个ipc namespace都有自己的system v ipc 和 posix message queues。
修改一行代码就可以进行创建。
package main import ( "log" "os" "os/exec" "syscall" ) func main() { cmd := exec.command("sh") cmd.sysprocattr = &syscall.sysprocattr{ cloneflags: syscall.clone_newuts|syscall.clone_newipc, // 这里新添加了一行代码。 } cmd.stdin = os.stdin cmd.stdout = os.stdout cmd.stderr = os.stderr if err := cmd.run();err !=nil{ log.fatal(err) } }
可以看到 仅仅增加了syscall.clone_newipc说我们希望同时创建一个新的ipc namespace这样就可以了。下面进行演示。
ipc的测试
我们将在两个窗口(一个宿主窗口sh,一个普通的用户窗口)使用ipcs -q 命令进行查看, 使用ipcmk -q命令进行创建。对比两个窗口的显示。
- ipcs -q 命令用于查询 message queue
- ipcms -q 用于创建 message queue
窗口sh
其他窗口
综上:
- 先使用whoami 查看用户
- 使用$$ 查看各自所属的进程
- 使用ipcs -q 查看message queue
- 使用ipcmk -q 创建message queue
可以看到进行了隔离。
pid namespace
pid namespace是用来隔离进程id的。同样一个进程在不同的pid里可以拥有不同的pid。例如使用在docker容器中我们会发现每个容器都有一个进程pid
是1。但在容器外就不是1了。
在上面代码中加入 syscall.clone_nwepid, 代表为fork出来的子进程创建自己的pid namespace。
package main import ( "os/exec" "os" "log" "syscall" ) func main() {// cmd := exec.command("sh") cmd.sysprocattr = &syscall.sysprocattr{ cloneflags: 0x8000000|0x4000000|0x20000000, } cmd.stdin = os.stdin cmd.stdout = os.stdout cmd.stderr = os.stderr if err := cmd.run(); err !=nil{ log.fatal(err) } }
pid的测试
我们同样打开两个窗口,一个是sh的一个是普通的。然后查看pid就可以很明显的看到区别了。
sh窗口
其他窗口
综上:这里可以看到该操作打印了namespace的pid其值为1.也就是说30958被映射到了namespace的1.这里不能使用ps来查看,因为ps和top等命
令会使用/proc内容。
mount namespace
mount namespace 是用来隔离各个进程的挂载点视图的。对于不同的namespace的进程中,看到的文件系统是不一样的。在mount namespace中使用
mount和umount仅仅只会影像当前namespace内的文件系统,而对全局是没有影响的。(第一个加入的namespace类型)
chroot,它也是将一个子目录变成根节点。但是mount namespace更加的方便灵活和安全。
package main import ( "os/exec" "os" "log" "syscall" ) func main() {// cmd := exec.command("sh") cmd.sysprocattr = &syscall.sysprocattr{ cloneflags: 0x8000000|0x4000000|0x20000000|syscall.clone_newns, } cmd.stdin = os.stdin cmd.stdout = os.stdout cmd.stderr = os.stderr if err := cmd.run(); err !=nil{ log.fatal(err) } }
mount namespace测试
- 运行代码
- 查看/proc 下的内容。(宿主机下的)
- 挂在到当前的mountnamespace下
user namespace
user namespace主要是隔离用户的用户组id。也就是说一个进程的user id 和 group id 在user namespace内外可以是不同的。比如说。在宿主机上
以一个非root用户运行创建一个user namespace,然后在user namespace里面被映射成root用户。从linux kernel3.8开始,非root进程也可以创建
user namespace,并且此用户在namespace里可以被映射出root,且在namespace中有root权限。
package main import ( "os/exec" "os" "log" "syscall" ) func main() { cmd := exec.command("sh") cmd.sysprocattr = &syscall.sysprocattr{ cloneflags: syscall.clone_newns| syscall.clone_newipc| syscall.clone_newuts| syscall.clone_newpid|syscall.clone_newuser, } // cmd.sysprocattr.credential = &syscall.credential{uid: uint32(1), gid:uint32(1)} cmd.stdin = os.stdin cmd.stdout = os.stdout cmd.stderr = os.stderr if err := cmd.run();err != nil{ log.fatal(err) } os.exit(-1) }
nweuser 测试
在之前的基础上增加了 syscall.clone_newuser。以root来运行这个程序,看看显示结果。
宿主机的root用户
sh的用户
我们可以看到uid是不通的因此说明user namespace生效了。
network namespace
network namespace 是用来隔离网络设备,ip,port等网络栈的namespace。 network namespace可以让每个容器都有自己独立的网络设备。
而且应用可以绑定到自己的端口,每个namespace还不会冲突。在宿主机器上搭建网桥后,就能很方便的实现容器间的通信,而且不通的容器也可以使
用相同的端口。
package main import ( "os/exec" "os" "log" "syscall" ) func main() {// cmd := exec.command("sh") cmd.sysprocattr = &syscall.sysprocattr{ cloneflags: syscall.clone_newuser|syscall.clone_newpid|syscall.clone_newuts| syscall.clone_newipc|syscall.clone_newns|syscall.clone_newnet, } cmd.stdin = os.stdin cmd.stdout = os.stdout cmd.stderr = os.stderr if err := cmd.run(); err !=nil{ log.fatal(err) } }
network测试
- 先检查自己的网络设备 使用ifconfig
- 在检查一下sh的网络设备 使用ifconfig
宿主窗口
sh窗口
综上:可以看到宿主机器是由网卡等设备的,而sh并没有。两者是隔离的。
上一篇: python开发的 dht网络爬虫