阿里面试题:Ngin之epoll模型是怎么运用的
对于 nginx,相信有过 web 服务部署经验的同学都不陌生,它有以下特点:
特点1:
是一个高性能的 http 和反向代理服务器,也是一个 imap/pop3/smtp 代理服务器。
特点2:
nginx 相较于 apache 具有占有内存少,稳定性高等优势,并且依靠并发能力强,丰富的模块库以及友好灵活的配置而闻名。
nginx 目前部署量逐渐增加,大多数运维人员多多少少都懂点 nginx,但是真正其明白原理的可能少之又少,在许多面试中可能就 nginx 会涉及一些实现层面的问题。比如一道阿里的面试题是:说说看 nginx 所使用的 epoll 模型是什么?
错误回答:nginx 相比较其他服务器来说就是快,高并发,快速响应,因为用了 epoll......
所以 epoll 以及一般可以同时见到的 select 或者 poll 分别是什么呢?
三个都是 io 多路复用的机制,可以监视多个描述符的读 / 写等事件,一旦某个描述符就绪(一般是读或者写事件发生了),就能够将发生的事件通知给关心的应用程序去处理该事件。
一些 linux 知识铺垫
在实际开始前,我们先回顾一点 linux 的知识,对于 linux 而言:
一切都是文件
然而为了区分不同类型的事物,我们有了:
普通文件
目录文件
链接文件
设备文件
其中文件描述符(file descriptor)是内核为了高效管理已被打开的文件所创建的索引,其值是一个非负整数(通常是小整数),用于指代被打开的文件,所有执行 i/o 操作的系统调用都通过文件描述符。
如果直接这么讲可能有些难以理解,对于 linux 有一些使用的用户来说,会有类似如下的写法:
g++ lots_of_errors 2>&1 | head
其中2>&1中的 2 就是表示的「标准错误」,1 就是「标准输出」,中间的 & 表示后面跟的数字是文件描述符而不是一个文件(不然所有的「标准错误」就都重定向到了一个名为 1 的文件中了)。
有了上面的知识,我们就可以开始来探索 select,poll 和 epoll 分别是什么了~
多路复用
如文初的说明表示,这三者都是 i/o 多路复用机制,且简要介绍了多路复用的定义,那么如何更加直观地了解多路复用呢?这里有张图:
对于网页服务器 nginx 来说,会有很多连接进来, epoll 会把他们都监视起来,然后像拨开关一样,谁有数据就拨向谁,然后调用相应的代码处理。
一般来说以下场合需要使用 i/o 多路复用:
当客户处理多个描述字时(一般是交互式输入和网络套接口)
如果一个服务器既要处理 tcp,又要处理 udp,一般要使用 i/o 复用
如果一个 tcp 服务器既要处理监听套接口,又要处理已连接套接口
select (1983)
对应的头文件和函数原型为:
- #include <sys/select.h>
- #include <sys/time.h>
-
int select (int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); /* returns: positive count of ready descriptors, 0 on timeout, –1 on error */
i/o 多路复用这个概念被提出来以后, select 是第一个实现,一个 select 的调用过程图如下所示:
其缺点为:
每次调用 select,都需要把 fd 集合从用户态拷贝到内核态,这个开销在 fd 很多时会很大
同时每次调用 select 都需要在内核遍历传递进来的所有 fd,这个开销在 fd 很多时也很大
select 支持的文件描述符数量只有 1024,非常小
如果系统支持的文件描述符数量不够,在 linux 上一般就会表现为:
- too many open files (24)
此时就需要通过类似:ulimit -n 2048的方式来临时提升。
poll (1997)
对应的头文件和函数原型为:
- #include <sys/poll.h>
- int poll (struct pollfd *fdarray, unsigned long nfds, int timeout);
- /* returns: count of ready descriptors, 0 on timeout, –1 on error */
poll 和 select 原理一样,不过相比较 select 而言,poll 可以支持大于 1024 个文件描述符。
epoll (2002)
对应的头文件和函数原型为:
- #include <sys/epoll.h>
- int epoll_create(int size);
- int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
- int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
相比较 select 和 poll,epoll 的最大特点是:
epoll 现在是线程安全的,而 select 和 poll 不是。
epoll 内部使用了 mmap 共享了用户和内核的部分空间,避免了数据的来回拷贝。
epoll 基于事件驱动,epoll_ctl 注册事件并注册 callback 回调函数,epoll_wait 只返回发生的事件避免了像 select 和 poll 对事件的整个轮寻操作。
什么是回调?一个简单的例子:
四六级考试成绩快要出来的那段时间,小张每隔一段时间就去尝试查一下成绩,这个被称为轮训。
小张并不在意疯狂刷新页面的事情,等到四六级成绩出来之后他的手机会自动收到考试院推送的一个小时:「叮,你的六级没过」,这样就是回调。
另一个方便理解的对比如下:
对于 select / poll 模型来说,可以理解为让酒店代理订票,然后每隔几个小时就问一下买到没有,酒店在第二天订到了票,交钱给酒店拿到票,这样会需要额外的打电话时间和精力。
对于 epoll 来说则是委托酒店帮忙订票,但是并不反复去问,酒店在第二天买到了票,酒店打电话通知来领票,交钱给酒店拿到票。
epoll 和 nginx
回到文章开头,最后我们可以简单总结一下为什么有了 epoll 的 nginx 会有很高的运行效率,其原因在于它使用了异步,非阻塞,io 多路复用。但是我们是不是就应该吹爆 nginx,表示「nginx 完爆 apache」呢?
其实不是,相比较 nginx 而言,apache 作为一个非常老牌的网页服务器,其有丰富的模块组件支持,稳定性强,bug 少,动态内容处理强,而 nginx 的优势主要则在于占用资源少,负载均衡,高并发处理强,静态内容处理高效,所有只有掌握了自己的具体业务场景,才可以分情况地讨论这两个服务器之间的区别。
对于 nginx 而言,其实还有许多高频面试题,例如:
nginx 常用命令有哪些?
需要熟悉:nginx -t ,nginx -s stop 之类
nginx 返回 502 错误的可能原因?
这个得分情况分类讨论,一般可能是后端服务器挂了,也有可能是 proxy buffer 不够
正向代理和反向代理之间的区别是什么?
正向代理:代理端代理的是客户端反向代理:代理端代理的是服务端
什么是负载均衡?
代理服务器将接收的请求均衡的分发到各服务器