Tomcat源码分析 (十)----- 彻底理解 Session机制
tomcat session 概述
首先 http 是一个无状态的协议, 这意味着每次发起的http请求, 都是一个全新的请求(与上个请求没有任何联系, 服务端不会保留上个请求的任何信息), 而 session 的出现就是为了解决这个问题, 将 client 端的每次请求都关联起来, 要实现 session 机制 通常通过 cookie(cookie 里面保存统一标识符号), uri 附加参数, 或者就是ssl (就是ssl 中的各种属性作为一个client请求的唯一标识), 而在初始化 applicationcontext 指定默认的session追踪机制(url + cookie), 若 connector 配置了 sslenabled, 则将通过 ssl 追踪session的模式也加入追踪机制里面 (将 applicationcontext.populatesessiontrackingmodes()方法)
cookie 概述
cookie 是在http传输中存在于header中的一小撮文本信息(kv), 每次浏览器都会将服务端发送给自己的cookie信息返回发送给服务端(ps: cookie的内容存储在浏览器端); 有了这种技术服务端就知道这次请求是谁发送过来的(比如我们这里的session, 就是基于在http传输中, 在cookie里面加入一个全局唯一的标识符号jsessionid来区分是哪个用户的请求)
tomcat 中 cookie 的解析
在 tomcat 8.0.5 中 cookie 的解析是通过内部的函数 processcookies() 来进行操作的(其实就是将http header 的内容直接赋值给 cookie 对象, cookie在header中找name是"cookie"的数据, 拿出来进行解析), 我们这里主要从 jsessionid 的角度来看一下整个过程是如何触发的, 我们直接看函数 coyoteadapter.postparserequest() 中解析 jsessionid 那部分
// 尝试从 url, cookie, ssl 回话中获取请求的 id, 并将 maprequired 设置为 false string sessionid = null; // 1. 是否支持通过 uri 尾缀 jsessionid 的方式来追踪 session 的变化 (默认是支持的) if (request.getservletcontext().geteffectivesessiontrackingmodes().contains(sessiontrackingmode.url)) { // 2. 从 uri 尾缀的参数中拿取 jsessionid 的数据 (sessionconfig.getsessionuriparamname 是获取对应cookie的名字, 默认 jsessionid, 可以在 web.xml 里面进行定义) sessionid = request.getpathparameter( sessionconfig.getsessionuriparamname(request.getcontext())); if (sessionid != null) { // 3. 若从 uri 里面拿取了 jsessionid, 则直接进行赋值给 request request.setrequestedsessionid(sessionid); request.setrequestedsessionurl(true); } } // look for session id in cookies and ssl session // 4. 通过 cookie 里面获取 jsessionid 的值 parsesessioncookiesid(req, request); // 5. 在 ssl 模式下获取 jsessionid 的值 parsesessionsslid(request); /** * parse session id in url. */ protected void parsesessioncookiesid(org.apache.coyote.request req, request request) { // if session tracking via cookies has been disabled for the current // context, don't go looking for a session id in a cookie as a cookie // from a parent context with a session id may be present which would // overwrite the valid session id encoded in the url context context = request.getmappingdata().context; // 1. tomcat 是否支持 通过 cookie 机制 跟踪 session if (context != null && !context.getservletcontext() .geteffectivesessiontrackingmodes().contains( sessiontrackingmode.cookie)) { return; } // parse session id from cookies // 2. 获取 cookie的实际引用对象 (ps: 这里还没有触发 cookie 解析, 也就是 servercookies 里面是空数据, 数据还只是存储在 http header 里面) cookies servercookies = req.getcookies(); // 3. 就在这里出发了 cookie 解析header里面的数据 (ps: 其实就是 轮训查找 header 里面那个 name 是 cookie 的数据, 拿出来进行解析) int count = servercookies.getcookiecount(); if (count <= 0) { return; } // 4. 获取 sessionid 的名称 jsessionid string sessioncookiename = sessionconfig.getsessioncookiename(context); for (int i = 0; i < count; i++) { // 5. 轮询所有解析出来的 cookie servercookie scookie = servercookies.getcookie(i); // 6. 比较 cookie 的名称是否是 jsessionid if (scookie.getname().equals(sessioncookiename)) { logger.info("scookie.getname().equals(sessioncookiename)"); logger.info("arrays.aslist(thread.currentthread().getstacktrace()):" + arrays.aslist(thread.currentthread().getstacktrace())); // override anything requested in the url // 7. 是否 jsessionid 还没有解析 (并且只将第一个解析成功的值 set 进去) if (!request.isrequestedsessionidfromcookie()) { // accept only the first session id cookie // 8. 将messagebytes转成 char convertmb(scookie.getvalue()); // 9. 设置 jsessionid 的值 request.setrequestedsessionid(scookie.getvalue().tostring()); request.setrequestedsessioncookie(true); request.setrequestedsessionurl(false); if (log.isdebugenabled()) { log.debug(" requested cookie session id is " + request.getrequestedsessionid()); } } else { // 10. 若 cookie 里面存在好几个 jsessionid, 则进行覆盖 set 值 if (!request.isrequestedsessionidvalid()) { // replace the session id until one is valid convertmb(scookie.getvalue()); request.setrequestedsessionid (scookie.getvalue().tostring()); } } } } }
tomcat session 设计分析
tomcat session 组件图如下所示,其中 context
对应一个 webapp 应用,每个 webapp 有多个 httpsessionlistener
, 并且每个应用的 session 是独立管理的,而 session 的创建、销毁由 manager
组件完成,它内部维护了 n 个 session
实例对象。在前面的文章中,我们分析了 context
组件,它的默认实现是 standardcontext
,它与 manager
是一对一的关系,manager
创建、销毁会话时,需要借助 standardcontext
获取 httpsessionlistener
列表并进行事件通知,而 standardcontext
的后台线程会对 manager
进行过期 session 的清理工作
org.apache.catalina.manager
接口的主要方法如下所示,它提供了 context
、org.apache.catalina.sessionidgenerator
的 getter/setter 接口,以及创建、添加、移除、查找、遍历 session
的 api 接口,此外还提供了 session
持久化的接口(load/unload) 用于加载/卸载会话信息,当然持久化要看不同的实现类
public interface manager { public context getcontext(); public void setcontext(context context); public sessionidgenerator getsessionidgenerator(); public void setsessionidgenerator(sessionidgenerator sessionidgenerator); public void add(session session); public void addpropertychangelistener(propertychangelistener listener); public void changesessionid(session session); public void changesessionid(session session, string newid); public session createemptysession(); public session createsession(string sessionid); public session findsession(string id) throws ioexception; public session[] findsessions(); public void remove(session session); public void remove(session session, boolean update); public void removepropertychangelistener(propertychangelistener listener); public void unload() throws ioexception; public void backgroundprocess(); public boolean willattributedistribute(string name, object value); }
tomcat8.5 提供了 4 种实现,默认使用 standardmanager
,tomcat 还提供了集群会话的解决方案,但是在实际项目中很少运用
- standardmanager:manager 默认实现,在内存中管理 session,宕机将导致 session 丢失;但是当调用 lifecycle 的 start/stop 接口时,将采用 jdk 序列化保存 session 信息,因此当 tomcat 发现某个应用的文件有变更进行 reload 操作时,这种情况下不会丢失 session 信息
- deltamanager:增量 session 管理器,用于tomcat集群的会话管理器,某个节点变更 session 信息都会同步到集群中的所有节点,这样可以保证 session 信息的实时性,但是这样会带来较大的网络开销
- backupmanager:用于 tomcat 集群的会话管理器,与deltamanager不同的是,某个节点变更 session 信息的改变只会同步给集群中的另一个 backup 节点
- persistentmanager:当会话长时间空闲时,将会把 session 信息写入磁盘,从而限制内存中的活动会话数量;此外,它还支持容错,会定期将内存中的 session 信息备份到磁盘
我们来看下 standardmanager
的类图,它也是个 lifecycle
组件,并且 managerbase
实现了主要的逻辑。
tomcat 中 session 的创建
经过上面的cookie解析, 则若存在jsessionid的话, 则已经set到request里面了, 那session又是何时触发创建的呢? 主要还是代码 request.getsession(), 看代码:
public class sessionexample extends httpservlet { public void doget(httpservletrequest request, httpservletresponse response) throws ioexception, servletexception { httpsession session = request.getsession(); // other code...... } }
我们来看看getsession():
// 获取 request 对应的 session public httpsession getsession() { // 这里就是 通过 managerbase.sessions 获取 session session session = dogetsession(true); if (session == null) { return null; } return session.getsession(); } // create 代表是否创建 standardsession protected session dogetsession(boolean create) { // there cannot be a session if no context has been assigned yet // 1. 检验 standardcontext if (context == null) { return (null); } // return the current session if it exists and is valid // 2. 校验 session 的有效性 if ((session != null) && !session.isvalid()) { session = null; } if (session != null) { return (session); } // return the requested session if it exists and is valid manager manager = null; if (context != null) { //拿到standardcontext 中对应的standardmanager,context与 manager 是一对一的关系 manager = context.getmanager(); } if (manager == null) { return (null); // sessions are not supported } if (requestedsessionid != null) { try { // 3. 通过 managerbase.sessions 获取 session // 4. 通过客户端的 sessionid 从 managerbase.sessions 来获取 session 对象 session = manager.findsession(requestedsessionid); } catch (ioexception e) { session = null; } // 5. 判断 session 是否有效 if ((session != null) && !session.isvalid()) { session = null; } if (session != null) { // 6. session access +1 session.access(); return (session); } } // create a new session if requested and the response is not committed // 7. 根据标识是否创建 standardsession ( false 直接返回) if (!create) { return (null); } // 当前的 context 是否支持通过 cookie 的方式来追踪 session if ((context != null) && (response != null) && context.getservletcontext().geteffectivesessiontrackingmodes().contains(sessiontrackingmode.cookie) && response.getresponse().iscommitted()) { throw new illegalstateexception (sm.getstring("coyoterequest.sessioncreatecommitted")); } // attempt to reuse session id if one was submitted in a cookie // do not reuse the session id if it is from a url, to prevent possible // phishing attacks // use the ssl session id if one is present. // 8. 到这里其实是没有找到 session, 直接创建 session 出来 if (("/".equals(context.getsessioncookiepath()) && isrequestedsessionidfromcookie()) || requestedsessionssl ) { session = manager.createsession(getrequestedsessionid()); // 9. 从客户端读取 sessionid, 并且根据这个 sessionid 创建 session } else { session = manager.createsession(null); } // creating a new session cookie based on that session if ((session != null) && (getcontext() != null)&& getcontext().getservletcontext().geteffectivesessiontrackingmodes().contains(sessiontrackingmode.cookie)) { // 10. 根据 sessionid 来创建一个 cookie cookie cookie = applicationsessioncookieconfig.createsessioncookie(context, session.getidinternal(), issecure()); // 11. 最后在响应体中写入 cookie response.addsessioncookieinternal(cookie); } if (session == null) { return null; } // 12. session access 计数器 + 1 session.access(); return session; }
我们看看 manager.createsession(null);
public abstract class managerbase extends lifecyclembeanbase implements manager { //manager管理着当前context的所有session protected map<string, session> sessions = new concurrenthashmap<>(); @override public session findsession(string id) throws ioexception { if (id == null) { return null; } //通过jssionid获取session return sessions.get(id); } public session createsession(string sessionid) { // 1. 判断 单节点的 session 个数是否超过限制 if ((maxactivesessions >= 0) && (getactivesessions() >= maxactivesessions)) { rejectedsessions++; throw new toomanyactivesessionsexception( sm.getstring("managerbase.createsession.ise"), maxactivesessions); } // recycle or create a session instance // 创建一个 空的 session // 2. 创建 session session session = createemptysession(); // initialize the properties of the new session and return it // 初始化空 session 的属性 session.setnew(true); session.setvalid(true); session.setcreationtime(system.currenttimemillis()); // 3. standardsession 最大的默认 session 激活时间 session.setmaxinactiveinterval(this.maxinactiveinterval); string id = sessionid; // 若没有从 client 端读取到 jsessionid if (id == null) { // 4. 生成 sessionid (这里通过随机数来生成) id = generatesessionid(); } //这里会将session存入map<string, session> sessions = new concurrenthashmap<>(); session.setid(id); sessioncounter++; sessiontiming timing = new sessiontiming(session.getcreationtime(), 0); synchronized (sessioncreationtiming) { // 5. 每次创建 session 都会创建一个 sessiontiming, 并且 push 到 链表 sessioncreationtiming 的最后 sessioncreationtiming.add(timing); // 6. 并且将 链表 最前面的节点删除 sessioncreationtiming.poll(); } // 那这个 sessioncreationtiming 是什么作用呢, 其实 sessioncreationtiming 是用来统计 session的新建及失效的频率 (好像zookeeper 里面也有这个的统计方式) return (session); } @override public void add(session session) { //将创建的seesion存入map<string, session> sessions = new concurrenthashmap<>(); sessions.put(session.getidinternal(), session); int size = getactivesessions(); if( size > maxactive ) { synchronized(maxactiveupdatelock) { if( size > maxactive ) { maxactive = size; } } } } } @override public void setid(string id) { setid(id, true); } @override public void setid(string id, boolean notify) { if ((this.id != null) && (manager != null)) manager.remove(this); this.id = id; if (manager != null) manager.add(this); if (notify) { tellnew(); } }
其主要的步骤就是:
1. 若 request.session != null, 则直接返回 (说明同一时刻之前有其他线程创建了session, 并且赋值给了 request)
2. 若 requestedsessionid != null, 则直接通过 manager 来进行查找一下, 并且判断是否有效
3. 调用 manager.createsession 来创建对应的session,并将session存入manager的map中
4. 根据 sessionid 来创建 cookie, 并且将 cookie 放到 response 里面
5. 直接返回 session
session清理
background 线程
前面我们分析了 session 的创建过程,而 session 会话是有时效性的,下面我们来看下 tomcat 是如何进行失效检查的。在分析之前,我们先回顾下 container
容器的 background 线程。
tomcat 所有容器组件,都是继承至 containerbase
的,包括 standardengine
、standardhost
、standardcontext
、standardwrapper
,而 containerbase
在启动的时候,如果 backgroundprocessordelay
参数大于 0 则会开启 containerbackgroundprocessor
后台线程,调用自己以及子容器的 backgroundprocess
进行一些后台逻辑的处理,和 lifecycle
一样,这个动作是具有传递性的,也就
关键代码如下所示:
containerbase.java protected synchronized void startinternal() throws lifecycleexception { // other code...... // 开启containerbackgroundprocessor线程用于处理子容器,默认情况下backgroundprocessordelay=-1,不会启用该线程 threadstart(); } protected class containerbackgroundprocessor implements runnable { public void run() { // threaddone 是 volatile 变量,由外面的容器控制 while (!threaddone) { try { thread.sleep(backgroundprocessordelay * 1000l); } catch (interruptedexception e) { // ignore } if (!threaddone) { processchildren(containerbase.this); } } } protected void processchildren(container container) { container.backgroundprocess(); container[] children = container.findchildren(); for (int i = 0; i < children.length; i++) { // 如果子容器的 backgroundprocessordelay 参数小于0,则递归处理子容器 // 因为如果该值大于0,说明子容器自己开启了线程处理,因此父容器不需要再做处理 if (children[i].getbackgroundprocessordelay() <= 0) { processchildren(children[i]); } } } }
session 检查
backgroundprocessordelay
参数默认值为 -1
,单位为秒,即默认不启用后台线程,而 tomcat 的 container 容器需要开启线程处理一些后台任务,比如监听 jsp 变更、tomcat 配置变动、session 过期等等,因此 standardengine
在构造方法中便将 backgroundprocessordelay
参数设为 10(当然可以在 server.xml
中指定该参数),即每隔 10s 执行一次。那么这个线程怎么控制生命周期呢?我们注意到 containerbase
有个 threaddone
变量,用 volatile
修饰,如果调用 container 容器的 stop 方法该值便会赋值为 false,那么该后台线程也会退出循环,从而结束生命周期。另外,有个地方需要注意下,父容器在处理子容器的后台任务时,需要判断子容器的 backgroundprocessordelay
值,只有当其小于等于 0 才进行处理,因为如果该值大于0,子容器自己会开启线程自行处理,这时候父容器就不需要再做处理了
前面分析了容器的后台线程是如何调度的,下面我们重点来看看 webapp 这一层,以及 standardmanager
是如何清理过期会话的。standardcontext
重写了 backgroundprocess
方法,除了对子容器进行处理之外,还会对一些缓存信息进行清理,关键代码如下所示:
standardcontext.java @override public void backgroundprocess() { if (!getstate().isavailable()) return; // 热加载 class,或者 jsp loader loader = getloader(); if (loader != null) { loader.backgroundprocess(); } // 清理过期session manager manager = getmanager(); if (manager != null) { manager.backgroundprocess(); } // 清理资源文件的缓存 webresourceroot resources = getresources(); if (resources != null) { resources.backgroundprocess(); } // 清理对象或class信息缓存 instancemanager instancemanager = getinstancemanager(); if (instancemanager instanceof defaultinstancemanager) { ((defaultinstancemanager)instancemanager).backgroundprocess(); } // 调用子容器的 backgroundprocess 任务 super.backgroundprocess(); }
standardcontext
重写了 backgroundprocess
方法,在调用子容器的后台任务之前,还会调用 loader
、manager
、webresourceroot
、instancemanager
的后台任务,这里我们只关心 manager
的后台任务。弄清楚了 standardmanager
的来龙去脉之后,我们接下来分析下具体的逻辑。
standardmanager
继承至 managerbase
,它实现了主要的逻辑,关于 session 清理的代码如下所示。backgroundprocess 默认是每隔10s调用一次,但是在 managerbase
做了取模处理,默认情况下是 60s 进行一次 session 清理。tomcat 对 session 的清理并没有引入时间轮,因为对 session 的时效性要求没有那么精确,而且除了通知 sessionlistener
。
managerbase.java public void backgroundprocess() { // processexpiresfrequency 默认值为 6,而backgroundprocess默认每隔10s调用一次,也就是说除了任务执行的耗时,每隔 60s 执行一次 count = (count + 1) % processexpiresfrequency; if (count == 0) // 默认每隔 60s 执行一次 session 清理 processexpires(); } /** * 单线程处理,不存在线程安全问题 */ public void processexpires() { long timenow = system.currenttimemillis(); session sessions[] = findsessions(); // 获取所有的 session int expirehere = 0 ; for (int i = 0; i < sessions.length; i++) { // session 的过期是在 isvalid() 里面处理的 if (sessions[i]!=null && !sessions[i].isvalid()) { expirehere++; } } long timeend = system.currenttimemillis(); // 记录下处理时间 processingtime += ( timeend - timenow ); }
清理过期 session
在上面的代码,我们并没有看到太多的过期处理,只是调用了 sessions[i].isvalid()
,原来清理动作都在这个方法里面处理的,相当的隐晦。在 standardsession#isvalid()
方法中,如果 now - thisaccessedtime >= maxinactiveinterval
则判定当前 session 过期了,而这个 thisaccessedtime
参数在每次访问都会进行更新
public boolean isvalid() { // other code...... // 如果指定了最大不活跃时间,才会进行清理,这个时间是 context.getsessiontimeout(),默认是30分钟 if (maxinactiveinterval > 0) { int timeidle = (int) (getidletimeinternal() / 1000l); if (timeidle >= maxinactiveinterval) { expire(true); } } return this.isvalid; }
而 expire
方法处理的逻辑较繁锁,下面我用伪代码简单地描述下核心的逻辑,由于这个步骤可能会有多线程进行操作,因此使用 synchronized
对当前 session 对象加锁,还做了双重校验,避免重复处理过期 session。它还会向 container 容器发出事件通知,还会调用 httpsessionlistener
进行事件通知,这个也就是我们 web 应用开发的 httpsessionlistener
了。由于 manager
中维护了 session
对象,因此还要将其从 manager
移除。session 最重要的功能就是存储数据了,可能存在强引用,而导致 session 无法被 gc 回收,因此还要移除内部的 key/value 数据。由此可见,tomcat 编码的严谨性了,稍有不慎将可能出现并发问题,以及出现内存泄露
public void expire(boolean notify) { //1、校验 isvalid 值,如果为 false 直接返回,说明已经被销毁了 synchronized (this) { // 加锁 //2、双重校验 isvalid 值,避免并发问题 context context = manager.getcontext(); if (notify) { object listeners[] = context.getapplicationlifecyclelisteners(); httpsessionevent event = new httpsessionevent(getsession()); for (int i = 0; i < listeners.length; i++) { //3、判断是否为 httpsessionlistener,不是则继续循环 //4、向容器发出destory事件,并调用 httpsessionlistener.sessiondestroyed() 进行通知 context.firecontainerevent("beforesessiondestroyed", listener); listener.sessiondestroyed(event); context.firecontainerevent("aftersessiondestroyed", listener); } //5、从 manager 中移除该 session //6、向 tomcat 的 sessionlistener 发出事件通知,非 httpsessionlistener //7、清除内部的 key/value,避免因为强引用而导致无法回收 session 对象 } }
由前面的分析可知,tomcat 会根据时间戳清理过期 session,那么 tomcat 又是如何更新这个时间戳呢? tomcat 在处理完请求之后,会对 request
对象进行回收,并且会对 session 信息进行清理,而这个时候会更新 thisaccessedtime
、lastaccessedtime
时间戳。此外,我们通过调用 request.getsession()
这个 api 时,在返回 session 时会调用 session#access()
方法,也会更新 thisaccessedtime
时间戳。这样一来,每次请求都会更新时间戳,可以保证 session 的鲜活时间。
org.apache.catalina.connector.request.java protected void recyclesessioninfo() { if (session != null) { session.endaccess(); // 更新时间戳 } // 回收 request 对象的内部信息 session = null; requestedsessioncookie = false; requestedsessionid = null; requestedsessionurl = false; requestedsessionssl = false; }
org.apache.catalina.session.standardsession.java
public void endaccess() { isnew = false; if (last_access_at_start) { // 可以通过系统参数改变该值,默认为false this.lastaccessedtime = this.thisaccessedtime; this.thisaccessedtime = system.currenttimemillis(); } else { this.thisaccessedtime = system.currenttimemillis(); this.lastaccessedtime = this.thisaccessedtime; } } public void access() { this.thisaccessedtime = system.currenttimemillis(); }
下一篇: 冬瓜怎么吃减肥,它的减肥吃法有哪些呢?