Linux服务器nginx访问日志里出现大量http 400错误的请求分析

程序员文章站 2022-05-20 22:57:45

服务器中的错误记录类似于这种： 124.65.133.242 – – [27/oct/2014:14:30:51 +0800] “-” 400 0 “-” “-”...

服务器中的错误记录类似于这种：

124.65.133.242 – – [27/oct/2014:14:30:51 +0800] “-” 400 0 “-” “-”
124.65.133.242 – – [27/oct/2014:14:31:45 +0800] “-” 400 0 “-” “-”
124.65.133.242 – – [27/oct/2014:14:31:45 +0800] “-” 400 0 “-” “-”
124.65.133.242 – – [27/oct/2014:14:31:45 +0800] “-” 400 0 “-” “-”

踩点

经过分析nginx的log文件，发现都是在一次正常访问之后产生的数个400错误，每次有大概连续出现1-6个不等，而且也并不是每次客户访问都会产生400错误。

再观察产生400错误的前一次访问是很正常的，200状态码，正常的文件，正常的来路，正常的user-agent… 一切都很和谐，那400是肿么来的呢？

通过仔细观察发现，所有产生400错误的前一次访问的user-agent都是google chrome浏览器留下的，也就是说400错误是由chrome浏览器产生的。但是经过本地抓包发现，chrome是没有向服务器发送异常请求或者数据包的。

在抓包分析中发现，chrome在访问服务器时发起的连接不止一个，一般有5到6个不等，而如果请求的资源不需要那么多连接时，chrome就会关闭未用的连接，这项技术叫做pre-connection“预先连接”。

通常我们访问一个网站时，第一个获取的是一个html主文件，而里面链接了网页所需要的css、js、图片等其他媒体资源文件，而一般资源文件和主 html文件是在一个域下的，预先连接就是在获取html之前就建立很多的tcp连接，而不是等到获取到html文件之后再去连接服务器获取其他的文件，因为连接服务器是需要消耗一些时间的，所以这项技术可以很大程度上加快网页的呈现速度。

如果网页html链接的资源比较少，或者客户端有缓存，不需要连接下载，那么chrome浏览器发出的5-6个连接很可能只有1个是需要的，其他的都得关闭掉，这样就产生了一个问题：连接了服务器，而没有发送任何请求。对于这种情况，nginx是当做400错误来处理的，但由于连接已经关闭，错误信息不会发送到客户端，这就产生了日志文件中记录了错误，而抓包分析中什么也看不到的现象。

测试
要验证上面的分析结果很简单，打开命令行cmd.exe，在里面输入telnet serverip 80，等待连接成功之后直接关掉cmd，这时去查看nginx的log文件中就多了一条400错误记录。

一句评论
pre-connection的优点已经很清楚了，但是它也是有缺点的，如果站长做了优化，使用了cookie-free技术，或者网页和静态资源使用不同的服务器，那么网页需要的css、js资源就和主html不在同一个域下，也可能不在同一个ip上，那么pre-connection不仅是鸡肋，而且会对主html服务器产生不必要的负担。

其它原因

网上很多人写过相关的文章，大多的人的原因是因为 header 的头部大小超了，引起响应 400 告诉是 bad request.但其实还有一种可能，就是象端口测试工具，只是检查端口是否是活的。像 lvs 之类什么的，也会引起这种问题，然后日志中会出现大量的 400 错误。

对于上述问题可以在nginx.conf中，将client_header_buffer_size和large_client_header_buffers都调大，可缓解此问题。

上一篇：大数据学习路线，来qun里分享干货，

下一篇：香辣虾火锅在家怎么做