php正则解析apache日志文件文件
$logLine ='127.0.0.1 - - [22/May/2015:17:09:13 +0800] "GET /sale/images/y-select.png HTTP/1.1" 200 1095'; $pattern = '/^(?P[0-9.]+) - - \[(?P
也可是这样
运用正则表达式分隔Apache日志文件
www.MyException.Cn 网友分享于:2015-08-26 浏览:17次
使用正则表达式分隔Apache日志文件
通用日志格式的Apache日志文件示例:
127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326
组合日志格式的Apache日志文件示例:
127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 "http://www.example.com/start.html" "Mozilla/4.08 [en] (Win98; I ;Nav)"
客户端的IP地址。
由客户端identd进程判断的RFC1413身份(identity),输出中的符号"-"表示此处的信息无效。
HTTP认证系统得到的访问该网页的客户标识(userid),如果网页没有设置密码保护,则此项将是"-"。
服务器完成请求处理时的时间。
客户的动作\请求的资源\使用的协议。
服务器返回给客户端的状态码。
返回给客户端的不包括响应头的字节数.如果没有信息返回,则此项应该是"-"。
"Referer"请求头。
"User-Agent"请求头。
用来提取信息的正则表达式组成:
^ :匹配每一行的开头。
([0-9.]+)\s :匹配IP地址。
([\w.-]+)\s :匹配identity,由数字字母下划线或点分隔符组成。
([\w.-]+)\s :匹配userid,由数字字母下划线或点分隔符组成。
(\[[^\[\]]+\])\s :匹配时间。
"((?:[^"]|\")+)"\s :匹配请求信息,双引号中可能出现转义的双引号\"。
(\d{3})\s :匹配状态码。
(\d+|-)\s :匹配响应字节数或-。
"((?:[^"]|\")+)"\s :匹配"Referer"请求头,双引号中可能出现转义的双引号\"。
"((?:[^"]|\")+)" :匹配"User-Agent"请求头,双引号中可能出现转义的双引号\"。
$ :匹配行尾。
最终的表达式如下:
^([0-9.]+)\s([\w.-]+)\s([\w.-]+)\s(\[[^\[\]]+\])\s"((?:[^"]|\")+)"\s(\d{3})\s(\d+|-)\s"((?:[^"]|\")+)"\s"((?:[^"]|\")+)"$
上一篇: JS实现微信号随机切换
下一篇: 使用PM2管理nodejs进程分享
推荐阅读
-
php 使用expat方式解析xml文件操作示例
-
nginx比apache处理静态文件速度快,但是nginx处理大量并发的php请求时,容易出现502错误,频率大概是多少
-
修改apache配置文件去除thinkphp url中的index.php
-
解析PHP SPL标准库的用法(遍历目录,查找固定条件的文件)
-
Apache下禁止php文件被直接访问的解决方案
-
PHP中设置时区,记录日志文件的实现代码
-
python实现分析apache和nginx日志文件并输出访客ip列表的方法
-
apache日志文件详解和实用分析命令
-
apache+php上传大文件以上传100M为例
-
php的SimpleXML方法读写XML接口文件实例解析