欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

使用CDN之后APACHE日志记录中IP地址不正确的解决方案

程序员文章站 2022-06-05 09:03:11
最近在搞apache日志分析,装好了awstats之后,这两天进行了观察, 报表日期 月 1 月 2010 首次参观日期 2010年01月12日 11:04 最近...

最近在搞apache日志分析,装好了awstats之后,这两天进行了观察,

报表日期 月 1 月 2010
首次参观日期 2010年01月12日 11:04
最近参观日期 2010年01月13日 23:59
    参观者 参观人次 网页数 文件数 字节
浏览器流量 * 77  226  (2.93 参观人次/参观者) 508979 (2252.11 网页数/参观) 509492 (2254.38 文件数/参观) 13.67 g字节 (63430.28 k字节/参观)
非浏览器流量 *  117312 122716 736.24 m字节

这边的结果很让人费解,通过google统计网站的独立ip访问量有2w做,这里显示的数字相差甚远。  后面的网页数和文件数又都与实际相吻合。  经过查找原因发现 apache日志里记录的ip地址不正确,大部分都是cdn的节点地址。 产生的原因很显然是因为cdn造成的,之前在网站后台程序里读取用户ip地址也出现了类似问题。 可以使用print_r($_server)  (php语言),查找到真实的用户ip地址,本站为 $_server[‘http_cdn-src-ip'].  这个是cdn携带的真实的客户ip地址(这里不计较用户是否使用代理)。 但在apache的日志记录里如何使用这个值呢?  本人在google和百度里查找了许久都没有找到相应的资料或者说解决方案,只好自己思考寻求了。
仔细看了下apache里日志记录的相关配置,针对logformat:
logformat "%h %l %u %t /"%r/" %>s %b /"%{referer}i/" /"%{user-agent}i/"" combined
我思索里面的%{referer}和%{user-agent} 是如何取得的, 这两个是在程序里也是经常会用到的东西,客户端发送请求的时候 这两个信息都是作为头详细发送到服务器的。后来查看了下访问时的所有头信息,如下:

复制代码 代码如下:

array
(
    [cdn-src-ip] => 222.44.46.58
    [accept] => image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
    [accept-language] => zh-cn
    [user-agent] => mozilla/4.0 (compatible; msie 8.0; windows nt 5.1; trident/4.0; ciba; .net clr 2.0.50727)
    [host] =>
    [cookie] => __utma=217127135.1188793388.1263188369.1263364666.1263368206.5; __utmz=217127135.1263368206.5.2.utmcsr=211.167.92.250|utmccn=(referral)|utmcmd=referral|utmcct=/cgi-bin/awstats/awstats.pl; viewedshopsid=621; viewedshopspp=%u6b27%u5c1a%u574a
    [accept-encoding] => gzip
    [via] => 1.1 hnay40:80 (cdn cache server v2.0)
    [connection] => keep-alive
)

当然rerfer的时候也会有rerfer信息出现在头部信息里,上面也有cookie、host、user-agent等信息,这些信息都是可以在apache配置文件里可以使用的变量,当然这里cdn-src-ip正是我想要的客户的真实ip地址。 于是推测${cdn-src-ip}在日志记录格式里应该也是可以使用的。 后面的i应该是指忽略大小写的意思。于是得出一个解决方案:

添加一个新的logformat信息

复制代码 代码如下:

logformat "%{cdn-src-ip}i %l %u %t /"%r/" %>s %b /"%{referer}i/" /"%{user-agent}i/"" combinedcdn

在需要记录的网站配置里增加:

复制代码 代码如下:

customlog "|/usr/local/sbin/cronolog /usr/local/apache/logs/www.875.cn-access_log.%y%m%d" combinedcdn env=!images

重启apache服务,然后访问网站,查看日志记录发现现在可以正常记录客户ip地址了。