Filebeat 采集 Nginx 日志的方法
nginx 日志可用于分析用户地址位置,行为画像等,如何通过 elastic stack 进行一站式的数据采集,数据清洗,数据落地,数据可视化,让数据发挥真正的价值呢?
架构设计
涉及到 elastic stack 中 filebeat 是用于采集 nginx 相关的日志, elasticsearch 是用于对于数据落地存储和搜索的引擎, kibana 是用于对数据可视化的工具。
在 nginx 中相关的日志是存储在 /var/log/nginx 目录下的,分别是访问日志 access.log,错误日志 error.log。
如果是裸机环境下,可以直接在同一主机下安装 filebeat 针对日志文件进行采集。
如果是 docker 环境下,建议 nginx 使用 volume 的方式进行共享日志文件给 filebeat 采集。
如果是 kubernetes 环境下,建议在 pod 中添加 filebeat container进行对 pv 采集。
针对不同场景有不同的采集方案,有些可以利用daemonset采集宿主机上的日志,有些是以sidecar方式进行采集,具体视业务场景而定。
实施方法
以 docker 环境下为例
nginx
创建存储卷,便于 nginx 和 filebeat 容器共同挂载docker volume create nginx-log-volume
启动 nginx 容器,并且将存储卷映射到日志目录docker run -d --name nginx -p 80:80 -v nginx-log-volume:/var/log/nginx nginx:latest
进入容器修改配置docker exec -it nginx /bin/bash
由于容器环境下,默认的日志会输入到stdout,所以取消该设置并指定文件unlink /var/log/nginx/access.log
unlink /var/log/nginx/error.log
touch /var/log/nginx/access.log /var/log/nginx/error.log
nginx -s reload
filebeat
启动 filebeat 容器,并且将存储卷映射到数据目录docker run -d --name filebeat --user=root -v nginx-log-volume:/data elastic/filebeat:7.9.2
进入容器修改配置docker exec -it filebeat /bin/bash
修改配置,添加 elasticsearch 和 kibana 的主机vi filebeat.yml
filebeat.config: modules: path: ${path.config}/modules.d/*.yml reload.enabled: false processors: - add_cloud_metadata: ~ - add_docker_metadata: ~ output.elasticsearch: hosts: 'elasticsearch:9200' username: "elastic" password: "xxx" setup.kibana: host: "kibana:5601"
启用 nginx 采集模块
filebeat modules enable nginx
编辑 nginx 采集配置vi modules.d/nginx.yml
- module: nginx access: enabled: true var.paths: ["/data/access.log*"] error: enabled: true var.paths: ["/data/error.log*"]
设置 filebeat 创建 kibana上的 index pattern 和 dashboardfilebeat setup
重启 filebeat 生效配置docker restart filebeat
可视化展示
通过 kibana 中的 dashboard 功能
展示 nginx 对于日志的访问情况及用户地址位置、浏览器信息
展示 nginx 对于访问日志和错误日志的具体请求信息