nf_conntrack: table full, dropping packet问题的解决思路
介绍:nf_conntrack 工作在 3 层,支持 ipv4 和 ipv6,而 ip_conntrack 只支持 ipv4。目前,大多的 ip_conntrack_* 已被 nf_conntrack_* 取代,很多 ip_conntrack_* 仅仅是个 alias,原先的 ip_conntrack 的 /proc/sys/net/ipv4/netfilter/ 依然存在,但是新的 nf_conntrack 在 /proc/sys/net/netfilter/ 中,这个应该是做个向下的兼容:
$ pwd
/proc/sys/net/ipv4/netfilter
$ ls
ip_conntrack_buckets ip_conntrack_tcp_loose ip_conntrack_tcp_timeout_syn_recv
ip_conntrack_checksum ip_conntrack_tcp_max_retrans ip_conntrack_tcp_timeout_syn_sent
ip_conntrack_count ip_conntrack_tcp_timeout_close ip_conntrack_tcp_timeout_syn_sent2
ip_conntrack_generic_timeout ip_conntrack_tcp_timeout_close_wait ip_conntrack_tcp_timeout_time_wait
ip_conntrack_icmp_timeout ip_conntrack_tcp_timeout_established ip_conntrack_udp_timeout
ip_conntrack_log_invalid ip_conntrack_tcp_timeout_fin_wait ip_conntrack_udp_timeout_stream
ip_conntrack_max ip_conntrack_tcp_timeout_last_ack
ip_conntrack_tcp_be_liberal ip_conntrack_tcp_timeout_max_retrans
$ pwd
/proc/sys/net/netfilter
$ ls
nf_conntrack_acct nf_conntrack_tcp_timeout_close
nf_conntrack_buckets nf_conntrack_tcp_timeout_close_wait
nf_conntrack_checksum nf_conntrack_tcp_timeout_established
nf_conntrack_count nf_conntrack_tcp_timeout_fin_wait
nf_conntrack_events nf_conntrack_tcp_timeout_last_ack
nf_conntrack_events_retry_timeout nf_conntrack_tcp_timeout_max_retrans
nf_conntrack_expect_max nf_conntrack_tcp_timeout_syn_recv
nf_conntrack_generic_timeout nf_conntrack_tcp_timeout_syn_sent
nf_conntrack_icmp_timeout nf_conntrack_tcp_timeout_time_wait
nf_conntrack_log_invalid nf_conntrack_tcp_timeout_unacknowledged
nf_conntrack_max nf_conntrack_udp_timeout
nf_conntrack_tcp_be_liberal nf_conntrack_udp_timeout_stream
nf_conntrack_tcp_loose nf_log/
conntrack_tcp_max_retrans
查看当前的连接数:
# grep ip_conntrack /proc/slabinfo
ip_conntrack 38358 64324 304 13 1 : tunables 54 27 8 : slabdata 4948 4948 216
查出目前 ip_conntrack 的排名:
$ cat /proc/net/ip_conntrack | cut -d ' ' -f 10 | cut -d '=' -f 2 | sort | uniq -c | sort -nr | head -n 10
nf_conntrack/ip_conntrack 跟 nat 有关,用来跟踪连接条目,它会使用一个哈希表来记录 established 的记录。nf_conntrack 在 2.6.15 被引入,而 ip_conntrack 在 2.6.22 被移除,如果该哈希表满了,就会出现:
nf_conntrack: table full, dropping packet
解决此问题有如下几种思路。
1.不使用 nf_conntrack 模块
首先要移除 state 模块,因为使用该模块需要加载 nf_conntrack。确保 iptables 规则中没有出现类似 state 模块的规则,如果有的话将其移除:
-a input -m state –state related,established -j accept
注释 /etc/sysconfig/iptables-config 中的:
移除 nf_conntrack 模块:
$ sudo modprobe -r xt_notrack nf_conntrack_netbios_ns nf_conntrack_ipv4 xt_state
$ sudo modprobe -r nf_conntrack
现在 /proc/net/ 下面应该没有 nf_conntrack 了。
2.调整 /proc/ 下面的参数
可以增大 conntrack 的条目(sessions, connection tracking entries) conntrack_max 或者增加存储 conntrack 条目哈希表的大小 hashsize
默认情况下,conntrack_max 和 hashsize 会根据系统内存大小计算出一个比较合理的值:
对于 conntrack_max,其计算公式:
conntrack_max = ramsize (in bytes) / 16384 / (arch / 32)
比如一个 64 位 48g 的机器可以同时处理 48*1024^3/16384/2 = 1572864 条 netfilter 连接。对于大于 1g 内存的系统,默认的 conntrack_max 是 65535。
对于 hashsize,默认的有这样的转换关系:
conntrack_max = hashsize * 8
这表示每个链接列表里面平均有 8 个 conntrack 条目。其真正的计算公式如下:
hashsize = conntrack_max / 8 = ramsize (in bytes) / 131072 / (arch / 32)
比如一个 64 位 48g 的机器可以存储 48*1024^3/131072/2 = 196608 的buckets(连接列表)。对于大于 1g 内存的系统,默认的 hashsize 是 8192。
可以通过 echo 直接修改目前系统 conntrack_max 以及 hashsize 的值:
$ sudo su -c "echo 100000 > /proc/sys/net/netfilter/nf_conntrack_max"
$ sudo su -c "echo 50000 > /proc/sys/net/netfilter/nf_conntrack_buckets"
还可以缩短 timeout 的值:
$ sudo su -c "echo 600 > /proc/sys/net/ipv4/netfilter/ip_conntrack_tcp_timeout_established"
3.使用 raw 表,不跟踪连接
iptables 中的 raw 表跟包的跟踪有关,基本就是用来干一件事,通过 notrack 给不需要被连接跟踪的包打标记,也就是说,如果一个连接遇到了 -j notrack,conntrack 就不会跟踪该连接,raw 的优先级大于 mangle, nat, filter,包含 prerouting 和 output 链。
当执行 -t raw 时,系统会自动加载 iptable_raw 模块(需要该模块存在)。raw 在 2.4 以及 2.6 早期的内核中不存在,除非打了 patch,目前的系统应该都有支持:
$ sudo iptables -a forward -m state --state untracked -j accept
$ sudo iptables -t raw -a prerouting -p tcp -m multiport --dport 80,81,82 -j notrack
$ sudo iptables -t raw -a output -p tcp -m multiport --sport 80,81,82 -j notrack
上面三种方式,最有效的是 1 跟 3,第二种治标不治本。
下一篇: Audition2018怎么生成音调?