SQLServer 2012中设置AlwaysOn解决网络抖动导致的提交延迟问题
事件起因:近期有研发反应,某数据库从08切换到12环境后,不定期出现写操作提交延迟的问题;
事件分析:在排除了系统资源争用等问题后,初步分析可能由于网络抖动导致同步模式alwayson节点经常出现会话超时等待提交的问题导致。
经过排查,扩展事件里发现不定期出现35202错误,这是一条副本连接恢复的消息。
由于机房网络环境复杂,数据库服务器和应用服务器混用一个交换机,在业务高峰期时,因上联端口流量打满而导致连接失败的情况屡有发生。
既然短期内无法改造网络环境,那就从sqlserver服务器自身出发,只对数据同步的部分进行改造;
现有环境:
sql ag:为两节点的同步模式,两个节点各有一块网卡连接到交换机,没有直连心跳线(wsfc也不再要求有独立的心跳网络)
改造方案:
1、两个节点各启用一块网卡,采用直连方式进行通信,同时配置私有地址
server_a:10.0.0.11
server_b:10.0.0.12
2、删除两个节点的endpoint,手动重新创建listener_ip为直连ip的endpoint
3、更改ag中,每个副本的endpoint_url
4、等待数据重新同步;
其中第三步的脚本如下,要在两个节点上分别操作,注意listener_ip为直连网卡的ip
/****** object: endpoint [hadr_endpoint] script date: 2015/1/6 16:06:17 ******/
drop endpoint [hadr_endpoint]
go
/****** object: endpoint [hadr_endpoint] script date: 2015/1/6 16:06:17 ******/
create endpoint [hadr_endpoint]
state=started
as tcp (listener_port = 5022, listener_ip = (10.0.0.11))
for data_mirroring (role = all, authentication = windows negotiate
, encryption = required algorithm aes)
go
第四步的脚本如下,在主副本执行即可
alter availability group [alwayson01]
modify replica on n'node_01' with (endpoint_url = n'tcp://10.0.0.11:5022')
alter availability group [alwayson01]
modify replica on n'node_02' with (endpoint_url = n'tcp://10.0.0.12:5022')
注意:删除endpoint后两副本即为未同步状态,但侦听器和ag组中的数据库不受影响,对应用而言,主副本的服务仍然正常;