6月1日当天我们客服反馈多处地方的用户登录游戏故障,经判断与DNS解析有关。
测试查询后,发现广东电信如下公共DNS:
- 202.96.128.86
- 202.96.128.166
对很多域名查询返回失败。例如我们自己的域名:
还有91wan和51wan的:
但是对于www.yy.com、www.duowan.com这样的查询频率大的域名,广东电信DNS返回结果正常。怀疑这是公共DNS的一种自我保护性策略,对于查询量大、频繁命中缓存的,予以应答。对于小量查询、未命中缓存的,返回失败。
是不是像前一阵故障那样,上一级DNS(com的权威NS、root DNS)受到了防火墙干扰?再运行如下命令测试:
看到com域的权威NS全部查询正常,root的NS有2台失败,考虑到实际网络路由的距离和复杂性问题,这也算正常。另外对所有上述查询失败的域名,我们使用114的公共DNS(114.114.114.114),以及自己搭建的递归DNS服务器进行查询,全部响应正常。这说明不是上一级DNS故障引起的问题。
与此同时对比测试了江苏电信DNS、北京电信DNS,结果江苏电信DNS同样存在问题,部分域名不可解析。但北京电信的正常。
由于不止一个地方出现故障,再结合故障表现看,可能是多个地域的公共DNS服务器被攻击导致。经观察,目前公共DNS服务在缓慢恢复中。在此期间,用户如果DNS解析有问题,建议将电脑的首选DNS,更改成114公共DNS服务器,地址是:114.114.114.114
其实是墙……过几天就好了,大家都懂得。
目前看就广东电信的DNS有问题,其他的OK了。不像被墙的表现。
Pingback引用通告: 监控DNS故障 | 风河博客