51学通信技术论坛

 找回密码
 立即注册
搜索
查看: 4127|回复: 1
打印 上一主题 下一主题

手机QQ业务使用异常案例分析 [复制链接]

Rank: 9Rank: 9

懒

跳转到指定楼层
楼主
发表于 2012-12-12 20:23:49 |只看该作者 |倒序浏览
一键分享 一键分享

本文转自《企业技术开发》期刊2012年Z1期。

【作者】 赵俊; 贝玉昌;

【机构】 佛山移动网络维护中心;

【摘要】 文章从处理一例手机QQ业务使用异常的投诉展开深入探讨,分析定位了手机QQ业务使用异常的原因,研究了WAP网关防火墙的配置对手机QQ业务的影响,由此得到一些故障定位、业务分析的经验,以供参考。

【关键词】 手机QQ业务; SGSN; WAP网关; MAC;

2012年2月6日接到投诉部分用户使用手机异常,无法正常登录。经过现场测试和数据核查,确认无线环境、HLR及BOSS系统上的用户数据均正常,用户可以正常使用其他它数据业务。根据现象,初步判断是GPRS核心网及以上网络某个环节出了问题。

1 排查分析

信令抓包环境:笔记本电脑+SGSN ITC软件+诺基亚(QQ2007)、三星(QQ2010)、索爱手机(QQ2008)。

信令抓包接口:SGSN侧Gb接口。

首先,将微蜂窝挂在用户投诉集中的BSC下,用户使用手机业务所用的APN是CMWAP或者CMNET,使用不同的APN所经过的网络不同。为了测试分析不同APN对手机业务的影响,分别选取同样的手机和版本,在同一个微蜂窝下,分别使用这两个APN登录手机业务,使用CMNET作为APN登录时,所有手机均可以正常使用手机业务,用户终端与腾讯服务器之间可以正常进行数据交互;使用CMWAP作为APN登录时,部分手机登录失败。从信令上看,用户终端向腾讯服务器发送数据包后,没有收到腾讯服务器的响应,TCP连接无法建立,导致登录失败。

使用CMNET作APN时,用户终端可以与腾讯服务器进行正常的通信,TCP协议采用三次握手建立一个连接的数据包是完整的,腾讯服务器的地址为58.60.12.176,端口为14000;不同的服务器地址段是由于不同手机终端使用了不同软件版本的手机QQ,其中,58.6研头的58.60.12.176和58.60.10.125对应的版本是QQ2007,211.136.236.84对应的版本是QQ2010。使用CMWAP作为APN部分可以成功登录手机,腾讯服务器的地址为121.14.74.21,端口为14000,使用的版本是QQ2010。从图1和图2的抓包分析中,可以判断在终端类型、手机版本、微蜂窝、腾讯服务器一致的情况下,使用CMWAP作APN时,该SGSN指向的WAP网关与腾讯服务器之间的通信出了问题;只有部分腾讯服务器的通信出了问题,业务并没有全阻。通过上述测试抓包分析,将故障点的范围缩小至WAP网关侧。

为进一步确定问题点,定位故障。选取与投诉网元同WAP网关,但不同SGSN的BSC挂微蜂窝。使用同样的手机和版本,在该微蜂窝下分别使用CMWAP和CMNET作APN进行手机业务测试抓包分析。使用CMNET作为APN时,手机可以正常登录;使用CMWAP作为APN时,手机登录大部分失败,个别成功。手机登录失败的原因也是由于没有收到腾讯服务器的响应造成的,而且向同一网段内3个不同的服务器发消息都没有响应。通过进一步的测试分析可以判断出WAP网关与部分腾讯服务器的通信问题,并没有造成业务的全阻,隐蔽性非常强,定位相对困难,对用户感知的影响很大;同时也可以看出,同样的测试环境,同样使用CMWAP作APN,同样的腾讯服务器211.136.236.87,手机业务却部分成功、部分失败,这说明WAP网关与同一腾讯服务器通信的部分路由或链路出了问题。通过上述测试抓包分析,既进一步确认了问题出在WAP网关与腾讯服务器之间的通信上,又判断出WAP网关与部分腾讯服务器的部分路由或链路出了问题,故障点基本定位出来。

业务从WAP网关经过CMNET到达SP的服务器,每个WAP网关有N套socket防火墙,每套防火墙对应不同的数据业务,手机QQ业务请求到达WAP网关侧socket防火墙,经过源地址NAT后再通过CMNET交换机访问腾讯服务器。socket防火墙上的NAT地址为221.179.8.54,由于该地址不是防火墙的接口IP地址和VRRP IP地址,当同网段设备广播ARP请求这个IP地址时,防火墙并不会应答ARP请求,因此,需要在socket防火墙上配置ARP Proxy,防火墙收到此地址的ARP请求后,代理应答ARP请求,返回的MAC地址为ARPProxy中设置的MAC地址。从抓包结果分析,发现一小部分数据包存在这样一种现象,从防火墙出去到腾讯服务器的数据包采用Master socket防火墙的实MAC地址发出。

2 解决措施

本次故障排查分析的方法主要是业务测试结合抓包分析,根据用户投诉情况、故障现象和业务特点逐级检查网络,缩小故障点范围,直至最后定位出故障点。在进行每个场景的测试时,要保证测试目标以外的其他条件相同,这样才能有效地分析出测试目标的影响。该分析方法也是排查问题、定位故障的经典方法,广泛应用于网络维护优化分析工作中。

ARP Proxy可以采用接口MAC地址或者手动指定MAC地址。一般情况下,交换机上ARPCache开启时间较长,一旦发生短暂ARP波动,数据包回应给虚拟IP的MAC地址指向将不正确,而防火墙本身工作正常,在二层ARP寻址上出现问题。本次手机使用异常的故障需要检查两台CMNET交换机上ARP超时时间和当收到Gratuitous ARP时为什么一台CMNET交换机不能更新ARP表。为了网络更加稳定,解决问题的措施在防火墙上的ARP Proxy中设置NAT的虚拟IP的MAC地址为VRRP接口虚MAC地址,这样主备防火墙上221.179.8.54的MAC地址相同,都为VRRP接口虚MAC地址。当主备防火墙切换时,交换机收到Gratuitous ARP时是否更新ARP表都不影响,提高了CMNET交换机和VRRP虚拟设备之间通信的兼容性和稳定性。

参考文献:

[1]冉萌,肖文栋.无线传感器网络中基于信息质量的跨层Q0S支持[J].电脑知识与技术:学术交流,2007,(12).

[2]徐文君.无线传感器网络跨层优化协议研究[D].武汉:武汉理工大学,2007.

www.gprshome.com: GPRS及移动通信技术学习交流分享平台。

Rank: 3Rank: 3Rank: 3

沙发
发表于 2013-4-14 10:26:03 |只看该作者
思路清晰,值得一学。

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

站长邮箱|Archiver|51学通信 ( 粤ICP备11025688 )

GMT+8, 2024-4-26 11:36 , Processed in 0.027958 second(s), 14 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部