51学通信技术论坛

 找回密码
 立即注册
搜索
查看: 3760|回复: 2
打印 上一主题 下一主题

E200无法透传乱续报文导致大彩信接收失败 [复制链接]

Rank: 9Rank: 9

懒

跳转到指定楼层
楼主
发表于 2012-1-16 21:10:43 |只看该作者 |倒序浏览
一键分享 一键分享
部分正文摘录如下:
1 E200无法透传乱续报文导致大彩信接收失败
1.1 问题现象
  M局点即将和客户进行彩信验收测试,但是在预测试过程中发现彩信发送成功,接受失败,而且接收失败的彩信都是大彩信。
1.2 告警信息
  无相关告警
1.3 原因分析
1.3.1 流程、组网分析
1)首先分析彩信的接收流程,目前,作为彩信的接受方,手机收到MSC发送的隐式通知短消息后,手机发起激活,连接到归属GGSN和WAP Gateway并通过WAP Gateway接受来自彩信网关的多媒体短消息。
2)接下来需要了解局点现场的组网情况,彩信测试过程中所使用的GGSN、WAP网关和彩信网关都是其他国漫运营商的设备,我们无法获得详细信息。就M运营商自己的组网而言,从国漫过来的报文首先被送到局方的Router,然后是华为提供的BG也就是NE08,接下来是华为的E200防火墙,最后被送到华为SGSN9810。也就是如图所示的一个传输通道:
SGSN<-○1- >FIREWALL(E200)<-○2->BG(NE08)<-○3->局方的Router<-○4->INTERNET
图1 传输通道
3)根据以上的分析,由于无法掌握GGSN、WAP Gateway和彩信网关的情况,再加上出现问题的时候,总是接收大彩信失败。我们只能将处理问题的焦点放在中间的数通设备上并重点关注报文的转发过程,确认是否有丢包等情况。由于问题的焦点集中在接收大彩信失败上,我们也有理由怀疑这个问题是和分片报文相关的。
1.3.2 抓包定位
  路由器是一个基于层3的数据报文转发设备,理论上ROUTER应该如实转发收到的所有报文,但是由于BG和外网之间创建的有IPSEC隧道,即使抓到报文我们也无法分析,所以这个问题我们定位的重点就是:使用测试手机模拟故障流程,在SGSN上进行用户跟踪,然后在图1中标识为○1和○2两个位置抓包,分析数据报文的流程。
  首先,我们先看一下在位置○2上抓到的E200和BG之间的报文,下图是一个PDP激活然后接收彩信、去激活PDP的全流程:

在上图中,消息35是手机到WAP网关接收彩信的request消息。消息36是一个ip的分片报文,接下来消息37是分析报文的首报文。让我们分别看一下消息36和37:
  从图3中我们可以看出,消息36是ID为719a报文的最后一个分片报文,偏移量是1400。也就是说根据我们在位置○2的抓包分析,手机请求服务器下载彩信的时候,收到的第一条报文是分片报文。这明显顺序是错误的。
  按照正确的顺序,36应该是WTP RESULT的首报文。如果分片的话,37应该是分片报文。让我们继续看一下消息37的报文内容:

附件: 你需要登录才可以下载或查看附件。没有帐号?立即注册
www.gprshome.com: GPRS及移动通信技术学习交流分享平台。

Rank: 8

特殊贡献奖

沙发
发表于 2012-5-19 14:55:53 |只看该作者
爱总:这个案例中有些问题不太明白,请教一下您:
彩信接收流程:

问题抓图:

      按正常流程顺序M-retrieve-conf消息(消息38)应该是第一个带彩信内容的包,紧接着才应该是(消息37)WTP segement Resultd的分包,从位置1和位置2来看顺序都颠倒了。37的详细信息如下:

        其中WTP层内容 PDU:result (2),说明是第3个segement分包,那么38为第一个包,37为第3个包,很可能36为第2个包
        另外从消息37详细解码信息来看,其中包含了2组IP
IP层:  196.6.254.19--->202.123.27.21
GTP层:196.6.128.6--->10.15.113.207
而消息36只能解到IP层,信息如下:
IP层:  196.6.254.19--->202.123.27.21
如果按之前的推理36很可能为第2个包,但并未解开GTP层和WTP/WSP层,用户也无法知道这个包属于彩信的分包,从之后MS发送的WTP Negative Ack消息(消息39)看,之前的传输肯定丢包了,WTP Negative Ack会带丢失的包的号:Miss result,紧接着又看到消息40又发送了一个IP包。

总结一下个人理解:
1. 确实是错序了,按顺序应该是38-->36-->37,但顺序可能不会影响失败,因为Wap1.0(WTP/WSP)发送彩信数据时会分成WTP segement包,而且要分组,现网一般是是一个分组有4个或5个(这个可以参数设置),正常情况下一个分组发完后会对一组里最后一个包的序号进行确认,如果中间有丢包,ms会上发Wtp negative ack索取重传。也就是说只要最终传输的包都被确认就应该不影响最终成功下载彩信。
2.由于第2个包在中间环节传输时出现问题,无法解开GTP、WTP/WSP协议层,导致MS无法收到第2个包,MS发送Negative要第2个包,最终没有得到,无法确认,最终导致失败。
如果消息36为第2个包,数据在2的位置存在,显示为IP包,但不知爱总文档里显示1位置的抓包时是按什么过滤的?
如果按196.6.128.6--->10.15.113.207
或者 按WTP/WSP协议过滤
都有可能过滤掉消息36的IP包。因为没有解到GTP层,ip不同,这样的话其实也就不能分辨消息36(第2个包)是不是被防火墙过滤掉了。

以上是个人理解,希望爱总指正。

附件: 你需要登录才可以下载或查看附件。没有帐号?立即注册

使用道具 举报

Rank: 9Rank: 9

懒

板凳
发表于 2012-5-19 17:39:10 |只看该作者
tony9492 发表于 2012-5-19 14:55
爱总:这个案例中有些问题不太明白,请教一下您:
彩信接收流程:

不好意思。这个case不是我做的。我也没有原始的抓包。不过我的观点应该和你是一致的。

www.gprshome.com: GPRS及移动通信技术学习交流分享平台。

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

站长邮箱|Archiver|51学通信 ( 粤ICP备11025688 )

GMT+8, 2024-5-20 00:43 , Processed in 0.042993 second(s), 14 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部