51学通信技术论坛

 找回密码
 立即注册
搜索
查看: 4557|回复: 0

[论文与期刊] VoLTE语音质量研究 [复制链接]

Rank: 9Rank: 9

发表于 2015-12-12 23:17:17 |显示全部楼层
一键分享 一键分享

姜先贵,李勇辉,朱斌,徐乐西(中国联通网络技术研究院,北京)

摘要:
近些年,OTT语音业务迅猛发展,新业务层出不穷,运营商也根据自身网络演进推出VoLTE语音业务,但VoLTE语音相比OTT语音是否更具有优势是大家关注的问题。首先介绍了VoLTE网络架构、VoLTE优化关键技术,并研究语音质量评估的方法以及影响语音的主要因素,然后通过实验数据分析VoLTE语音与OTT语音在MOS评分、呼叫建立时延、流量占用等方面的对比优势。

0前言
OTT VoIP语音在移动互联网时代得到极大的关注与应用,给运营商传统语音业务带来了较大冲击。语音业务在2G/3G网络中是运营商收入的主要来源,可以预期未来的LTE网络中,语音将仍然是重要的业务。众多方案中,通过IMS控制的VoLTE语音必然成
为运营商的最终方案,截至2015年4月,包括中国移动在内全球已经有超过90家运营商开始部署或试验VoLTE业务。VoLTE语音能否给用户带来更好的用户体验、语音质量能否优于2G/3G网络以及“号称”免费的OTT VoIP语音应用?本文围绕如何评价VoLTE语音质量以及VoLTE与其他类型语音的性能进行分析和探讨。

1概述
1.1VoLTE网络架构

VoLTE即Voice over LTE,是指语音业务由LTE无线网和EPC核心网提供的IP通道承载,由IMS进行会话控制,从而实现数据与语音业务在同一网络下的统一。另外,通过PCC架构能够合理、灵活地对多媒体会话进行计费,实现用户业务QoS及计费策略的控制。VoLTE网络架构如图1所示。



VoLTE业务涉及网元较多,包括现网CS域、EPS域、IMS域,以及PCC等。
IMS域主要完成呼叫控制等功能,它通过和EPS网络配合,提供和电路域类似的语音业务及其补充业务,包括号码显示、呼叫转移、呼叫等待、会议电话等。
EPC配合IMS系统完成P-CSCF发现、初始附着的信令默认承载建立、语音及视频等业务专有承载的建立等。
PCC主要联合P-CSCF(AF功能点)以及GGSN/PGW(PCEF功能点)完成策略控制决策和基于流进行计费控制的功能。
CS域通过MSC升级支持SRVCC功能。MSC与MME之间的Sv接口实现VoLTE语音业务的连续性,满足当用户在通话过程中移出LTE覆盖区时保证业务的连续性,使通话平滑切换到2G/3G网络的基本需求。


1.2VoLTE关键优化技术
GSMA在标准中规定了VoLTE4大技术特征,这4大技术特征保障了VoLTE提供高标准的QoS服务。
1.2.1 半持续调度(SPS)技术
语音业务包与数据业务包相比,它的包尺寸小且发送频繁,而在发送数据包时,上下行链路都要分配物理资源块(PRB),如此会消耗较多的无线资源。为了解决这个问题,VoLTE引入了SPS技术。SPS是一个更加灵活的资源调度方式,比如,在语音对话中,每隔20ms发送1个语音包,在静默期没有语音数据传输,当只有背景噪声时,就取消PRB资源分配。
1.2.2 时隙绑定(TTI bunding)技术
为了减少时延,LTE中一般按照1ms为单位进行物理层资源调度,需要HARQ每1ms就需要确认1次传输,但是往往在信号受限或其他情况下,在这段时间可能未完成语音包的传送。通过采用TTI bunding技术,将多个连续的TTI捆绑在一起,只需在绑定的最后1次传输完成反馈的HARQ即可,如此可降低小区VoLTE语音数据的误码率和时延,提高上行覆盖性能。
1.2.3 鲁棒性报头压缩(RoHC)技术
VoLTE语音中的IP报头数据报文太大,如果直接传输会严重浪费空口资源。通过采用RoHC技术可以减少数据包头的开销,对LTE语音业务信道覆盖和容量能带来显著提升,尤其适合那些较高误码率、时延长、通信质量较差的链路。据计算,1个RTP头大概40~60Byte,经过AMR-WB编码后,每帧数据载荷大约50Byte,而通过RoHC技术可压缩到4Byte左右,大大提升了空口传输效率。
1.2.4 非连续接收(DRX)技术
由于VoLTE流量是可预知的(20ms数据包),UE不用随时监视物理控制信道,采用DRX可在通话中关闭UE接收语音包功能,直到语音包达到时才唤醒UE,达到省电的目的。


2语音质量评估
2.1语音质量评价方法

语音质量的好坏是一种主观的测量结果,依赖于听者对语音的主观评价(见图2)。早期语音质量测试方法是通过在实验室让很多人试听语音,并按照ITU规范的“综合意见评分法(MOS)”对语音质量给出主观评价。显然这种方法不仅主观依赖而且费时费力,ITU从20世纪90年代中开始对端到端的语音质量自动客观测试技术进行标准化的工作。


ITU制订相关的评测标准用于MOS测试,对用户接听和感知语音质量的行为进行调研和量化,由不同的调查用户分别对原始标准语音和经过无线网传播后的衰退声音进行主观感受对比,评出MOS分值。目前,客观评价有主动方式和被动方式2种。主动方式的评价是建立在原始语音信号和失真语音信号的误差对比上,这种方式的客观评估大多采用数值距离或者描述听觉系统如何来感知质量的听觉模型量化语音质量的好坏,主要的评分算法有PSQM/PSQM+、PAMS、PESQ以及最新的POLQA等;被动方式的客观评价是以语音系统的输出信号的延时、抖动和丢包等因素来评估语音质量的好坏,再转换成MOS分值,主要的评分算法为E-Model。
需要指出的是,MOS是广泛认同的语音质量标准,因此,无论采用何种方法都需要对测量结果最终对应到平均主观MOS分值。表1是MOS分值与用户感受的对应表。


2.2影响语音质量的因素
影响语音质量的因素比较多,归类起来主要有以下几点。
a)网络因素。包括网络的延迟、抖动、丢包率。
延迟是指口耳传输的时延,即端到端包传递的时间。包延迟会引起通话声音不清晰、不连贯或破碎。大多数用户察觉不到小于100ms的延迟,当延迟在100~300ms时,说话者可以察觉到对方回复的轻微停顿,会影响到正常的交流,当超过300ms时,延迟就会很明显,用户开始互相等待对方的回复,影响用户的通话。抖动,是由路由器的包排队引起的,会造成声音的不连续,抖动的结果是影响通话质量,使接收端的人听到的声音难以理解。丢包率,当丢包率超过5%时,语音质量会变的不可接收,听者会听到含混、爆破似的声音。
b)编码及采样因素。目前语音编码方式有多种,且每种方式采用不同的语音编码,使得MOS分值差距也比较大。传统的电话语音编码采用窄带编码方式,采样频率是8kHz,这在很大程度上影响到声音的真实性;而VoLTE采用宽带AMR编码方式,并能达到23.85kbit/s的编码速率,采样频率可达到48kHz,对语音质量有较大的提升。
c)语音的数字信号处理因素。如果不采用任何的数字信号处理,声音质量会比较差,表现为回声和噪音大、声音时大时小。若要提高语音的清晰度,必须做回声抵消、噪音抑制、信号增抑控制处理。此外,其他一些因素,如不同小区之间的切换、eSRVCC语音切换等都会对语音质量产生影响。
2.3语音测量方案
2G/3G网络的语音质量测量主要采用2001年ITU-T发布的P.862PESQ评估通话质量,该方法是把信号传输通过设备时提取的输出信号与参照信号进行比较,计算出差异值,它综合考虑了感知中的编码速率、编码传输、多速度编码传输下的编解码匹配、噪声等因素的影响客观地评价语音信号的质量。但PESQ只适用于窄带网络通信,即300Hz~3.4kHz的语音信号编解码网络,不太适用于采用宽带编解码的VoLTE语音。
目前VoLTE语音质量采用ITU-T最新发布的下一代语音测量技术P.863POLQA,它是对P.862PESQ的改进,可用于固定语音(包括LTE在内的移动网络以及IP电话网络),并充分考虑了人耳响度感受对评估的影响。组网方面,使用2部真实的VoLTE终端经
LTE无线接入,由EPC提供IP承载并通过IMS进行会话控制。当LTE无线覆盖较弱或无覆盖时进行eSRVCC切换,由LTE切换至2G/3G网络,实现用户无感知的语音切换(见图3)。


3 VoLTE语音质量分析
3.1语音质量MOS得分

2G或3G通话技术使用的音频范围为300Hz~3.4kHz,而VoLTE使用50Hz~7kHz的AMR-WB编解码,音频范围更广,通话质量理论情况下会更清晰。同时,VoLTE与OTT VoIP相比,通过PCC机制来保障VoLTE所需的带宽,即使在网络高负载时VoLTE的通话质量仍会受到保证。VoLTE语音采用QCI=1的专用语音承载,具备良好的QoS保证,而OTT VoIP使用的是QCI=9的默认承载,易出现误码、丢包、时延大等问题。
分别对VoLTE语音2种宽带编码速率、3G CS域语音(编解码为AMR-NB12.2kbit/s)、VoIP的微信电话本通过POLQA算法进行语音质量评估。从测试的结果上看,VoLTE呼叫的语音质量优于3G和OTT的语音呼叫。100个语音样本中,MOS分值在4分以上VoLTE占60%以上,3.5分以上VoLTE占80%以上,优于3G和OTT语音(见图4)。事实上,这几种情况通过人工的主观去听,能明显听出VoLTE语音更加清晰,声音失真更小。这是因为VoLTE语音比3G带宽更大,语音更清晰,且通过QoS保障,在时延、抖动、丢包率方面比同是IP语音的微信电话本更具有优势,获得的MOS分值更高。


3.2语音呼叫建立时长
语音呼叫建立时间的长短对用户体验影响较大,过长的建立时间会增加用户的投诉率。与传统通信相比,VoLTE的接通时间更短。从实际测试数据来看,2G/3G的语音通话从主叫开始拨打到收到返回提示音平均需6~9s,而基于VoLTE技术的4G高清通话
平均等待时间仅需2s左右。若主叫或被叫任何一方手机不支持VoLTE,其接通速度就没有双方手机都支持VoLTE那么快,增加1~2s。由此可知,在呼叫建立时间方面,VoLTE语音比传统2G/3G有很大的提升。
3.3口耳媒体时延和抖动
听者对在500ms以内的口耳媒体时延不太敏感,但时延再大就会严重影响用户的感受,甚至会出现串话情况。从实验室及外场测试的测试结果来看,VoLTE时延都在200多ms以内,而VoIP的微信电话本的时延都在600~750ms(见图5)。另外,VoIP的抖动也不稳定,取决于用户的承载,静态下在Wi-Fi和LTE下的抖动尚且稳定,但是在移动状态下VoIP的微信电话本的抖动很大,语音质量无法忍受。
从图5可看出VoIP的时延、抖动比VoLTE语音大,测试结果与理论情况一致,因VoLTE语音通过PCC进行策略控制,对语音业务建立QCI=1的专有承载,可以为VoLTE业务设置高优先级的QoS规则,从而保障语音通信的质量。而OTT语音是上层应用业务,在LTE网络中底层承载将其认定为普通数据传输,于是OTT语音将与其他普通数据分组使用相同的Internet PDN连接的Non-GBR默认承载(QCI=8/9),这将导致OTT语音与其他业务抢占公共带宽资源。如此,VoLTE语音比OTT语音在时延方面更加稳定,同时也更小。


3.4终端移动对语音质量的影响
在VoLTE现网下相同路线做了基于POLQA的VoLTE语音质量和微信电话本路测。VoLTE通话全程测试无掉话,MOS分值在3.5分以上。而OTT的VoIP承载在商用4G网络上,移动过程中频繁掉话,MOS变化波动非常大。
3.5语音的连续性
在语音连续性方面,VoLTE的优势明显。当网络质量不好或者无LTE信号时,VoLTE语音能采用eSRVCC技术自动切换到3G网络,实现无缝切换,用户基本无感知;而OTT的VoIP应用在终端从4G网络接入切换到2G/3G网络过程中,语音通话就会中断。
eSRVCC切换在非常短的切换时间内会对语音质量有影响,但是切换一般在整个通话中只有一次,切换后语音能够保持平稳。
3.6流量占用
流量占用测试方法是采用真实终端,在VoLTE网络下两终端互打,正常语音通话2min。在网络无拥塞条件下,VoLTE采用专用承载,OTT的VoIP微信电话本采用默认承载。同样的语音通话2min,由于相同的网络条件下微信电话本编码速率比VoLTE高,并且微信电话本除了通话双方的语音数据消耗之外,还需与其他超级节点和服务器进行交互,因此微信电话本业务的IP流量消耗大于VoLTE,上下行均是VoLTE消耗流量的2倍多。
3.7小结
VoLTE语音相比OTT语音,它通过EPC和IMS域的PCC架构使语音更具有QoS保障,在误码、丢包、时延等一系列服务质量问题更加具有优势,再加上VoLTE业务的空口4大关键优化技术,使得VoLTE语音在很多技术指标上明显胜于OTT VoIP和2G/3G语音,且在给用户带来更好感知的同时更加节省流量,也更高效。在提高用户体验上,VoLTE可以采用高清语音、富通信套件(RCS)、增强富通信套件(RCSe)等丰富的业务形态来提高差异化优势。


4结束语
VoLTE是语音业务演进的必然结果,它拥有传统的电信级QoS保障机制及业务特性,拥有良好的服务质量和绝佳的用户体验,更能应对OTT语音冲击和ARPU值下降的不利趋势。虽然无论是从终端产业链及设备投入成本的角度,还是从技术演进的角度,要商用VoLTE还有很多实际问题需要考虑,但已在全球90多家运营商商用或试商用,相信在近几年内VoLTE必将得到广泛应用。


参考文献:
[1]Mikka Poikselka,Georg Mayer,Hisham Khartabil. IMS:IP多媒体概念和服务[M].3版.北京:机械工业出版社,2011:239-252.
[2]3GPP TS23.228IP Media Subsystem(IMS)[S/OL].[2015-04-25]. http://www.3gpp.org/DynaReport/23228.htm.
[3]3GPP TR23.856SingleRadio Voice Call Continuity(SRVCC)enhancements(Stage2)[S/OL].[2015-04-25]. http://www.3gpp.org/DynaReport/23856.htm.
[4]3GPP TS24.237V12.2.0IP Multimedia Subsystem(IMS)ServiceContinuity(Stage3)[S/OL].[2015-04-25]. http://www.3gpp.org/DynaReport/24237.htm.
[5]3GPP TS29.292V10.1.0Interworking between the IP Multimedia(IM)Core Network(CN)subsystem and MSC Server for IMS Centralized Services (ICS)[S/OL].[2015-04-25]. http://www.3gpp.org/DynaReport/29292.htm.
[6]许可. VoLTE语音质量评价方法及测试方案[J]. 电信网技术,2014(5).[7]庞韶敏,李亚波. 3G UMTS与4G LTE核心网-CS,PS,EPC,IMS[M].北京:电子工业出版社,2011.
[8]陈志伟,胡志国. IP网络语音质量评价方法研究[J]. 计算机与现代化,2013(2).
[9]鲁义轩. VoLTE走向应用高清语音开拓语音服务新领域[J]. 通信世界,2014(28).
[10]强磊,饶少阳,陈卉. IMS核心原理与应用[M]. 北京:人民邮电出版社,2008:25-101.
[11]赵绍刚. IMS网络部署、运营与未来演进[M]. 北京:电子工业出版社,2011:87-95.
[12]杨放春. 软交换与IMS技术[M]. 北京:北京邮电大学出版社,2007:45-60.
[13]庞韶敏,李亚波,沈宇超,等. 3G核心网技术揭秘-CS,PS,IMS[M].北京:电子工业出版社,2008.
[14]史俊玉.编解码质量评价[J].广播电视信息,2008(12).
[15]吴雪.艾法斯VoLTE测试解决方案[J].移动通信,2013(17).
[16]于艳丽,张艳. VoLTE的核心网解决方案[J]. 电脑与电信,2014(6)


附件: 你需要登录才可以下载或查看附件。没有帐号?立即注册
51学通信(www.51xuetongxin.com):致力打造最好的通信技术在线学习平台 。
您需要登录后才可以回帖 登录 | 立即注册

站长邮箱|Archiver|51学通信 ( 粤ICP备11025688 )

GMT+8, 2024-4-19 09:28 , Processed in 0.028076 second(s), 15 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部