理论教育 优化场景识别方法:实现精确识别

优化场景识别方法:实现精确识别

时间:2023-06-27 理论教育 版权反馈
【摘要】:同时,对网络优化场景的精确识别,也会对网络规划建设、扩容调整带来重要指导意义。图1-31 网优场景识别算法4.无线网络场景特征的选取及评估为达到量化并识别无线网络特征场景的目的,需要对描述小区主要特征的属性进行选取,本试验以GSM系统为例,选取了覆盖特征、干扰特征、寻呼量特征、话音业务请求量特征、小区切入请求量特征这五大类。

优化场景识别方法:实现精确识别

1.背景

面对中国移动多张网络协同发展的复杂网络结构,对各层网络所处空间维度内的覆盖、业务、干扰、故障、资源配置等特征模型进行综合识别和划分是一项极为重要的基础性分析工作,将直接影响到各级网络优化规划方案和策略的制定,尤其是对于无线配置参数的个性化、精细化、智能化调整工作具有非常重要的作用。

在不同的网络优化场景下,即使面对相同的网络质量问题,网络优化过程中涉及的参数取值的选取或调整幅度也会不尽相同。也就是说,不同的网络特征环境下,往往会采用不同的参数优化模型,因此对网络特征的判断准确与否,也将直接影响到网络优化调整的最终效果。同时,对网络优化场景的精确识别,也会对网络规划建设、扩容调整带来重要指导意义。当前,中国移动的网络建设需要精确规划四网目标、协同发展、最大程度地发挥全网业务承载能力,这就对分类型、分区域、分场景的网络建设提出了更高要求,这也是复杂网络优化场景识别应用的重要领域

2.理论依据及现状

要实现基于多维度复杂网络优化特征的场景智能识别和分类,在技术理论上属于模式识别范畴,即是一种对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,从而对事物或现象进行描述、辨认、分类和解释的过程。应用在无线网络优化中就是通过对无线网络多维度的特征属性值的分析,自动化地将不同场景下的小区进行识别和分类,以达到量化并识别无线网络场景的目的。

随着模式识别及人工智能技术的深入发展,机器学习已成为其核心研究领域,使得自动学习得以实现。机器学习的研究是根据生理学认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,通过研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统的过程。

对于网络优化工作来说,全网呈现的网络业务特征及质量指标是一个多维度因素相互作用和制约的综合结果。在中国移动的无线网络演进过程中,凝结了成千上万网络运维、优化工程师的宝贵经验,经历过无数次调整优化的试验后,大量经验和模式固化在网络中。当前,十分缺乏这种具备自适应学习能力的、智能的、科学的、高效的智能学习系统,也就无法将经验模式进行提取和推广。

3.基于多维度聚类技术的网络优化场景划分

无线网络以小区为基本单元,每个小区对象可以被众多无线网络特征属性所表征,这些属性概括了当前小区的无线网络环境和用户行为模型特点,因此每个小区均可以看作一个具有P维属性的数据对象(即用多维空间的一个向量点来表示),在地里维度上,特定区域内的所有N个小区,组成了NP矩阵N个对象∗P个属性),见式(1-1)。

978-7-111-55491-2-Chapter01-45.jpg

在机器学习领域中,无监督学习范畴的聚类算法的设计就是用于将多维数据对象自动分组成多个类或簇,一个好的聚类方法要能产生高质量的聚类结果,就是具有高的簇内相似性,同时具有低的簇间相似性,这种技术与之前讨论的无线网络特征的智能识别和分类需求十分契合。

在应用具体的聚类算法前,通常需要对无线网络特征属性取值进行预处理操作,以消除不同数据量纲对聚类结果的影响,常用的标准化方法是采用标准度量值(Z-score),见式(1-2)。

978-7-111-55491-2-Chapter01-46.jpg

式中,μ为所有样本数据的均值,σ为所有样本数据的标准差,经过处理的数据符合标准正态分布,即均值为0,标准差为1。

对于聚类过程中计算无线小区对象间差异度的Minkowski距离定义见式(1-3)。

978-7-111-55491-2-Chapter01-47.jpg

式中,i=(xi1,xi2,…,xip)和j=(xj1,xj2,…,xjp)是两个p维空间的数据对象,这里指两个含p个特征属性的无线小区,q为正整数。

q=1时,d称为曼哈顿距离,而当q=2时,d称为欧几里得距离。

在定义了差异度距离之后,根据如下算法进行小区特征场景的定量识别和划分,如图1-31所示。

1)随机地把所有无线小区对象分配到k个非空的场景簇中。

2)计算每个场景簇的平均值,并用该平均值代表相应的场景簇。

3)将每个无线小区对象根据其与各个场景簇中心的差异度距离,按照距离最近的原则重新分配到与它最近的场景簇中。

4)回到步骤2),直到不再有新的场景分配发生。

978-7-111-55491-2-Chapter01-48.jpg

图1-31 网优场景识别算法

4.无线网络场景特征的选取及评估

为达到量化并识别无线网络特征场景的目的,需要对描述小区主要特征的属性进行选取,本试验以GSM系统为例,选取了覆盖特征、干扰特征、寻呼量特征、话音业务请求量特征、小区切入请求量特征这五大类(共7个特征属性)。

需要补充说明的是,如果选取更高维度的无线网络特征属性,将会面临一个关键的特征降维问题,即需要通过降维有效地消除无关和冗余特征,提高挖掘任务的效率,改善预测精确性等学习性能,增强学习结果的易理解性,本文在此不展开讨论高维度场景聚类问题。(www.daowen.com)

基于现网数据平台,提取了××市全网室外小区的六忙时平均值作为数据样本,且要求所选小区的每线话务量>0.1erl。

理想情况下的特征选取是不包含无关和冗余属性的,即理想的特征集应该是每个有价值的非目标特征与目标特征强相关,而非目标特征之间是不相关或是弱相关的。为了评估所选特征属性间的相关程度,根据全网小区级样本计算出的相关系数矩阵见表1-14。

表1-14 场景特征相关系数

978-7-111-55491-2-Chapter01-49.jpg

表1-14中,相关系数的值介于-1与+1之间,即-1≤|x|≤+1,当|x|>0时,表示两变量正相关;当|x|<0时,表示两变量为负相关;当|x|=1时,表示两变量为完全线性相关;当|x|=0时,表示两变量间无线性相关关系。

当0<|x|<1时,表示两变量存在一定程度的线性相关,且|x|越接近1,表示两变量间线性关系越密切;|x|越接近于0,表示两变量的线性相关越弱。一般可按三级划分:|x|<0.4为低度线性相关,0.4≤|x|<0.7为显著性相关,0.7≤|x|<1为高度线性相关。

从表1-14计算的结果来看,所选取的小区无线特征属性之间并无高度线性相关,显著相关的有4项,其中上行覆盖率与下行覆盖率相关系数为0.49921,说明上、下行覆盖特征方面存在一定的关联,但相关程度并不高;同时也可以看到,SDCCH试呼次数、话音信道试呼次数、小区切入试呼次数这三者之间也呈现一定程度的相关性,这与GSM无线信令流程及小区业务模型是一致的,除此之外,其他特征属性之间并无显著相关。综上判断,所选的7项属性可以用来进行小区场景聚类分析

5.网络优化场景划分结果分析

通过对全网室外小区进行自动算法划分,小区被划分为了15个场景类型(编号Cluster1~15),并自动计算出了每个场景类型所含小区属性的平均值,每种场景类型下面均添加了针对此类小区的特征描述和相互对比的关系,见表1-15。

场景划分结果1~4见表1-15。

表1-15 场景划分结果1~4

978-7-111-55491-2-Chapter01-50.jpg

(续)

978-7-111-55491-2-Chapter01-51.jpg

场景划分结果5~9见表1-16。

表1-16 场景划分结果5~9

978-7-111-55491-2-Chapter01-52.jpg

场景划分结果10~15见表1-17。

表1-17 场景划分结果10~15

978-7-111-55491-2-Chapter01-53.jpg

(续)

978-7-111-55491-2-Chapter01-54.jpg

从上述场景自动划分试验结果来看,当采用7个特征属性,聚类数量设置为15时,算法可以将全部室外小区按照不同场景特征明显地划分开来,能够产生较高质量的聚类结果,同时也具有高的簇内相似性和低的簇间相似性特点。将上述7个特征属性、15类小区场景结果按照属性维度的雷达图进行显示如图1-32所示。

978-7-111-55491-2-Chapter01-55.jpg

图1-32 场景划分结果呈现

总结:使用机器学习算法对网络优化场景的精确识别本质上是针对网络运营中收集的全量统计信息进行综合分析,从而挖掘出有价值的信息的过程,可以协助提升各级网络部门对无线网络场景的认识水平,通过定量的聚类分析,可以实现小区特征模型的自动划分,从而为后续的性能、参数、资源配置模型分析建立可靠的依据,这也正是本书所要阐述的主要内容。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈