对于运行中的网站,客观评价网站的现有设计,对提升网站性能具有参考价值。网站性能评价系统可以保障网站正常运行、提供量化管理依据和提高市场竞争力。文献[8]提出了一种基于Web日志挖掘的评价网站性能的方法。文献[9]证明了网页的大小和网站所在的层次是影响其访问难易程度的重要因素,然后针对网页是否可达进行了评估。文献[10]从消费者满意度的观点来评估B2C电子商务网站评估,用层次分析和灰色评估方法,从技术指标、安全指标、商业指标和服务指标进行分析。
针对网站性能,可以从服务器端、客户端、数据库等方面进行优化设计[11,12]:
(1)从浏览器前端优化:产生较少的HTTP请求;运用内容分发网络;运用Gzip压缩网站页面;在页面头部(header)添加过期时间。
(2)从服务器架构优化:搭建高效率Web服务器、第四层交换层架构、镜像网站技术。
(3)从数据库访问优化:页面静态化、缓存技术、数据库集群和库表散列、数据库设计代码优化。针对传统Web性能测试的基础,文献[13]运用测试工具LoadRunner建立场景,尽可能真实地模拟大量用户的并发操作等性能,对测试结果进行完善,准确定位性能的瓶颈。文献[14]的作者采用网站能力测试软件Web-CT4.0,在不同地点、不同时段,以不同的上网方式、不同的并发数量访问不同的Web页面,对系统响应时间、流速和流量进行了分析,并对网站的响应时间做了测试,通过采用SPSS软件处理测试数据,对网站性能有明显改善,学习者对网站的满意度增加。但是,网站之间的性能差异较大,仍有部分网站性能较差。文献[15]利用HTTP头文件值对新西兰网站从压力和缓存两方面进行了性能分析。文献[16]根据时间序列监测的数据来动态预测应用程序,用来评估新网站的性能状况。文献[17]分析了9个网站对接入性和可读性的评估。
网络时延具有非线性、突发性和自相关性等特性。在文献[18]中,作者根据NetFlow中特定的TCP 交互数据流记录来测量网络延迟,结合统计中区间估计理论,估计出主机之间一段时间内的平均往返时延。在文献[19]中,作者将RBF和Elman神经网络对比,总体Elman预测效果优于RBF神经网络。从相关系数、预测值与真实值之间的均方误差、最大相对误差、预测时间4个方面,文献[20]中提出了基于RNN 网络预测的性能,分别与AR模型、RBF神经网络预测算法进行比较分析。在对网络时延的预测上,多种文献采用机器学习的方式对其进行分析和预测,少有采用支持向量机的方法对其进行分析和与预测。
网站流量对于网站的管理者和使用者都很重要。实际网络流量是不平稳的时间序列,具有很强的突发性、分形性、重尾性、自相似性以及混沌性等特性。文献[21]对多分形小波模型对网络流量进行了验证和预测。文献[22]对时间尺度的大小与模型选择的关系进行了研究,对实际网络流量在不同时间尺度下进行预测建模和预测性能做了比较。在文献[23]中,作者采用自主开发的网络监控系统,对数据链路实施长期的测试监控,将实际流量分为与时间相关分量的周期性函数和与时间无关、分量服从正态分布的函数,并利用该模型预测特定时刻的流量。文献[24]对网络流量预测模型采用神经网络模型,并与其他预测模型进行对比分析。文献[25]采用BP神经网络构建了一个能预测网站流量的模型,对网站的运营状况和质量进行评估,从访客的角度来了解所运营的网站,为规划和管理网站、合理分配网络资源以及提高自身竞争力提供有利的数据支撑和依据。文献[26]结合小波变换和神经网络方法,对网络流量进行了预测。同时,为避免BP神经网络的缺点,还提出了一种基于改进的差分进行训练BP神经网络的算法。文献[27]将具有长相关性质的网络流量时间序列进行EMD分解之后,用简单的短相关模型来替代相对于长相关模型,降低预测复杂度。(www.daowen.com)
目前,针对Web服务响应时间的建模研究较少。文献[28]发现响应时间和并发用户数的关系接近线性函数。当Web负载超出资源所能承受的范围时,响应时间和用户数的关系应当呈指数关系,不再呈线性关系。文献[29]发现,响应时间与用户请求量在峰值负载之前存在的指数关系,该文献提出MBRT Web服务器性能评测模型,并转化为线性回归模型来快速定位服务器的系统峰值。由指数关系建立的线性回归模型准确,且适用于Web服务器性能评估。文献[30]对基于聚类的响应时间进行了分析,提供了一种量化分析响应时间的方法。Web服务是多种多样的,受多种因素影响,而且是时变的,采用静态的方法不能准确反映网站的响应时间。该文献还分析影响网站的访问速度的原因主要有两个,一个是网络传输质量(包括延迟、并发用户数、丢包率等),另一个是网站服务器处理事务的能力。文献[31]采用Web服务的历史运行数据的时间序列来分析网站状况,然后进行动态预测,根据数据的特征模式,选取合适的数学模型进行预测,提高了网站预测的准确性。
综上所述,现有文献研究存在以下不足之处:
(1)大多数网站性能研究是基于测试软件进行的,采用仿真工具来测量网站在不同用户数下承载的负载能力。但是,Web系统受多种复杂外界因素影响,本身就是一个复杂的非线性系统。根据测试数据只能定性分析网站的性能,无法准确评估网站的状态。
(2)现有的网站监测主要采用单点测量的方式。通过单点测量数据判断网站的运行状况,最终结果准确率较低,同时受到监测点的网络状况、带宽、监测机器的性能影响,误差较大。
(3)现有的网站性能研究多采用时延、流量指标进行分析,缺少从用户角度的分析。同时,这些研究只是进行网站监测,而缺少预测能力。
针对这些问题,文献[32~35]采用了分布式网站监测模型,对网站性能工作状态进行监测分析,取得了良好的效果。其研究细节将在本书的后几章中阐述。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。