根据乔向杰等的研究,如图12-16所示,构建一个旅游目的地的管理、营销的决策支持平台,对于数据收集与处理的对象一般需要通过对多源数据的集成、转换和处理并存储于一个统一的数据仓库中,在此基础上利用商务智能、人工智能、数理统计等技术与方法进一步将信息加工为知识,供旅游目的地的管理人员所使用。
图12-16 旅游目的地知识管理平台框架
1.平台框架
(1)数据源
一般可以包括市场类数据、游客行为类数据、产业类数据。市场类数据像国际旅游市场统计数据一般可以通过世界旅游组织、世界旅行业理事会等通过购买的方式获取。国内旅游市场数据可以通过文化和旅游部出版的历年旅游统计年鉴及各省市的统计年鉴获取;对于游客行为类数据,一般可来自显式的用户反馈,像游客调查反馈、网站打分和评价,也可以通过隐式的对旅游者的信息跟踪的方式获取,如网站浏览数据、在线请求、预订和支付数据以及基于GPS的空间移动数据等;产业类数据可以通过企业直报系统、上市公司季报,以及一些咨询公司发布的市场调研报告进行收集。
(2)旅游数据仓库
数据仓库为决策支持系统和联机分析应用数据源提供了一个结构化的数据环境,它能将数据转变为信息进而让用户可以使用更多的知识来做出竞争性的决策。数据仓库中的数据是以主题的方式而非应用程序的方式进行组织,所以数据仓库仅仅包含的是决策支持过程中所需要的信息。它能够很好地支持OLAP分析和数据挖掘,因此,也是知识型目的地管理平台的基础。
(3)数据抽取、转换与加载(ETL)
由于数据来源于不同的渠道,异质性高,且噪声多,需要通过对数据进行清洗、转换,加工成便于进行分析的形式。对于非结构化数据,可能还需要进一步采用文本挖掘和自然语言处理等方法进行加工处理提取出有用的信息。
(4)知识生成(www.daowen.com)
数据挖掘在旅游部门非常重要,它能在大量的数据中发现未知的模式,还能处理非线性关系。描述/探索性分析被用于形成报告或OLAP分析;监督学习方法,比如分类、估计和预测被用于解释游客预订、取消和消费行为,或预测旅游需求。非监督学习方法聚类是数据挖掘技术中应用最多的,主要用于游客细分、动态价格或客户关系管理。Web内容挖掘主要是对旅游在线平台和网站的内容分析(如游客点评网站、博客、微博等社交网络平台),尤其是对用户产生内容的分析(UGC)。所采用的文本挖掘方法主要为基于统计或语义分析的方法,并被应用于反馈聚合、意见挖掘或情绪检测。Web使用挖掘是对在线平台或网站的游客行为的分析,通过跟踪用户的浏览行为来发现用户的关注热点及偏好,从而进行游客细分,并应用于网站自适应和产品个性化推荐;或者使用序列关联规则挖掘进行点击流分析来发现在线用户的浏览和搜索习惯。数据挖掘在旅游业应用功能包括:自动预测趋势和行为、关联分析、聚类、概念描述、偏差检测。自动预测趋势和行为的例子是旅游需求的预测。目前预测方法有传统的定性定量方法,如德尔菲法、计量经济方法、时间序列方法,以及现代的神经网络、粗糙集、模糊理论、灰色理论、支持向量机等。
(5)知识应用
即为知识的表达与可视化,将加工生成的知识通过一定的形式展现给终端用户。对于描述性/事实性知识可以通过如OLAP分析、报告、图形等形式加以展现,对于过程性知识还需要由系统通过构建一些模型和方法以不同的形式展现给用户。
2.旅游决策支持与分析
如图12-17所示,平台数据源可能来自平面文件以及其他的数据库系统,系统将通过ODBC、OLEDB以及各种数据库自带的连接驱动建立数据源连接,并通过ETL工具对各类异构数据进行清洗、转换并加载到数据仓库中。在Microsoft SQL Server Analysis Service的基础上通过一个前端应用程序接口,利用可视化的操作界面进行数据视图的管理、元数据管理以OLAP数据库的管理及多维模型的发布。对于数据分析工具,一方面可以利用SQL Server提供的服务进行数据挖掘,另一方面亦可通过API将SPSS/EVIEWS等软件集成到平台中,进行更专业的数据分析。
图12-17 平台技术框架
数据源是平台的基础与根源,因此,需要确定平台所需的数据来源与渠道。为了保证数据的权威性、真实性与可获取性,选取权威机构、社会媒体公开发布的数据,见表12-2所示。
表12-2 数据指标及来源
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。