余志毅等以决策树探讨了旅游产品销售的效率提升问题。以某旅游销售公司的调查问卷进行分析,如表11-2所示,潜在客户的数据主要有年龄、性别、职业、收入、教育程度、是否结婚、是否曾经出境旅游等,调查客户是否会在一年内出境旅游。
表11-2 某旅游销售公司的潜在顾客调查情况表
1.数据预处理
调查问卷中,有部分没有填写的选项,如年龄属性,对于这一部分记录采用的是使用属性平均值填充的方法。在进行数据挖掘工作之前,需要进行前期的数据整理工作,比如根据直观经验去除数据中的冗余信息或不相关信息,对于上面的数据集中的属性,像序号等,可以在正式开始数据挖掘前去除,因为客户是否近期内出境旅游是最关心的信息,把属性“是否一年内出境旅游”即buy作为类标签属性。
2.生成决策树,产生规则
整理后的数据导入到DB2关系数据库表中,使用IBM Intelligent Miner供的数据挖掘工具生成决策树并剪枝。在得到决策树之后,可以由其中提取分类规则,在该例中,可以提取的规则如下:
If Salary=2750-6500 and age=31.5-40.5
then buy=y。
也就是说,在剪去一些噪声枝节之后,在决策树的每一条支路上,都可以形成一条分类规则。可以采用这些分类规则,对潜在的客户数据进行分类,由此得出哪些客户最近有出境旅游的意愿,然后可以主动地向客户推销旅游产品,并且给予一定的优惠政策,由被动营销转变为主动营销。
3.决策树结果分析理解
样本问卷是在平时来旅游公司门店咨询中获取的,来店咨询并接受问卷调查的自然多数是有出境旅游想法的,因此31.2%愿意出境旅游,这个比例在普通人群中是达不到的。从产生的决策树规则分析是否在一年内出境旅游与客户的因素之间的关系。(www.daowen.com)
(1)收入直接决定了一个人的购买力。salary即在月薪低于2550元的客户中,出境旅游是奢侈品,在近期一年内没有出境旅游的意愿;在月薪高于6500元的客户中,一年内也没有出境旅游的意愿,可以想象高收入人群大多已经有出境旅游的经历了。
(2)年龄也是导致出境旅游的一个因素。接受调查的人都在22~65岁之间。年轻人中愿意出境旅游的较多,年龄小于32岁的人,可能由于婚姻、购房等大额消费,一年内没有出境旅游的意愿;年龄在3~42岁之间(占82.3%),一般来说这一部分高收入人群不受经济状况所困扰,会考虑出境旅游,因此有近期出境旅游的打算。
(3)愿意出境旅游的多为男性。在低收入的女性中没有考虑出境旅游问题,但男性如果收入还可以的情况下有近期出境旅游的可能性。
(4)从数据来看,受教育情况、婚否、工作性质与是否愿意近期出境旅游影响也不大。客户的购买行为还要从多方面进行考虑,我们仅从这几方面挖掘出外部环境与客户的购买行为之间的关系。在计划出境旅游的人群中,出境旅游的价位、旅游目的地、旅游期限等也可以进行挖掘;打算出境旅游的人群中,不愿意出境旅游的原因,也值得分析。
采用决策树分类算法,通过对调查数据挖掘,得到一系列的分类规则,然后利用此分类规则,对潜在旅游客户进行分析,采取主动营销,可以降低营销成本、提高营销效率。随着多方面大量数据的获得,业务智能的数据挖掘工具可以挖掘出更有参考价值、易于理解,并具有很高的分类准确度的规则为旅游生产实践服务。决策树数据挖掘技术在旅游产品销售中有着广阔的应用前景。
回顾与引申:
1.旅游业务智能系统的开发包含哪些主要的阶段?各阶段的主要任务是什么?
2.旅游业务智能系统成功的关键因素有哪些?
3.试分析数据仓库和数据库的区别和联系。
4.OLTP和OLAP分别代表什么?比较二者之间的不同之处。
5.什么是决策支持系统?它与旅游业务智能系统有什么区别和联系?
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。