建立一个“以人为本”的、以使用者为中心的、多元开放的企业创新平台数据处理系统,是基于大数据背景的旅游企业创新的基础和核心。这个系统是在合适的大数据分析处理工具的辅助下,对广泛异构的各种有益于旅游企业创新的数据源进行采集和集成,按照统一的标准模式进行存储,并利用合适的大数据分析技术对这些数据进行分析,从中获取有益的知识和信息用于旅游企业的创新研发。旅游企业创新平台数据处理系统主要包括数据获取与集成、数据分析和数据解释3个子系统。
(1)数据获取与集成。这一模块主要是获取旅游企业内部销售数据、市场信息(特别是目标消费者信息)和旅游企业运营信息,并分门别类地把这些信息整合在一起,建立一个统一的数据获取与集成系统,是旅游企业进一步开展创新研发的基础性工作。但目前大多数旅游企业仍然是采用传统的信息处理和管理系统,无法有效地对旅游企业内部数据进行复杂的整合分析,导致旅游企业创新研发人员面临大量的混乱数据而无所适从,最终导致旅游产品和旅游服务研发失败。当然,大数据背景下的旅游企业创新所需的数据不仅来源于企业内部,旅游企业所在的供应链网络也是重要的数据来源,在设计旅游企业数据获取系统时必须将上述两方面的内容考虑进来。获取旅游企业数据还必须关注一些新兴的交叉行业领域,甚至一些个人掌握的数据。这些数据在价值链中往往呈现出较高的碎片化和瞬时性特征,但有时对旅游创新却具有较大的价值。不同的利益相关者拥有诸如此类的不同的数据,他们也正在尝试把这些数据应用于产品和服务的创新中,从创新中获取应有的收益。旅游企业不仅要分析这些数据的价值,还要考虑不同利益主体各自的利益诉求,这样才能合法获得这些数据的使用和分析机会。由于旅游企业采集和存储的数据来源众多,格式和内容五花八门,因此,在采集这些实时数据时,必须首先对这些数据进行初步的处理和编码,经过关联和聚合后再采取统一的定义和结构进行存储。要对一些冗余的数据进行清洗和处理,以保证这些数据的质量和可靠性。目前,大数据获取和集成采用的技术主要有ETL、数据联邦、数据流和搜索引擎等方法。
(2)数据分析。数据分析子系统是旅游企业创新平台的核心。从企业内部和外部多个数据源获取和集成的多种数据就是该子系统进行分析的原始数据。根据旅游企业不同部分不同的需求,可以从这些原始数据中选择部分或全部进行数据分析,传统的数据分析方法已经不适应大数据背景下的旅游企业创新、研发需求,需要有新的方法。目前用于大数据分析的工具很多,但是各有优劣,要根据需要进行科学选择。用旅游业大数据库的数据分类进行实际操作,并比较这些算法的优劣。在这些算法中,随机森林和支持向量机两种算法分析工具在旅游数据分类上占较大的优势。(www.daowen.com)
(3)数据解释。数据分析子系统是旅游企业创新平台的基础和核心,但系统的用户、决策层更关心这个平台对数据分析结果的解释。如果数据分析的结果正确,但找不到合适的解释工具,最终用户和决策者很可能难以理解甚至理解错误,导致分析结果不但对旅游企业创新研发没有帮助,反而会阻碍产品和服务创新的研发。传统用于解释普通小数据量的方法,如文本的方法,已经基本不适用于海量数据的解释。目前用于对大数据分析结果进行解释的工具主要有两类:一类是引入可视化技术,如标签云、历史流和空间信息流等;另一类是采用人机交互技术和数据源技术,让用户参与具体的分析过程中,以帮助他们理解数据分析结果,并更好地应用于企业创新研发过程。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。