1.销售信息获取
大数据发展包括三个阶段:运营式系统阶段、用户原创内容阶段、感知式系统阶段。出版企业获取销售数据的途径主要有:第三方数据服务公司获取、出版企业的ERP销售数据、书店销售数据反馈,这些可以归为运营式系统阶段数据获取方法。
网络营销也是数据的重要来源。近些年,当当网、亚马逊和京东等网络图书商城的图书销量已经超过图书总销量的30%。通过分析这些网站的购买记录,可以获取到海量的读者购书频率信息、购书偏好信息等。对于图书营销来说,一方面,出版企业需要在相关零售网站上建立自己的直营网店;另一方面,出版企业需要与大型网络零售商合作,通过多元化的销售渠道来扩大图书销售份额,并通过加强与互联网及大数据企业的合作,实现出版行业和互联网及大数据的产业深度融合,加速出版行业对大数据的获取与应用。
2.用户原创信息获取
在Web 2.0的环境下,用户原创信息量猛增,这些新媒体和网络社区是出版行业相关数据的重要来源。用户的原创信息还包括通过博客、微博等平台发表的网络作品,一些颇受欢迎的网络出版物对传统出版物的质量也有借鉴意义。(www.daowen.com)
从目前可能的出版物数据来源可见,数据主要来自出版企业外部。信息平台将用户的网络行为连同个人信息进行全景式记录,实现了数据增量的质变,这些数据既包含出版企业提供的产品内容库,也包含网络使用者的用户数据库。通过这样的信息资源平台,出版企业可以获得真实的、可寻址的用户资料、购买意愿、行为及反馈,对用户需求的了解更接近真实状况。
除此之外,一些新媒体和网络社区也包含了大量图书评价信息。充分发挥网络的优势,利用空间、微博、微信、博客、论坛、搜索、QQ、MSN、社区网、RSS、豆瓣读书、当当网、亚马逊等渠道把读者的反馈信息收集起来。例如,通过Cookie技术获取读者浏览网页、搜索和评论图书产品、阅读状态等行为数据,通过这些数据,出版行业可以获得关于读者在购买偏好、购买意愿、购买频率、购买周期、忠诚度、满意度等方面的丰富数据,有利于出版企业准确把握读者的阅读与消费趋势。
3.图书馆借阅信息获取
目前,几乎所有地区及高校图书馆都采用数据库技术对其进行管理,其主要目的是方便图书馆对图书的采购、编目及对图书的流通进行有效的管理。在图书馆的流通中,产生了大量的数据,其中包括借阅人信息、借阅图书数目、借阅频率等信息,这些也成为出版行业能够利用的大数据的主要来源之一。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。