理论教育 大数据应用于出版质量提升:长效机制研究

大数据应用于出版质量提升:长效机制研究

时间:2023-08-14 理论教育 版权反馈
【摘要】:大数据在出版产品质量提升方面的应用形式有优化选题质量、来稿预处理、编辑人员监测和出版物质量评价等。2)动态评价大数据平台是一个实时更新的动态信息网络,运用在线数据挖掘与跟踪技术对出版物的销售量、读者评价等信息进行动态跟踪和科学预测,进而将静态结论性数据与动态的变化数据结合起来,可以实现静态评估与动态评估的结合。

大数据应用于出版质量提升:长效机制研究

大数据在出版产品质量提升方面的应用形式有优化选题质量、来稿预处理、编辑人员监测和出版物质量评价等。

1.优化选题质量

传统出版行业通过出版物的发行量以及编辑的经验进行选题,这样的方式带有滞后性,往往不能反映读者兴趣;而通过抽样数据预判市场则难以全面反映读者需求,并会出现数据偏差。大数据技术可以协助出版企业全面清晰地获取所需要的信息,通过对销售数据、用户浏览数据分析及用户分类等方法,出版企业可以获取用户关注的选题信息,这些数据通过物联网、可寻址技术等与用户实体相匹配、连接,从而被完整记录,以便出版企业甄别用户需求、了解读者偏好,进而进行定向策划,甚至实现个性化的出版产品定制,生成符合读者潜在需求的出版物。

在选题的信息搜集阶段,编辑可以使用ROST News Analysis Tool和ROSTDetail Miner等新闻和网页信息采集工具、百度指数查询工具;此外,编辑还可以使用研究微博的独到技术、微博引爆点、知微等工具。在图书选题策划阶段,编辑可以使用信息挖掘及舆情分析技术来确定题目、作者、目标读者并辅助进行选题论证。选题论证阶段可以进行背景类信息分析、原则类信息分析、同类选题比较分析和舆情类信息分析来进行选题论证。

2.来稿预处理

可以利用大数据建立作者数据库,其中包含作者的身份认证信息、标签等基础信息和作者作品信息,通过聚类分析的方法确定目标作者名单。

1)数据分析

出版企业在收到来稿后,应快速针对作者、稿件内容进行分析,减少编辑人员的工作量。数据分析的内容可以包括:作者的水平、知名度和著作内容;来稿的内容特征、所属分类;稿件内容抄袭、重复发表、跨语言重复发表可能性分析等。

2)对作者评估分级

对作者进行评估分级可以帮助编辑对来稿作者的层级分布属性进行科学评估,并加以分级或排序。

3)对稿件属性预评估

出版企业引入在线文本分析工具,将来稿的关键词与内外公共文献数据库进行比对分析,可以帮助编辑对海量来稿的时效性、选题热度、学科领域等属性进行评估和分类,进而判断来稿是否属于特定学科领域的新近热门主题或重要选题。(www.daowen.com)

3.编辑人员监测

编辑人员在图书质量的控制方面扮演着重要的角色,承担了重大的任务。在大数据背景下,出版企业可以通过监测和记录编辑人员三审三校的过程、参与编辑的人数、编辑人员的专业背景、编辑次数等信息形成编辑过程信息库,然后结合专家评审意见、读者反馈信息等综合衡量作品的质量,通过大数据技术的应用分析编辑过程信息库中的数据,发现适用于出版企业的编辑人员组成、协同工作模式等,细分编辑过程及工作任务,兼顾出版产品的效率与质量。

4.出版物质量评价

目前,出版物的评价机制尚不健全。从评价主体来看,政府主导的图书质量评价及出版企业评级活动,存在评价主体单一和外部评价缺失的问题。信息咨询公司可以利用自身在数据收集与分析方面的优势,应用大数据分析技术,从以下几方面展开对出版物的质量评价:

1)定性与定量结合

大数据平台为出版物质量的评价提供了分布广泛的数据样本,从而能够获得数量庞大的评分结果。对用户原创评论信息进行文本挖掘,提取特征集能够拓展定量分析的指标框架,并利用这些特征集以及其他文本分析和语义分析就能够建立定性描述指标。

2)动态评价

大数据平台是一个实时更新的动态信息网络,运用在线数据挖掘与跟踪技术对出版物的销售量、读者评价等信息进行动态跟踪和科学预测,进而将静态结论性数据与动态的变化数据结合起来,可以实现静态评估与动态评估的结合。

3)评价主体多元化

出版企业应充分利用大数据技术统计读者评价,使内部评价与外部评价相结合、主观评价与客观评价相结合,充分发挥第三方评价独立、客观、公正的特点,把读者评价、受众满意度以及市场效益等定为关键性指标,将政府专家意见与读者反响、用户满意度以适当权重相结合,从而构建一个更科学完整的评价体系。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈