此处从新闻数据内容的采集视角切入探讨人工智能对新闻采集手段的影响。这主要表现在新闻数据获取和新闻信息整合两个维度。
(1)人工智能技术与新闻数据获取
其一,人工智能语音识别与新闻数据获取。语音识别和自然语言理解相结合,将为人们创造更为便利有效的语音接口,从而与身边的设备实现高效率互动。早在2014年年底,百度首席科学家吴恩达与其团队就发布了第一代端对端的深度语音识别系统Deep Speech,即使在嘈杂环境下也能够拥有94%的语音识别准确率。2018年两会报道上,人民日报新媒体中心首次引入人工智能语音识别系统。这意味着语音识别系统进入新闻领域,在各大重大会议视频直播中,该系统能够使音频和中英文文本翻译实时进行无缝连接,极大地提高了新闻发布速度和传播效率。依赖互联网网络的庞大数据量和强大的算法,实现对语音、文字、视频等数据的全集的整合分析和提取正在成为现实。
其二,计算机视觉与新闻数据获取。在人工智能技术支持下的智能设备还可以像人眼那样记录所见,甚至有时候能够推导出一些肉眼看不见的信息,这就是所谓的“计算机视觉”。例如,美联社使用Digital Globe公司提供的高解像率图像来印证南亚海底存在大量非法捕捞容器,完成了揭露非法海鲜产业黑幕的报道,获得2016年普利策奖公共服务大奖。Digital Globe的计算机视觉技术依靠卫星摄像机从最佳角度来拍摄必要信息,可以最大限度地根据美联社报道团队的需求来完成拍摄任务。再如:
利用计算机视觉技术从“微表情”中发现信息。计算机视觉识别报道对象的“微表情”功能也非常强大。哥伦比亚大学数据科学家阿米尔·伊曼尼认为:“就像一个孩子慢慢长大,逐渐学会看父母的脸色行事,这种行为实际上就是通过识别父母的不同面部表情来判断父母的心情。可以设想计算机视觉来做同样的事情,但是计算机首先需要三年的时间来学习一个人的面部表情传递何种情绪,之后它可以立即识别成千上万的面部表情,并迅速作出分类。”例如,2017年1月,伊曼尼就运用自己团队设计的计算机视觉系统和Quartz记者一起对美国总统特朗普的就职演讲进行了报道。这个系统可以识别“微表情”,比如睫毛抬起表示惊讶的表情,并能将这些微表情和特定的情绪进行快速配对。他们利用计算机视觉对特朗普的面部表情进行识别,并推测出他发表就职演讲谈及某些敏感问题时的具体情绪。[211]
在上述案例中,无论是美联社还是Quartz记者都在技术人员的帮助下使用了计算机视觉技术帮助获取通常人力难以获取的新闻数据,AI“看到”了记者用肉眼难以发现的新闻事实。
(2)人工智能技术与新闻信息整合(www.daowen.com)
其一,人工智能与新闻语音输入。语音识别系统能够实时将语音转化为文本,也能将文本转化成语音。2018年两会上语音识别系统的引入正说明了这一点。这项技术给新闻视频的剪辑和新闻声音的录入带来巨大便利。比如它能给新闻栏目实现自动匹配字幕翻译,不管是对外文频道外文的识别还是地方频道方言的识别,都能迅速实现字幕录入,降低生产成本,减轻编辑负担。在视频直播、新闻见面会等方面省时省力,使文本信息与语音信息实现同步整合。未来的配音工作都可以使用机器自动化。
其二,人工智能技术有助于筛选信息。新闻作品的核心任务是筛选正确信息,修正内容。机器算法能够提供尽可能多的信息,获得新闻的相关性信息和多维度信息,从而横向、纵向开展新闻研究。国际调查性报道记者联盟曾组织400多名记者参与分析高达2.6 MB数据的《巴拿马造纸业黑幕报道》,在人工智能技术的帮助下,记者们的各种邮件、文件等原始数据的深入分析变得快捷而清晰。
其三,人工智能技术方便新闻审核监测。在整合新闻的过程中,人工智能技术能够对某些新闻禁用词和慎用词进行审核。例如,通常新华社会根据社会环境和网络文化的不断发展来设定新闻用词的边界和禁忌。在新华社发布的《新华社新闻信息报道中的禁用词和慎用词(2016年7月修订)》中提到不使用“一带一路”战略的提法,应使用“一带一路”倡议;不使用“践行‘八荣八耻’”的提法,应使用“践行社会主义荣辱观”等。新闻媒体和网站应当禁用的不文明用语有38个,如“装逼、草泥马、特么的、撕逼、玛拉戈壁、爆菊、JB、呆逼、本屌、齐B短裙、法克鱿、丢你老母”等。如果及时地给算法输入新闻禁用词和慎用词标签,并且不断跟随权威媒体的更新而实时跟进,加入到数据库,那么机器算法就能辅助新闻从业者对新闻内容进行审核,以确保不会出现原则性错误。
其四,人工智能技术有助于优化选题策略。人工智能可以发现并验证趋势,为新闻工作者提供选题方向。人工智能程序能够自动从数据中发现特征,以此帮助记者深入了解受众,为舆情监控和舆论引导提供帮助。2016年2月,美国知名新闻博客Mashable执行董事在出席活动时表示,媒体要学会用人工智能发现新闻故事。为此,Mashable启动了名为Velocity的数据分析工具平台,通过分析分享链接识别文章的传播趋势和可能存在的爆点。该平台可以帮助编辑判断某一事件的关注度,并根据实际情况选择合适的报道策略。
再如,美联社News Whip提供的社交网络分类监测系统辅助报道决策。其运用AI技术挖掘的实时数据和预测出的各种发展趋势所形成的数据驱动型策略,对于美联社的日常新闻工作大有助力,主要表现在:第一,实时监测。News Whip的产品和技术通过每两分钟扫描一次包含Facebook、Twitter、Youtube等全球主要社交网络上的活动,然后将这些活动行为与数以百万计的内容进行比较,来展示什么内容是当下传播速度最快的、数据表现最好的,这些内容的发展趋势、报道角度和讨论热度又如何,怎样的内容可能会更符合受众的兴趣所在……通过追踪海量实时互动数据,NewsWhip相应转化为可操作的见解,帮助媒体人形成有效的内容生产策略。第二,分析预测。除实时数据的追踪外,NewsWhip也提供基于海量数据的沉淀,来帮助新闻机构从更多元的维度来进行内容分析,了解最适合每个平台特定受众的分发方式,从而建立并优化出更为立体的报道策略。[212]各种智能算法分析工具,延伸甚至放大增强了人类记者编辑的感知,结合人类记者编辑自身的经验,极大地辅助报道决策,优化了选题策略。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。