目前,学界对机器人写作的现象描述和介绍很多,而对机器人写作进行定义的很少,大多数学者热衷于研究机器人新闻写作,原因在于机器人写作在新闻领域应用的比较多。最先对机器人新闻写作进行研究的是美国学者肖珊娜·佐伯芙(Shoshana Zuboff),她在1981年发表了《计算机介入工作的心理和组织意义》(“Psychological and Organizational implication of computer-mediated work”)一文,她这样描述:“不难想象,人类的记者在不久的将来将被软件取代。事实上,这种转变已经存在,编辑已由软件编辑替换。电脑编程故事将由机器人记者完成。数字化如何影响记者?多技能记者今后的处境怎样?他们将如何应对即将到来的令人不安的状况?什么是机器人新闻?为什么要使用算法新闻学?机器人生成什么样的文本?算法新闻会取代人类记者吗?自动文本要考虑哪些伦理问题……这些问题都需要做出回答。”[4]肖珊娜·佐伯芙当时对机器人写作在新闻领域的应用做了大胆预测和思考,特别是提出了与机器人写作相关的概念:如“机器人新闻”(robot journalism)“机器人记者”(robot journalist)“算法新闻学”(algorithmic journalism)“自动化新闻”(automated journalism)。不过,她并没有对这些概念进行解释和说明。
机器人写作是伴随AI技术的发展而发展的,其核心是云计算和大数据分析,从浩瀚的资讯中找出市场最可能关注的那部分,通过AGC(algorithmic generated content),用人们能够接受要求的格式呈现出来,这种技术是计算机基于算法的数据分析和自我学习,具备AI技术的“算法的中立性”(neutrality of algorithms),相当于新闻报道的客观性,整个过程也是自动化的。
埃胡德·赖特(Ehud Reiter)指出:“‘机器人写作’又叫‘算法写作’(algorithmic writing),主要来源于自然语言生成(natural language generation,NLG)技术领域,这是基于非语言输入(non-linguistic input)的自动生成文本的过程。”[5]通常,NLG系统必须能够执行一些标准的任务。首先,NLG系统应该选择特定的信息来表达内容;其次,它必须组织可用信息并确定结构文本,而且,它应该确定哪些信息被放置在任何句子中,都能够准确表达意思;最后,它还必须创建要显示的表达式,同时语句要符合语法规则。只有通过这样的系统设置,机器人写出的文本才能语法正确、文字清楚。
最初的NLG系统只能生成非常简单且没有多少变化的文本。然而,经过科学家多年的努力,计算机语言识别技术快速发展,NLG系统能够生成各种各样的文本。
如今,AI技术快速发展,诞生了Yseop(AI软件公司——笔者注)、CBS(Columbia Broadcasting System)互动媒体公司等各种AI企业。同时,涌现了各种各样的机器人写作软件,如一款“幻想记者”(Fantasy Journalist)软件,“它能写出非常深刻和比较人性化的文章,这类文章很难分辨出是人写的还是机器写的”。[6](www.daowen.com)
彼得·扬·奥贝莱特(Pieter-Jan Ombelet)指出,要完成机器人自动化写作一般需要四个参与者(actors):软件程序员(software programmer)、数据源(data source)、编辑(editor)和出版者(publisher),其作用各不相同,“软件程序员是为了开发内容的创造性算法,数据源要确保能够为算法提供足够的原始数据,编辑的工作是选择数据源和监督自动化进程,出版者是为了给他们的读者发布所需要的内容”。[7]当然,在机器人写作的具体实践中,软件程序员、编辑和出版者可以是同一个参与者。例如,2014年3月17日,美国加州发生了4.7级的地震,《洛杉矶时报》的记者肯·施文克(Ken Schwencke)在地震发生三分钟后,利用“地震机器人”(quakebot)撰写了一条新闻,其内容如下:
据美国地质调查局报道,星期一早上,加利福尼亚Westwood 5英里处发生了一次浅层4.7级地震。地震发生在太平洋时间6:25,深度为5英里。根据美国地质调查局的数据,震中距加利福尼亚贝弗利山庄6英里,距环球城7英里,距圣莫尼卡7英里,距萨克拉门托348英里。在过去的10天里,震中附近没有发生地震3级以上的地震。这个信息来自美国地质勘探局地震,这篇文章是由作者编写的一个算法创建的[8]。
AI技术能像人类一样能够“思考”,只要创建一个自动化识别算法的软件,机器人就能根据用户的需要,“写出”让用户感兴趣的个性化文本。比如,谷歌、百度的网页排名算法,推特的趋势名单,就是根据每个用户的配置文件制定的。以大数据为基础的机器人写作能够在几秒钟之内生成用户需要的文本,如股票价格、体育统计、天气预报、财务报告等,从而在短时间内满足用户需要。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。