人的认知与交互：信息单元研究的新进展

更新时间：2026-01-13 理论教育 版权反馈

【摘要】：*本文系国家社科基金重大项目“基于特定领域的网络资源知识组织与导航机制研究”（项目编号：12＆ZD222）、国家社科基金青年项目“语义和情景关联的网络资源聚合单元分类体系构建与评估研究”（项目编号：14CTQ015）和广东省哲学社会科学“十二五”规划2013年度项目“网络资源聚合单元分类体系与本体构建及应用研究（项目编号：GD13CTS04）的成果之一。曹树金1马翠嫦2（1.中山大学资讯管理学

*本文系国家社科基金重大项目“基于特定领域的网络资源知识组织与导航机制研究”（项目编号：12＆ZD222）、国家社科基金青年项目“语义和情景关联的网络资源聚合单元分类体系构建与评估研究”　（项目编号：14CTQ015）和广东省哲学社会科学“十二五”规划2013年度项目“网络资源聚合单元分类体系与本体构建及应用研究（项目编号：GD13CTS04）的成果之一。

曹树金1　马翠嫦2

（1.中山大学资讯管理学院；2.中山大学图书馆）

【摘　要】数字环境下传统文档资源的开发利用，使人们逐渐关注人与文档信息交互的问题，也将传统文档中人们普遍认识的“语篇体裁”概念带入了交互式信息搜寻和检索的研究视野。功能语言学的语篇体裁理论为用户对于体裁结构的认知提供了理论基础，同时也为计算机对于体裁内信息单元的自动识别提供了依据。在用户对体裁认知的基础上，已有研究从数字和网络文档信息单元划分、基于篇章结构的信息空间导航和网络体裁交互中的用户差异等各方面进行探索；同时，基于修辞结构的体裁分析和信息单元自动识别也在开展。相关研究可为信息资源细粒度聚合研究中聚合单元的划分和识别提供理论基础。

【关键词】人与信息单元交互　体裁　自动识别

Review of Studies on Interaction Between Human and Information Units

Shujin Cao　Cuichang Ma

(1.School of Information management，Sun Yat-sen University；2.Library of Sun Yat-sen University)

【Abstract】Utilization of documents in digital environment bring the research question of interaction between human and information into the landscape.The concept of genre generally recognized by readers has been broght from the field of functional linguistict to the field of interactive information search and retrieval.Genre theory provides theoretical basis for recognition of information structure of documents from the viewpoint of genre and also provides basis for the automatic recognition of information units.Base on the genre theory，the studies havefocuesed on decomposition of digital and web documents，navigation in the information spaces and users differences in interaction between human and information units.Meanwihile，the studies on automatic recognition of information units have been going on.

【Keyword】interaction between human and information units genre　automatic recognition.

1　导　言

随着信息技术的发展，信息资源的组织和管理的研究及实践逐渐适从人们对于信息的需求与利用规律，一方面从资源载体的层级深入至资源的信息单元，另一方面通过深入揭示信息单元与用户之间以及信息单元之间的关联关系，从而快速和准确地为用户提供所需信息。本研究将信息资源的细粒度划分、关联、组织和揭示的信息组织过程称之为细粒度聚合。如何面向用户需求和信息单元关联关系划分聚合单元，成为影响信息资源利用成败的关键。

人机交互领域从19世纪90年代起开始关注文档体裁的开发利用，以支持文档向数字环境的转化。研究人员关注读者如何在数字文档的信息空间内导航或如何利用文档的辅助线索等问题，以探索数字文档在搜索结果呈现、局部信息链接和可变布局等方面的潜力。与此同时，体裁理论也为信息单元的自动识别研究提供了具体依据，因而相关研究可为聚合单元的识别、交互和应用提供理论基础。

本文首先从语篇体裁的相关理论出发，在介绍语篇体裁概念、体裁与修辞结构的关系以及人对语篇的认知规律的基础上，对人与语篇体裁交互的研究进行介绍，包括数字和网络文档信息单元的划分与交互研究、基于篇章结构的信息空间导航研究和网络体裁交互中的用户差异研究等，最后对数字和网络环境下的体裁分析与自动识别相关研究进行梳理，为基于体裁理论的聚合单元划分与识别研究搭建统一的理论基础。

2　人对语篇体裁的认知

2.1　语篇体裁的概念

语篇是指一次有效言语交际（communication）过程中产生的话语成品，它在实际的交际场景中形成，是针对一定主题或者目标的谈论方式，包括文字和口语这两种表述方式。语篇在形式上、意义上和功能上都有规定性（convention）：形式上，常见的语篇一般是一个超句体，即由一连串的语段和句子构成，语篇由句子体现。意义上，合格的语篇必须意义连贯。不论是何种形式的语篇，在语篇内部，语句之间应该有逻辑联系，意义通顺，主题明确；在语篇外部，语篇与语境应当相互匹配，语言意义根据语境来确定。因此，Halliday 和Hasan 将语篇视作意义单位而非形式单位。功能上，语篇作为使用中的语言现象，因其负载的社会功能而具有现实意义。它在人类言语交际过程当中产生，要完成一定的交际任务，行使某种功能，诸如传播信息、发布号令、鼓动宣传、娱乐心情等等[1][2]。

曾任密西根大学英语语言学院院长的Swales 教授在其撰写的《体裁分析：学术与科研英语》一书中，对体裁的定义及其与语篇的关系进行了阐释：体裁是一组目的性的交际事件，其交际目的可被特定语篇社群的专家所识别，由此构成了体裁的理论基础。这一理论基础塑造了语篇的主体构成，并影响和限制了该语篇的内容和文体的选择；因而，体裁是对口头的、书面的、文学的或非文学的不同语篇的分类[3]。Orlikowski 和Yates 对于体裁的定义则更被广泛接受：体裁以社会认知的交际目的和通用形式为特征，是对不同交际行动的分类[4]。

2.2　语篇的体裁与修辞结构

语篇语言学是从结构（即形式）和功能两个方面来研究语篇的，主要研究内容包括语篇结构、句际关系、会话结构和原则、语句的衔接和连贯等等，强调结合语境研究和解释语篇，关注语篇生成和理解的全部过程[2]。语篇研究可分为宏观的体裁形式研究和各体裁形式下修辞结构的微观研究：

在西方，宏观层面的体裁类型研究是在“genre”一词的统辖之下进行的，在我国又被称为语篇类型研究[2]。体裁分析的根本宗旨是研究语篇的交际目的和语言使用策略。语篇的体裁不同，交际功能不同，不仅导致其语言风格不同，而且导致其组句成篇的模式有异。具有特定交际目的的组织结构构成这种特定语篇的“体裁结构”。这种特定语篇的“体裁结构”既是人们运用语言办事的程式，也是帮助人们理解这种语篇的认知结构，这种规律性是形成语篇组织模式的基础。语篇组织模式既能体现作者的思维模式，又能体现语篇的宏观认知结构。体裁既然是构成语篇特性的基本要素之一，并在语篇结构层面对语篇的形成具有制约作用，那么语篇的组织模式必然也要受到体裁的制约。“体裁分析”能帮助我们解析语篇的组织模式，从而挖掘特定语篇所具有的特定的宏观认知结构[5]。

Orlikowski 和Yates 的研究指出：体裁形式是以社会所能认知的交际目的和通用形式为特征的交际行动的类型。电子体裁形式是指数字文档、网页或网站的体裁形式[4]。由于体裁在形式上可识别性和可区分性较高，在意义和功能上可理解性和认知程度较高，体裁理论已被用于改进网络搜索效率[6][7]和促进电子文档导航[8]的研究中。此外，体裁形式的结构规则研究[6][7][8][9][10][11][12][13][14][15]表明，用户可通过对信息　（体裁）设计中的体裁规则和这些体裁规则在信息空间的识别，从而改善信息空间内的导航和理解。

而微观层面关于不同类型语篇的组成与结构研究，则更多以Mann 和Thompson 的修辞结构理论（Rhetoric Structure）为支撑，从修辞结构的角度开展的。Mann 和Thompson 提出的修辞结构理论认为：一个篇章中的各个小句之间存在着各种各样的语义关系，其组合是有层次的；篇章的整体性和连接性都源于功能性，着眼描写那些使得篇章成为人类交际有效的和能理解的工具的功能和结构[7]；不同类型的篇章其关系的数目不一，但常见的关系有20余种。

在语篇体裁和修辞结构的宏观和微观结构中，由于修辞结构理论从语篇分析和关系构建的角度对体裁形式的研究提供基础，因而Swales 的体裁分析模型认为，修辞策略是体裁形式 “语轮”（move）和“语步”（step）单元的识别手段[3]。

2.3　人对语篇体裁的认知

对社群成员学习间形成的语篇交流过程而言，反复的交互会增加语篇规则的呈现和使用[16]。从人机交互的角度，我们可以构思对于一直以来通过社群学习来识别规则的用户，这些规则的形式可传递关于描述、辩论阶段等的位置的线索，从而形成自顶向下的解释性框架，可与来自可视化呈现的刺激进行交互，从而形成用户所处的信息空间的活动模型。

Trace 和Dillon 的研究指出，体裁作为代表性的交流结构存在，促进群体创造、分析和解释意义，因而体裁为交流内容提供一组规则或期望。体裁的价值可直接与交流的潜在认知过程联系起来，该过程受到记忆、信息消费速度限制，并通过双方的意义交流的共同期望平息，促使双方按照语义规则、内容和形式传递与解释新的形式。从社会角度而言，体裁可被视为人们经历、构建和执行社会实践的整体中的一部分，帮助用户在每天重复发生的情境下作出有意义的行动[16]。

虽然大部分关于体裁理论的研究都采用语篇的权威形式，如科学论文、新闻或短篇小说作为测试案例，但现在的普遍认识是体裁结构存在于所有交流网络中，而大部分专业的交流通常无需依靠外部联系，而是依赖于体裁结构来完成其共同的工作。即使有时并不成为体裁，新的专业人士的教育和社会化大部分包括其工作时与其他专业成员工作时学习识别、创造和使用接受的交流模式。

3　人与语篇体裁的交互研究

3.1　数字和网络文档信息单元划分与交互

体裁类型的核心概念——内容与形式互相反映，已包含在Dillon 关于“形状”[17]和“信息模型”的研究中[18]。Dillon 提出将形状作为导航的可选标识，“形状”的概念假设任何大小的信息空间同时具有空间的和语义的特征，即在识别位置和呈现时，用户直接识别和回应内容与含义[17]。Dillon 在论述“信息模型”作为其任务、信息模型、管理和可视化人类工效学等四因素框架的因素之一时，也有相似的论断。信息模型是指用户对外文本或信息空间的思想模型[18]。Vaughan 研究了结构体裁类型转换对于基于网页的报纸中思想结构表达的作用。研究发现，在完成阅读任务和信息查寻任务时，适应体裁设计的用户其表现优胜于违反体裁设计的用户。随着时间过去，违反体裁设计的用户的表现也逐渐改善[19]。Symonenko 将Vaughan 的研究从个人网页扩展到学术和公司网站，也得到类似的结论[20]。

目前在具体目标英语教学领域的科学论文撰写中，已有方法分析学术论文的导言、方法、结果、讨论（introduction，method，result，discussion，IMRD）组成的修辞结构[3][21][22][23]。然而，很少研究探索期刊文章信息使用中的文章组成部分的体裁转变。文档组成在文档使用中有其功能，尤其是Vaughan 和Dillon 在研究IMRD 组成中所提到的，这就为在构成中识别和利用单个功能单元带来潜在的研究空间。

Vaughan 和Dillon 的研究要求专业用户按照IMRD 其中一个组成对一组段落进行分类，其编码分别为“为什么、是什么、怎么样”。识别了五个功能，分别为：介绍（开始作者的研究，提出论点，论述以往研究的不足并提出新的研究，介绍背景，确立目前和未来的研究）、讨论（确立研究结论、承认不足、解释结果、提供对于原因的可能的解释、讨论研究提示和观察对象）、结论的两个功能（关于结果的展现和报告，对所进行的分析类型的报告），以及方法的一个功能（解释研究程序）等组成。然而，所识别的这些功能提供了构成的通用图像，是从用户对文章组成的定义出发而不是从文章本身提出的。IMRD 组成也涉及研究专业用户如何在结构化知识中采用语义线索来感知信息空间，而新用户必须依靠可视化呈现中的空间线索来达到同一目的[6][11][25]。Dillon 注意到，体裁属性的更合理的粒度可增加文档内导航的价值。有需要将研究焦点从帮助读者寻找相关的文章转变到帮助读者在文档内导航、阅读、理解和使用信息[9]。

Bishop 及其同事则将文章的不同部分划分为：文章题目、标题和副标题、表格文本、图像标题、论文主题的任何地方、文摘、参考文献、作者姓名、作者机构、外部链接等。他们将期刊论文的组成看成具有五个功能：发现相关文档、检索前评估文档相关性、阅读论文（例如：方向、提供概览、引导注意、辅助理解、引发进一步阅读）、创建文档记录、重新再组合和聚合成新的文档。他们提出单个组成很可能被读者从期刊论文中抽取并用于其写作中[26][27][28]。与此类似，Sandusky 和Tenopir 构建了一个带有表格和图像作为组成的原型。然而，如Bishop 所言，Sandusky 和Tenopir 的原型关注从检索结果中返回的文章条目中有逻辑的检索具体组成。这就引起关注是否耽搁组成可支持理解，支持理解的耽搁组成的最小信息单元是什么[29]。

Zhang，Dopak 和Freund 等的研究指出，大部分基于体裁类型的信息科学的研究都集中在文档层次，但有些研究则通过研究期刊文章内部的体裁组成，如介绍、方法、结果和讨论进行更细致的分析。因而可通过探索功能单元来寻找促进研究期刊文章信息使用的方法。该研究通过文献分析和验证测量检验了一组功能单元及其与学术期刊论文使用任务的联系。研究最终以分类体系的形式提出功能单元和用户信息使用任务之间的关系，以及特定信息使用任务与各组功能单元之间的关系。该分类体系被用于电子期刊阅读系统的设计以及提高信息使用的效率和有效性[30]。

在期刊功能单元分类体系的基础上，Zhang 通过实证方法检验期刊系统原型中的功能单元分类体系。该体系通过识别期刊文章组成（例如：介绍、方法、结果和讨论）中的语言功能单元和信息单元，及其与使用期刊文章的信息任务之间的关系。实验结果显示功能单元可用于在各种程度上支持导航、仔细阅读、理解和期刊文章信息的使用。结论提供证据表明，单独的功能单元改变信息使用任务的相关性，改变相关性到同一组成或另外的组成的其他的功能单元。该研究提示学者期刊论文信息能通过功能组织和呈现，来提高阅读过程和阅读结果的有效性[31]。

此外，学界强调将数字体裁看成是即时的和流动的，作为实践学习者的社群来形成他们新媒体下的沟通形式。Dillon 和Gushrowski 认为主页首先是数字化体裁[32]。有多个研究关注网络体裁的时效性和变化，这些研究从对美国政府网页的检验[33]发展到研究型资源、列表和学者个人网页等网络体裁类型按照学科领域知识和社会组织的架构的变化[33]。

相关研究强调应该识别和探索用户阅读文档时主动识别和探索文档线索的问题，希望按照这种方法，保持或提高对重要来源信息的导航和理解。与此对应，有一些研究对如何理解这些线索，以支持作者或文档创建者设计符合用户期望和需求的文档感兴趣。Dillon 和Schaap 认为，体裁分析主要关注认知和社会过程的相互作用，而框架理论可解释个人如何从不断重现的事件或交流过程中提取规则，并最终在面对相似情境下理解不完全的信息时采用这些规则。因此，文档中的体裁形式可视为促进对文本线索的解释和理解且引导探索的框架结构，使得用户可估计元素之间的位置和关系。作者通过实验探索这一过程，发现有学术论文经验的读者，在去掉段落线索后，可非常准确地估计从论文抽取的独立文本段落的位置，其准确性显著高于没有经验的用户[34]。Toms 等的研究、Rho和Gedeon 的研究以及Turner 的研究扩展了Dillon 和Schaap 的研究，这些学者研究了人们如何回应数字化呈现的信息以及如何设计可改进用户立即的和直觉的信息获取[22][27][35][36][37]。

3.2　基于篇章结构的信息空间导航

功能语言学中的体裁（文体）类型被证明可用于支持用户在信息空间导航的结果线索，Dillon 及其同事的系列研究主要从用户认知的角度围绕语篇的逻辑结构和语义结构对用户迷航问题和导航需求进行研究。

Vaughan 和Dillon 提出“形状”的概念，构建用户对于信息空间的思维表达从而探索网页信息资源的空间及语义线索及其对用户的影响。研究发现其中一个形态方案设计支持最终用户已有的知识结构，另一个设计否定对于结构的期望。反复接触某一空间可增加交互的表现[17]。

Dillon 提出将用户在信息社会生产和消费情境下的社会认知经历产生的语义知识自上而下的应用的新方法。作者在“形状”概念的基础上，假设任何大小的信息空间都有空间及语义特征，即除了识别位置和布局外，用户直接认识内容和含义并对其产生反应。作者设计实验，让用户描述他们与数字空间交互的记忆，或提取他们对信息空间形式和布局的理解。这些数据清晰的指向记忆中空间和语义构件的交互。例如，当要求描述曾交互的信息空间，用户会采用可传递关系、阐释和纯虚的空间链接术语，如位置和顺序。完全分离两种形式的表述是罕见的，对信息空间的用户而言是人工完成的。用户很容易从一种信息空间转移到另一种，因为这都是服务于其任务带来的需求的。实际上最好是在两者之外考虑信息空间的用户模型[6]。

Dillon 指出以往研究表明，内在和外在空间及语义表达形成信息空间形态模型。在用户开始接触新信息空间的阶段，该交互预测模型可帮助用户在空间中寻找可返回的关键点或路标[37][38]。随着这一模式在纸质和电子空间中出现[39]，大部分超媒体研究者都将这样的行为理解为研究界面外部空间属性，如链接、特征和浏览区等特征的研究，我们至少应该关注语义角色。语义距离在理解作为交互形式之一的信息检索相关性评估中也是关键要素[40]，然而这一形式不像信息空间的导航一样要进行链接选择[6]。

在空间和语义交互过程模型中，信息呈现被用户感知，然后对当前的内容和格式创建信息空间动态的工作模型，相关的空间属性（布局、图像位置、文本长度、视窗大小、导航图标等）与刚处理信息的内存激活和自上而下应用的信息体裁语义属性（期望形式、风格、顺序、含义等），从而为交互任务信息空间的创建持续更新和可修改的动态表达。因而，不同的用户可能应用不同的语义过程来创建和维持信息空间的工作模型，对于某种形式和具体空间的经验会承担这种过程，缺乏经验会导致更多依靠空间属性。错误的表现来源于用户模型中缺乏某种细节，分析错误的类型能提示用户对某种线索的依赖。如：新手往往瞄准文本标题的词语作为整个文档位置的提示是一种认知心理学家早已熟悉的匹配偏向。因此，形态可以被操作化为用户形成信息空间的工作模型的结构组成。尽管本研究中形态的概念在地理信息系统中最为显著，在基于文本或自然语言环境下没有这么明显或概念化。这样的属性在信息空间中是内隐的，但一部分界面设计问题是提供改进的外显的表达从而与人的处理趋势相兼容[6]。

3.3　网络体裁交互中的用户差异及影响

Vaughan 和Dillon 指出，专家不断探索信息生成和消费的社群所共同理解的知识，而新手只能从没有任何参考形式或结构的语言中进行逻辑推理[11]。Dillon 在Dillon and Schaap 实证研究[25]的基础上，提出形式或体裁的内在结构可以由这类语篇的专家形成而无需外在线索。这些用户通过信息空间而并非物理空间进行导航。对于这些用户而言，更像是从所呈现的信息和通用形式的匹配来抽取结构，而这一通用形式是经过长期的社会化和训练而内化形成的。因而，设计信息空间来描述形态形成过程对于训练学科领域的新手进行意义构建有相当的好处[6]。

Dillon 指出，对于新手而言，与新的信息空间的交互必然受到空间信息的引领。因而，界面应该传递外在的链接、布局和空间的高层组织以使迷航机会最小化。主流超媒体文献对策有有用的建议，但这不足以用于所有情况，只适用于少数或不频繁使用的空间。我们搜集的所有关于空间—语义问题的证据表明，空间线索与语义信息一起可作为用户总结信息空间的规则。人类认知系统一直将已有知识应用到新的信息中，即使是以前没有见过的信息形式，其体裁也是立即开始形成了。因此，我们需要研究在用户总结新空间的规则时，空间因素如何与语义因素交互？当然，语义和空间构建的交互似乎能更好地解释空间能力与超媒体环境下用户行为相关的混合展示[6]。

除了用户的知识基础的显著差别外，可能存在基于能力或偏好的深层心理差别来处理语义或空间线索，或按照权重的语义和空间线索。这一可能性不仅通过模型可以看出，而且教育学研究也明确指出，超媒体对于不同类型学习者的影响[41]。

4　数字和网络环境下的体裁分析与自动识别

4.1　数字和网络环境下的体裁分析

Freund 对数字体裁进行了详细介绍[42]，指出虽然文学体裁的概念早在古代已被用于文本分类，但体裁功能识别的方法在过去几十年才刚刚发展起来。该方法将体裁视为交际活动[43]，即：体裁是具有相似实质和形式，并可在重复情境下出现的典型的交际性行动[44]。体裁类型在综合形式、内容和/或目标等文档特征的基础上得以识别，其中，形式可以从媒介、结构和语言特征等方面提取[4]。有研究尤其关注数字体裁，将交互作为数字体裁形式特征的一个方面[45][46]。然而，体裁并非单纯是一组文档或作品的特征的反映，还是传统规范的表达[47]，是特定社群内的社会构建，因而他们是环境的载体，他们表达文档中“谁、是什么、在哪里、何时、为何和如何”等元素，使得这些信息在人们将其应用到真实世界情景时尤其有用[48]。

Askehave 和Nielsen 在Swales 三层级体裁模型的基础上，面向公司主页这一数字体裁构建了阅读和导航二维模型。作者将多媒体元素整合到体裁概念中，认为公司主页的交际目的能通过导航模式和阅读模式实现。阅读模式下主页的典型语轮包括：吸引注意、祝贺、识别发信者、提示内容结构、细节内容、建立可信性、建立联系、建立话语社群和促进外部组织[49]。

领域和体裁之间有清晰的联系，“不同学科或语篇社群发展特别的文档类型以适应他们特别的需求”[50]。在特定领域或社群的实践中普遍采用的体裁集合称为体裁生态[47]或体裁库[4]。体裁库可帮助相互理解，使得文档在社群成员之间得以理解[4]。可见体裁在这方面尤其有价值，在“文档的物理面貌”上提供可视化的线索，这些线索包含“区别性的、稳定的特征，可以告知用户关于某文档的特性”[13]。当一类特定体裁承载了关于特定信息对象的环境信息时，体裁库作为一个整体在特定领域可发挥信息搜寻和检索环境的功能。

近年来，有研究提出通过网络体裁自动识别支持目的性信息检索的方法[51][52][53][54]。Crowston 和Williams 对837个网页进行分析发现了48种不同的代表性体裁[8]。在另一个研究中，研究人员对184名使用网络搜寻所需信息的被试者进行访谈，以检验所检索的信息的体裁和搜寻目的之间是否存在关联。研究者首先要求被试者描述其问题，并对所需的有用信息产生期望。研究者从网络检索和搜集网页并由被试者对这些网页的特征、相关性和效用评价进行评估。研究人员对着1234个所检索的网页的体裁进行分类，从检索文档集合中识别出116种不同的体裁。在这个集合中，有158个网页的体裁没有被分类，且研究人员和被试者之间对于网页分类的一致性少于50%。该研究发现搜寻类型和体裁之间的正向相关关系，一些体裁集合趋于被选择为特定类型的搜索[53]。Rosso 关注如何建立一个易于识别的体裁集合以支持教育领域的网络检索。作者采用卡片分类和命名的方法，识别了包括18个常见体裁的类型体系和标签。在要求被试者按照类型体系对一组文档进行分类时，被试者间的一致性超过70%，这意味着创建网络体裁分类体系是可能的[52]。

一些实验系统曾提出或发展应用体裁相关理论的系统[55][56][57]，但大部分情况下这些系统都只是通过体裁过滤或对结果进行分类。因而这些系统假设搜寻者在搜索时是可以指认出他们偏好的体裁。考虑人类信息需求的非常状态，这一假设是无力的。信息检索领域正通过TREC 的High Accuracy Retrieval of Document（HARD）track 开始关注体裁和搜寻任务之间的关系，从而探索未来搜寻系统的路向[58]。

4.2　基于修辞结构的跨文档结构理论

计算语言学在修辞结构理论的基础上，着力探讨文本信息单元及其关系的自动识别，可为数字和网络文档的体裁结构的划分提供参考。相关研究涉及文档结构研究和跨文档结构研究，前者是后者的基础。

早在1986年，Trigg 和Mark 就提出TEXTNET 作为文档结构划分的系统与方法，旨在改进多学科论文的管理和存储，被认为是引导多文档模型的首批研究之一。该研究目标在于通过捕抓文本片段和信息层级（如领域和子领域）之间的语义关系从而揭示潜在结构[59]。该研究提出从文本片段和论题两个层面实现文档内容的细粒度组织。其中，文本片段表示文本的一部分，可以是句子、段落甚至文档；内容表格是指向多于一个片段的指示器，相当于一个子领域或论题。通过构建文本片段和主题两类不同类型的节点，从而从主题层面和内容层面对文本片段进行标引，并实现这两个层面关系的链接和语义网络构建，使得相邻文本片段的关系变得明显。在此方法的基础上，作者开发了应用界面，用户可通过点选节点之间的链接和文本片段的起始信息利用该语义网络，此外用户还可以按线性顺序对文本节点进行浏览[60]。

Trigg 和Weiser 从逻辑结构的角度提出文本片段的长度可以从一个句子到整个文档，而若干段落组成的片段通常较为合适，当片段太大阻碍用户从链接到片断中的部分内容时应该将该片段划分为若干更小的片段，而当片段太小则所有链接可直接在父节点完成，因而可合并片段。作者提出通过用户划分的方法实现，在已有片段的基础上让用户进一步进行划分。在主题层面上，通过片段集合的大小形成不同范围的论题，从而形成具有层级关系的论题层级[59]。

Trigg 和Weiser 从用户的角度考虑了链接走向的问题。作者描述了用户的三种可能的思想状态：按照思维走向进行，垂直偏离思维走向，和思维走向分叉。对于按照思维走向进行的阅读，可包括从某主题到相关主题下的归纳类文本片段，从例子和有启发的思想等文本片段到形式化，从理论到应用或简单的在主题间的跳转而实现；对于垂直偏离思维走向，并非所有用户所需但可以获得新领域的例子和解释，并获得更多细节。通常对于同一论文偏离的选择会很不相同。对于思维走向分叉，多重选择情况下向外链接的选择通常取决于读者的兴趣和专业水平。一些选择只留有一个节点的空间，让用户在相同主题的两个版本间选择。有时思维分叉更复杂和遥远，也许不再回到主路上。总之，用户按照顺序的、可能分叉的和可能偏离的方向与文本进行交互。然而，并不清楚用户如何区分这些思维形态。一个解决方法是采用固定的节点顺序，即路径。总体而言作者创建默认的路径以供新手使用[59]。

TEXTNET 系统的文本获取由文本精读、文本构成和修改、读者批评和链接及物理顺序阅读等部分组成。其中，文本精度部分可为读者的阅读顺序提供几种选择，包括：①首页开始按顺序阅读；②通过目录定位，从某章节开始阅读；③采用关键词索引跳转到文档某点；④一旦在文档某点，读者可以跳读，即通过阅读每章的头尾段落或每段的头尾句子；⑤采用索引跳到其他相关点；⑥采用目录前进到新主题；⑦根据读者当前兴趣、理解、耐性、挫折等水平采用上述形成的变化和组合。例如，一个转移到感兴趣项目的快捷的方式是通过目录跳转和在特定水平的文档间跳转[59]。

Radev 在修辞结构理论、Trigg 等[59][60]体裁的单文档语篇结构理论和其他多文档相关研究的基础上提出跨文档结构理论，该模型通过探索不同用户的偏好进行设计并应用于多文档摘要[61]。

McKeown 和Radev 于1995年和1998年的研究，根据Trigg 和Allan 提出的链接关系[59][60][62]，提出一组语义关系和基于这些关系的多文档摘要模型[63][64]，与Trigg 和Allan 两个的研究不同，McKeown 和Radev 于1995年和1998年的研究提出的关系建立在文本单元之间，因为这些单元不必是句子或段落等固定的片段。在他们的模型中，文本信息在预先定义好包含属性和值的结构的模板中被组织，对应特定主题的信息。例如，他们研究关于恐怖主义的文本，相关模板则以袭击地点、死亡人数量、犯罪者等信息进行填充。按照他们的建议，模板被自动填充，而模板间的语义关系则由人工建立。

化柏林以学术期刊论文为研究对象，通过相似性判定识别文章的新句子，对文章的新句子进行句子内部结构及主题语义分析，从而确定句子的主题及语义，然后通过句子之间的关联关系分析和文章的篇章结构分析确定句子的知识元隶属，并对知识的属性进行标记，如定义、概念属性、研究方法、实验数据、研究结果、研究结论等[65]。

Radev 在跨文档结构理论的基础上，提出一组24个关系以为多文档现象建模，这些关系可能应用到任何文本单元之中（词、短语、句子、段落或更大的文本部分）。在CST 中关系有两种不同的方向：对称的和非对称的。方向取决于关系的语义属性：当两文本片段收到关系的相同方向的影响时发生对称的方向（例如文本单元间的等价关系），当一个文本单元影响另一个时发生非对称方向（例如文本单元详细论述另一单元的内容）[61]。

Afantenos 等也探索了相同领域文档的不同文本单元之间的语义关系。Afantenos 提出基于模板的信息抽取方法，与McKeow 和Radev 及Radev 的研究不同，作者认为关系按照主题不同而应更具体。例如，足球匹配的类目，关系应该描述事件随时间的发展，也指出其相似性和差异性。为此，作者将关系分为两类：共时的与历时的。共时关系描述一个事件在特定时间段的多来源的信息。这些关系与CST 中提出的关系非常类似。与共时关系类似的是识别、等价、论述等。历时关系是指某时期内，某来源信息的时间的发展或进步。例如，对于某队比赛过程的讨论课描述为历时关系，如稳定性或差异性。一方面，稳定性描述观点的持久性或不同时期对事实的陈述（如足球队的表现在几分钟前和几分钟后相当）。另一方面，差异性描述不同时期某事实的某观点或陈述的变化（如某足球队的表现在某时间点好，然后变差）[66]。

Marsi 和Krahmer 构建丹麦语料库中句子对的语义关系分类体系。作者采用五种相互独立的关系：等同、概括、具体、重述和交叉[67]。Miyabe，Takamura 和Okumura 提出一个按照句子的相似性识别句子间等同和翻译关系的方法[68]。Zahri 和Fukumoto 提出多文档摘要方法，该方法包含摘要产生修辞关系的链接分析。作者采用SVM 的机器学习方法识别以下关系：识别、释义（相当于等同关系）、包容、重叠和阐释[69]。Kumar，Salim 和Raza 提出采用机器学习的方法自动检测CST 的关系，尤其是识别、重叠、包含和描述关系[70]。

5　结　语

通过上述回顾，我们可以看到，随着网络和数字环境下交互式查询与检索研究的发展，人与信息单元的交互逐渐成为研究的焦点。功能语言学领域的体裁理论作为面向社会认知和交流的理论基础，为学科领域用户对于信息单元语言功能和交流目标的认知提供了基础，从而为交互式检索研究和基于修辞结构的信息单元自动识别研究提供了共同基础。随着信息单元自动识别精确度的提高，基于信息单元的交互可为信息资源细粒度组织与聚合研究提供理论和方法基础，有望成为日后信息组织与检索领域的发展方向之一。

参考文献

[1]Halliday M A，Hasan R.Language，context and text: Aspects of language in a social-smiotic perspective [M].Victoria: Deakin University，1985.

[2]董育宁.新闻评论语篇的语言研究[D].复旦大学，2007.

[3]Swales J M.Genre analysis: English in academic and research settings [M].Cambridge，UK: Cambridge University Press，1990.

[4]Orlikowski W J，Yates J.Genre repertoire: The structuring of communicative practices in organizations [ J].Administrative Science Quarterlys，1994，39(4): 541-574.(https://www.daowen.com)

[5]王水莲.体裁、体裁分析与体裁教学法[J].外语教学，2001（4）：82-86.

[6]Dillon A.Spatial-Semantics: How users derive shape from information space [J].Journal of the American Society for Information Science，2000，51(6): 521-528.

[7]Mann W C，Thompson S.Discourse description: Diverse linguistic analysis of a fund-raising text [C].Amersterdam Philadelphia:John Benjamins Publishing Company，1992.

[8]Crowston K，Williams M.Reproduced and emergent genres of communication on the World Wide Web [C].In Proceedings of the 30th Hawwaii International Conference on System Sciences，2000.

[9]Dillon A.Why information has shape [J].Bulletin of the American Society for Information Science and Technology，2008，34(5): 17-19.

[10]Toms E G，Campbell D G.Genre as interface metaphor:Exploiting form and function in digital environments [C].InProceedings of the 32th Hawaii International Conference on System Sciences，1999.

[11]Vaughan M W，Dilion A.The role of genre in shaping our understanding of digital documents [C].In Proceedings of 61th Annual Meeting of the American Society for Information Science，1998: 559-566.

[12]Toms E G.Recognizing digital genre [J].Bulletin of the American Society for Information Science and Technology，2001，27(3): 20-22.

[13]Vaughan M W，Dilion A.Why structure and genre matter for users of digital information: A longitudinal experiment with readers of a web-based newspaper [C].International Journal of Human-computer Studies，2006(64): 502-526.

[14]Vaughan M W.Identifying regularities in users' conceptions of information spaces: Designing for structural genre conventions and mental representations of structure for web-based newspapers[D].Indiana University，1999.

[15]Keane MT，O'brien M，Smyth B.Are people biased in their use of search engines? [J]Communications of the ACM，2008，51(2): 49-52.

[16]Bazerman C.Speech acts，genres and activity systems: How texts organize activity and people [A].In C.Bazerman and P Prior(Eds.) .What writing does and how it dose it:An introduction to analyzing texts in honour of Peter Ingwersen.Copenhagen:Det Informationsvidenskabelige Akademi，2004: 309-339.

[17]Vaughan M W，Dillon A.Learning the shape of information: A longitudinal study of Web-news reading [C].ACM，2000:236-237.

[18]Dillon A.TIME-A multi-level framework for the Design and evaluation of digital libraries [J].International Journal of Digital Libraries，1999，2(2/3): 170-177.

[19]Vaughan M W.Identifying regularities in users' conceptions of information spaces: Designing for structural genre conventions and mental representations of structure forweb-based newspapers[D].Indiana University，1999.

[20]Symonenko S.Websites through genre lenses: Recognizing emergent regularities in websites content structure [D].Syracuse University，2007.

[21]Swales J M.Research genres: Explorations and applications[M].Cambridge，UK: Cambridge University Press，2004.

[22]Lewin B A，Fine J，Young L.Expository discourse: A genre based approach to social science research texts [M].London:Continuum，2001.

[23]Hartley J.From structured abstracts to structured articles: A modest proposal [ J ].Journal of Technical Writing ＆Communication，1999，29(3): 255-270.

[24]Vaughan M W，Dilion A.The role of genre in shaping our understanding of digital documents [C].In Proceedings of 61th Annual Meeting of the American Society for Information Science，1998: 559-566.

[25]Dillon A，Shaap D.Expertise and the perception of shape in information [J].Journal of the American Society for Information Science，1996，47(10): 786-788.

[26]温有奎，焦玉英.基于知识元的知识发现[M].西安：西安电子科技大学出版社，2011.

[27]Bohn R，Short J.How much information? 2009report on American Consumers [R/OL].2010.http: / /hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009.pdf [2013-11-4].

[28]Bishop AP.Neumann L J，Star S L，et al.Digital libraries:Situating use in changing information infrastructure [J].Journal of the American Society for Information Science，2000，51(4):394-413.

[29]Sandusky R J，Tenopir C.Finding and using journal-article components: Impacts of disaggregation on teaching and research practice [J].Journal of the American Society for Information Science and Technology，2008，59(6): 970-982.

[30]Zhang L，Kopak R，Freund L，et al.A taxonomy of functional units for information use of scholarly journal articles [J].Proceedings of the American Society for Information Science and Technology，2010，47(1): 1-10.

[31]Zhang L.Grasping the structure of journal articles: Utilizing the functions of information units [J].Journal of the American society for information science and technology，2012，63(3):469-480.

[32]Ryan T，Field R，Olfman L.The evolution of US state government home pages from 1997to 2002[J].International Journal of Human Computer Studies，2003，59(4): 403-430.

[33]Fry J，Talja S.The intellectual and social organization of academic fields and the shape of digital resources [J].Journal of Information Science，2007，33(2): 115-133.

[34]Dillon A，Shaap D.Expertise and the perception of shape in information [J].Journal of the American Society for Informaiton Science，1996，47(10): 786-788.

[35]Turner P.Towards an account of intuitiveness [J].Behavior Information Technology，2008，27(6): 475-482.

[36]Rho Y J，Gedeon T D.Academic articles on the web: reading patterns and formats [ J].International Journal of Human Computer Interaction，2000，12(2): 219-240.

[37]Lee E，Whalen T，Mcewen S，et al.Optimizingthe design of menu pages for information retrieval [J].Ergonomics，1984，27(10)，1051-1069.

[38]Norman K.The psychology of menu selection [M].Norwood，NJ: Ablex，1991.

[39]Mcknight C，Dillon A，Richardson J.A comparison of linear and hypertext formats in information retrieval [A].In R.McAleese＆ C.Green (Eds.)，HYPERTEXT: State of the art，Oxford:Intellect，1990: 10-19.

[40]Brooks T.People，words and perceptions，a phenomenological investigation of textuality [J].Journal of the American Society for Information Science，1995，46(2): 103-115.

[41]Dillon A，Gabbard R.Hypermedia as an educational technology:A review of the empirical literature on learner comprehension，control and style [J].Review of Educational Research，1998，68(3): 322-349.

[42]Freund L S.Exploiting task-document relations in support of information retrieval in the workplace [ D].University of Toronto，2008.

[43]Bazerman C，Little J，Chavkin T.The production of information for genre activity spaces [J].Written Communication，2003，20(4): 455-477.

[44]Yates J，Orlikowski W J.Genres of organizational communication: A structurational approach to studying communication and media [ J].Academy of Management Review，1992，17(2): 299-326.

[45]Askehave I，Nielsen A E.What are the characteristics of digital genres?-Genre theory from a multi-modal perspective [C].In Proceedings of the 38th Hawaii International Conference on System Sciences，IEEE Computer Society.2005(4).

[46]Shepherd M，Watters C.The functionality attribute of cybergenres[C].In Proceedings of the 32nd Hawaii International Conference on System Sciences ( HICSS '99)，Maui，Hawai: IEEE Computer Society，1999.

[47]Spinuzzi C.Tracing genres through organizations: A sociocultural approach to information design [M].Cambridge，MA: MITPress，2003.

[48]Yoshioka T，Herman G，Yates J，et al.Genre taxonomy: a knowledge repository of communicative actions [ C].ACM Transactions on Information Systems，2001，19(4): 431-456.

[49]Askehave I，Nielsen A E.What are the characteristics of digital genres?-Genre theory from a multi-modal perspective [C].In Proceedings of the 38th Hawaii International Conference on System Sciences，IEEE Computer Society.2005(4).

[50]HjØrland B.Domain analysis in information science: Eleven approaches [J].Journal of Documentation，2002，58(4):422-462.

[51]Karlgren J.Non-topical factors in information access [C].In P.DeBra ＆ J.J.Leggett (Eds.)，Proceedings of WebNet 99-World Conference on the WWW and Internet，Honolulu，Hawaii，USA: Charlottesville，VA: Association for the Advancement of Computing in Eduction (AACE)，1999(1):27-31.

[52]Rosso M.Using genre to improve web search [D].The University of North Carolina at Chapel Hill，2005.

[53]Roussinov D G，Crowston K，Nilan M，et al.Genre based navigation on the Web [C].Paper presented at the Hawai'i International Conference on Systems Sciences，Maui，Hawai'i，2001.

[54]Shepherd M，Watters C，Kennedy A.Cybergenre: Automatic identification of home pages on the Web [J].Journal of Web Engineering，2004，3(3-4)，236-251.

[55]Bretan I，Dewe J，Hallberg A，et al.Web-specific genre visualization [C].In H.A.Maurer ＆ R.G.Olson (Eds.)，Proceedings of WebNet 98- World Conference on the WWW and Internet ＆ Intranet，Orlando，Florida，USA，November 7-12，1998: AACE.

[56]Glover E J，Lawrence S，Gordon M D，et al.Web search: Your way [C].Communications of the ACM，2001，44(12): 97-102.

[57]Roussinov D G，Chen H.Information navigation on the web by clustering and summarizing query results [C].Information Processing ＆ Management，2001(37): 789-816.

[58]Belkin N J，Muresan G，Zhang X-M.Investigating the effect of the use of user's context on IR performance [C].Paper presented at the Workshop on Information Retrieval in Context(IRiX) at SIGIR 2004，Sheffield，England，2004.

[59]Trigg R，Weiser M.TEXTNET: A network-based approach to text handling [C].ACM Transactions on Information Systems(TOIS)，1986，4(1): 1-23.

[60]Trigg R H.A network-based approach to text handling for the online scientific community [D].University of Maryland at College Park，1983.

[61]Radev D R.A common theory of information fusion from multiple text sources step one: Cross-document structure [ C ].Proceedings of the 1st SIGdial workshop on Discourse and dialogue-Volume 10.Association for Computational Linguistics，2000: 74-83.

[62]Allan J.Automatic hypertext link typing [C].In Proceeding of the 7th Conference on Hypertext，1996: 42-52.

[63]Mckeown K，Radev D R.Generating summaries of multiple news articles [C].Proceedings of 18th Annual International ACMSIGIR Conference Onresearch and Development，1995: 74-82.

[64]Mckeown K，Radev D R.Generating natural language summaries from multiple on-line sources [J].Computational Linguistics-Special Issue on NLG，1998，24(3): 469-550.

[65]化柏林.针对中文学术文献的情报方法术语抽取[J].现代图书情报技术，2013（6）：68-75.

[66]Afantenos S D，Doura I，Kapellou E，et al.Exploiting crossdocument relations for multi-document evolving summarization[C].In Proceedings of the 3rd Hellenic Conference on Artificial Intelligence，2004: 410-419.

[67]Marsi E，Krahmer E.Classification of semantic relations by humans and machines [C].In Proceedings of ACL Workshop on Empirical Modeling of semantic equivalence and Entailment，2005: 1-6.

[68]Miyabe Y，Takamura H，Okumura M.Identifying a crossdocument relation between sentences [C].In Proceedings of 3rd IJCNLP，2008: 141-148.

[69]Zahri N A H B，Fukumoto F.Multi-document summarization using link analysis based on rhetorical relations between sentences [A].Computational Linguistics and Intelligent Text Processing.Springer Berlin Heidelberg，2011: 328-338.

[70]Kumar Y J，Salim N，Raza B.Cross-document structural relationship identification using supervised machine learning[J].Applied Soft Computing.2012，12(10): 3124-3131.

【作者简介】

曹树金，管理学博士，中山大学资讯管理学院教授、博士生导师，教育部新世纪优秀人才支持计划入选者。兼任国家社会科学基金学科规划评审专家，全国科技名词审定委员会图书馆、情报与文献学名词审定委员会专家，教育部高等学校保密管理专业教学指导分委会委员，中国索引协会副理事长，中国社会科学情报学会副理事长，中国图书馆学会理事及信息组织专业委员会副主任，中国科技情报学会理事，广东省图书馆学会副理事长及学术委员会主任，广东社会科学情报学会副会长，广东科技情报学会常务理事及情报教育专业委员会主任，广东省公共文化服务体系建设专家组专家，《中国图书馆分类法》编委等。研究方向为：信息组织与信息检索、用户信息行为、网络情报学、电子商务与电子政务的信息管理、企业信息化、图书馆战略管理、保密学理论等，发表论文共100余篇。

马翠嫦，图书馆学博士，中山大学图书馆副研究馆员。研究方向为网络信息组织、用户行为等，发表论文共10余篇。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

人的认知与交互：信息单元研究的新进展

聚合单元抽取研究：面向决策的网络舆情信息

提案人与家庭成员认知研究

使用经验对产品认知和用户交互的影响

信息论与信道交互信息量

大数据环境下信息分析研究的最新进展

信息论：扩展信道的交互信息量

提高学生英语听说能力的元认知策略与多模态交互

交互行为研究与产品概念设计的基础内涵

相关推荐