理论教育 聚合单元间关系分析成果

聚合单元间关系分析成果

时间:2023-10-29 理论教育 版权反馈
【摘要】:实体间关系是构建网络舆情知识库、实现信息抽取和动态分析与聚合的前提。机构关系中敌对关系出现的频率是最高的,紧随其后的是合作关系,流向关系排在第三,而出现频率最少的是总部分部关系。

聚合单元间关系分析成果

本书中,聚合单元间关系主要指实体间关系,如人物、时间、地点等实体是和内容主题并存的另一大类关系载体,在基于非主题因素的关系揭示与发现方面发挥着不可忽视的作用[22]。但是当前基于关系实体的信息聚合研究主要分布在基于关联数据的馆藏信息资源聚合[23]、面向馆藏资源实体关系的聚合[24]、面向事物实体关系的聚合[25]等方面,而由于网络舆情信息中包含的实体表现形式复杂、实体关系标识词位置多变、汉语表达灵活且形式多样等原因,面向社会管理领域的网络舆情信息实体关系的聚合研究仍处于空白状态。本书认为,在非结构化的网络舆情文本信息中,分布着大量命名实体(如人物、机构、行政区划、时间等)以及实体间的关系信息。准确的实体关系分析能够让我们迅速了解信息所指对象之间的关系,可以更深入地分析网络舆情中的网民观点,从而实现基于实体关系的网络舆情信息聚合。实体间关系是构建网络舆情知识库、实现信息抽取和动态分析与聚合的前提。

中文语境下的网络舆情信息中,实体名称和关系标识的表达都呈现形式多变且复杂的特点,它们出现在语句中的位置也灵活多变。对虚拟社区中公众事件和话题的研究还处在起始阶段,已有的词表并不描述议题中涉及的人、机构以及它们之间的互动关系。张鹏翼等人在构建公众话题知识库时,将人与人之间的实体关系划分为动态关系(含对立、一致和合作三种子关系)以及相对稳定的社会网络关系(包括朋友、同学、同事、家人、上司、下属六种子关系),人与机构之间的关系分为动态关系(含对立、一致和合作三种子关系)以及相对更稳定的工作单位关系,机构与机构之间的关系分为动态关系(含对立、一致和合作三种子关系)以及相对稳定的关系(包括上级、下级、子公司、母公司四种子关系)[26]。这是在社会管理领域中文网络舆情知识库中首次作出的实体关系概括分析,然而关系类型概括较为粗糙,也没有提取出相应的关系标识。本书在其基础上,对人物、机构两种类型的实体之间的关系类型及其关系标识进行全面和深入的探索。

表6-9 人物关系分析表

表6-10 人物机构分析表

续表

表6-11 机构关系分析表

由表6-9、表6-10、表6-11可知,人物关系中评论关系出现的频率是最高,其次是家人关系,两者的比例与其他类型的关系相差较大,出现频率最少的是医患关系和赠予关系。人物实体关系中评论关系出现的频率是最高的,排第二的是询问关系,两者的比例加起来高达68%,出现频率最少的是犯罪关系、委托关系和医患关系。机构关系中敌对关系出现的频率是最高的,紧随其后的是合作关系,流向关系排在第三,而出现频率最少的是总部分部关系。

6.3.4.1 人物关系定义及其特征词

1)家人关系,指亲人之间的关系,即有血亲关系的人,既包括直系关系,又包括旁系关系,可分为夫妻关系、兄弟姐妹关系、长辈晚辈关系三个关系子类。

①夫妻关系。特征词有:老公、老婆、丈夫、妻子、结婚、新婚、迎娶、老伴、配偶、太太、新娘等。“先生”“夫人”“媳妇”等词作为关系判定特征词时,因其具有多义,需要根据上下文语境判断是否指示夫妻关系。比如:

苏先生的老婆张女士非常漂亮。

苏先生和张女士是在2015年结婚的。

张女士是苏先生的媳妇。

上述的三个例子实体关系都是(苏先生,张女士,夫妻关系)。

②兄弟姐妹关系。特征词有:哥哥、姐姐、弟弟、妹妹、堂哥、堂姐、表姐、表哥、表弟、兄妹、兄长、大哥、大姐、兄弟、嫂子、姐夫、弟媳、妹夫等。比如:

张嘉骥的妹妹是张倩玺。

张嘉骥和张倩玺是兄妹。

上述的两个例子实体关系都是(张嘉骥,张倩玺,兄弟姐妹关系)。

③长辈晚辈关系。特征词有:爸爸、妈妈、父亲、母亲、舅舅、舅妈、伯伯、叔叔、姑姑、姑丈、伯母、婶婶、阿姨、姨妈、奶奶、爷爷、外公、外婆、继母、继子、儿子、女儿、婆婆、家公、家婆、公公、长子、长女、次子、次女等。比如:

等等是邓超的儿子。

静静的舅舅林先生表示非常失望。

刘女士是贝贝的继母。

上述三个例子的实体关系分别表示为:(邓超,等等,长辈晚辈关系),(林先生,静静,长辈晚辈关系),(刘女士,贝贝,长辈晚辈关系)。

2)朋友关系,指有人际交往的实体,彼此之间有交情的人;在网络舆情事件中,朋友关系可分为好友关系和情侣关系两个关系子类。

①好友关系。特征词有:朋友、好友、闺蜜、密友、知己、老相识、挚友、友人、亲朋、老友、忘年之交、损友、结识、私交、友谊、死党等。比如:

苏先生是在毕业晚会上与王先生结识的。

苏先生与王先生是忘年之交。

苏先生是王先生的损友之一。

上述三个例子的实体关系都是(苏先生,王先生,好友关系)。

②情侣关系。特征词有:男朋友、女朋友、男友、女友、情侣、情人、男女朋友、初恋、旧爱、前任、新欢、热恋、情妇等。比如:

苏先生是张女士的男朋友。

苏先生和张女士是一对情侣。

苏先生的初恋是张女士。

上述三个例子的实体关系都是(苏先生,张女士,情侣关系)。

3)工作关系,指因为工作与他人接触而形成的一种人际关系。工作关系包括同事关系、上司下属关系、内外事活动关系、雇佣关系共四个子类。

①同事关系的特征词相对比较少,有时候并未出现特征词,需要人工判断是否属于这种关系,不过这种情况相对比较少出现,一般都带有“同事”这个特征词。比如:

苏先生的同事吴先生很好客。

和苏先生同个部门的吴先生很好客。

苏先生部门的那个吴先生很好客。

上述三个例子的实体关系都是(苏先生,吴先生,同事关系),第三个例句就是前面所说的需要自己判断的类型,里面并没有出现表示同事关系的特征词,但是不难看出“苏先生”和“吴先生”是“同事关系”。

②上司下属关系的特征词有:老板、领导、主管、助手、上司、下属、秘书、助理等。比如:

刘先生是苏先生的上司。

苏先生的主管是刘先生。

苏先生是刘先生的得力助手。

上述三个例子的实体关系都是(刘先生,苏先生,上司下属关系)。

③内外事活动关系指的是实体因为内事、外事、侨务、台务等工作而与对象建立起的关系,特征词有:接见、会见、会晤等。比如:

李克强在苏州会见罗伊瓦斯。

例句中的人物实体“李克强”和“罗伊瓦斯”在句子中表示两者关系的特征词为“会见”,所以该句的实体关系可表示为(李克强,罗伊瓦斯,内外事关系)。

④雇佣关系指某一人物实体通过支付薪水来交换另一人物实体为其工作时所产生的关系。雇佣关系是动态关系,它的特征词有:保姆、雇请、雇佣、雇用等。比如:

陈阿姨是林先生的保姆。

林先生雇请陈阿姨帮忙打扫卫生。

上述两个例子的实体关系都是(林先生,陈阿姨,雇佣关系)。

4)校友关系,指在同一个学校有过学习经历的人之间的关系,既包括同班同学关系、同级同学关系、同专业同学关系,也包括不同年级、不同专业、不同学院的校友关系。校友关系属于相对稳定的关系。

校友关系的特征词有:同学、同桌、班长、课代表、同班、同学校、同专业、同学院、校友等。比如:

陈晓明是黄志龙的同学。

陈晓明是黄志龙的班长。

陈晓明和黄志龙是同学校的。

上述三个例子的实体关系都是(陈晓明,黄志龙,校友关系)。

5)师生关系,指老师和学生在教学过程中形成的关系。师生关系是相对稳定的关系。师生关系的特征词有:老师、班主任、学生、导师等。比如:

李老师是小明的语文老师。

小明是李老师的学生。

上述三个例子的实体关系都是(李老师,小明,师生关系)。

6)邻居关系,指某人与住在隔壁或者附近的另一个人的关系。邻居关系属于相对稳定的关系。邻居关系的特征词有:隔壁家、邻居、对门、邻里、街坊等。比如:

苏先生隔壁家的老爷爷非常孤独。

苏先生的对门住着一个非常孤独的老爷爷。

上述两个例子的实体关系都是(苏先生,老爷爷,邻居关系)。

7)师徒关系,指师父和徒弟之间的关系,是相对稳定的关系。师徒关系的特征词有:师父、徒弟、弟子、门下、爱徒、学徒、恩师、高徒、拜师等。比如:

释小龙的师父是释永信。

释小龙是释永信的弟子。

上述两个例子的实体关系都是(释小龙,释永信,师徒关系)。

8)医患关系,指医务人员和患者在治疗期间形成的一种医治关系,它属于相对稳定的关系。医患关系的特征词有:医生、大夫、主治医师、病人、护士、患者、病患、专家等。比如:

王先生是刘奶奶的主治医师。

刘奶奶是王先生的病人。

上述两个例子的实体关系都是(王先生,刘奶奶,医患关系)。

9)采访关系,指记者为了获取新闻信息而进行调查、访问、录音等活动,是一种搜集信息的方式。采访关系就是记者与采访的另一人物实体之间的关系。采访关系通常都是通过发生的某个事件才与记者之间建立起的关系,所以属于动态关系。采访关系的特征词有:透露、告诉、介绍、采访、走访、接受……采访、对……表示、向……提供、对……称、回应……采访、向……讲述等。比如:

苏先生告诉记者说现在很幸福。

苏先生接受记者采访说现在很幸福。

苏先生回应记者采访称现在很幸福。

上述三个例子的实体关系都是(苏先生,记者,采访关系)。

10)证据关系,指某一人物实体能够为另一人物实体所发生的事情进行证明时所产生的关系。证据关系属于动态关系。证据关系的特征词有:目击者、目击证人、知情人、举报、证人、证实、证明、爆料、看到、目睹等。比如:

老王证实了李先生正在倒车

知情人小美说,刘先生确实不在公司。

李明目睹了韩梅梅作弊的全过程。

上述三个例子的实体关系分别表示为(老王,李先生,证据关系),(小美,刘先生,证据关系),(李明,韩梅梅,证据关系)。

11)犯罪关系,指当某一人物实体对另一人物实体做出了某些违法的行为时,两者之间所产生的关系就是犯罪关系。犯罪关系是由违法事件而产生的,所以它属于动态关系。犯罪关系的特征词有:绑架、杀人、抢劫、投毒、诈骗、骗取、盗走等。比如:

黄某绑架了刘女士。

刘女士在上班的路上被黄某抢劫了。

黄某盗走了刘女士苹果6S和现金数百元。

上述三个例子的实体关系都是(黄某,刘女士,犯罪关系)。

12)合作关系,指两个人物实体为实现一个共同的目标或达到共同的利益而一起努力所产生的关系,它是因为某个共同的利益或目标才产生的合作行为,目标实现后两者的关系可能就会产生变化,所以合作关系属于动态关系。合作关系的特征词有:合作、合伙人、联手、合伙、伙伴、舞伴、搭档、对唱等。比如:

苏先生和徐先生合伙开了一间公司。

张女士是苏先生毕业舞会的舞伴。

跨年晚会上,杨钰莹和张信哲情歌对唱。

上述三个例子的实体关系分别表示为:(苏先生,徐先生,合作关系),(张女士,苏先生,合作关系),(杨钰莹,张信哲,合作关系)。

13)评论关系,指某一人物实体对另一个人物实体进行议论或批评时所产生的关系,它属于动态关系。评论关系的特征词有:质疑、评论、评价、议论、批评等,不过有些句子可能并未出现有关的特征词,但也能根据句子的语义判断出是表示评论关系的。网民ID与其评论的人物对象之间的关系也是评论关系,其中网民ID以“@+ID”形式表示,直接在抓取数据时提取,当网民评论中出现人物名称时,则默认建立该网民与其评论人物对象之间存在评论关系。比如:

付先生对杨先生的做法提出了质疑。

付先生认为杨先生是在炒作。

对于杨先生的做法,付先生说他明显在炒作。

上述三个例子的实体关系都是(付先生,杨先生,评论关系),例句4并没有出现有关的特征词,但是经过分析,我们也可以判断出“付先生”和“杨先生”之间存在“评论关系”。

14)委托关系,指某一人物实体将事情托付给另一人物实体时所产生的关系。委托关系是因为存在着某件事而产生的,所以属于动态关系。委托关系的特征词有:律师、代理、委托、交托、托付、付托等。比如:

马先生是吴先生的律师。

李先生将公司托付给了张女士。

上述两个例子的实体关系分别表示为(马先生,吴先生,委托关系),(李先生,张女士,委托关系)。

15)贿赂关系,指某一人物实体为了实现某种不正当的行为,给另一个人物实体提供某种利益从而实现目的时所产生的关系。贿赂关系是由于某个目的而产生的,所以属于动态关系。贿赂关系的特征词有收受、贿赂等,有些句子也可能没有出现明显的特征词,不过可能会出现有关某种利益的词语,需要通过人工判断是否存在贿赂关系。比如:

王局长收受来自刘总所送的100多万元人民币

刘总为了自己的项目能得到王局长的关照,送给王局长100万元人民币。

上述两个例子的实体关系都是(刘总,王局长,贿赂关系),例句2中并没有出现表示两者关系的特征词,但从“送给”“100万元人民币”两个语句可以判断出实体“刘总”和“王局长”之间存在着“贿赂关系”。

16)纠纷关系,指人物实体之间因某件事争执不下所产生的关系,它是因为某件事而产生的,所以属于动态关系。纠纷关系的特征词有:争执、吵架、被告、纠缠等。比如:

小敏和晓飞发生了争执。

小敏和晓飞因为这件事已经纠缠了几天了。

上述两个例子的实体关系都是(小敏,晓飞,纠纷关系)。

17)竞争关系,指某一人物实体为了自己的利益与另一人物实体进行斗争而产生的关系。竞争关系是因为某件事才产生竞争行为的,如果这个事件结束,可能两个实体的关系就不是竞争关系了,所以竞争关系属于动态关系。竞争关系的特征词有:对手、抗衡、挑战、不敌、对阵、力克、交锋、大战等。比如:

这场比赛科比的对手是艾弗森。

这场比赛是艾弗森正式挑战科比。

这场比赛艾弗森不敌科比。

上述的三个例子的实体关系都是(科比,艾弗森,竞争关系)。

18)买卖关系,指人物实体之间通过货币或实物互相换取自己所需的物品时所产生的关系,它是由于换取这个事件所产生的关系,所以属于动态关系。买卖关系的特征词有:买来、卖出、交易、买进、卖给、售给、购进等。比如:

苏先生从李先生那买来5个苹果。(www.daowen.com)

李先生卖给苏先生5个苹果。

上述两个例子的实体关系都是(苏先生,李先生,买卖关系)。

19)赠予关系,指某一人物实体将自己的东西无偿的给予另一个人物实体,而另一人物实体也表示接受,两者之间的关系就是赠予关系。赠予关系属于动态关系,它的特征词有:捐赠、送给、赠送、捐赠、赠予等。比如:

李敏向小花捐赠了近千册的精美图书。

苏先生送给张女士一个最新款的包包。

上述两个例子的实体关系分别表示为(李敏,小花,赠予关系),(苏先生,张女士,赠予关系)。

6.3.4.2 人物机构关系定义及其特征词

1)雇佣关系,指一个机构实体通过支付薪水来换取人物实体为其工作时所产生的关系。雇佣关系可分为工作单位关系和首脑关系两个关系子类。

①工作单位关系。一般的判别特征有:机构实体+头衔+人物实体、人物实体+机构实体+头衔、机构实体+人物实体,头衔这里主要是指职位称号,比如董事长、总经理、员工、院长等。针对判别特征,我们可看下面的例子:

金辰有限公司董事长苏先生。

苏先生是金辰有限公司的董事长。

金辰有限公司的苏先生。

上述三个例子的实体关系都是(金辰有限公司,苏先生,工作单位关系)。

②首脑关系,指国家与国家首脑之间的关系,它的特征词有:主席、首相、总统、总理等。比如:

英国首相卡梅伦表示很期待。

美国总统奥巴马近日参加了某真人秀

上述三个例子的实体关系分别表示为:(中国,习近平,首脑关系),(英国,卡梅伦,首脑关系),(美国,奥巴马,首脑关系)。

2)成员关系,指成员与该组织或团体之间的关系,成员就是人物实体,而组织或团体就是机构实体。成员关系的特征词有:会员、志愿者、成员、一员、学生等。比如:

苏先生是红十字会的会员。

权志龙的Bigbang的成员。

易烊千玺是tfboys的一员。

上述两个例子的实体关系分别表示为:(红十字会,苏先生,会员关系),(Bigbang,权志龙,会员关系),(tfboys,易烊千玺,会员关系)。

3)医患关系,指医院机构与患者之间形成的一种治疗关系,机构实体一般是医院名。医患关系的特征词有:就诊、治疗、看病、挂号、医治等。比如:

高先生昨天晚上到西京医院就诊。

高先生昨天晚上去西京医院看病了。

上述两个例子的实体关系都是(西京医院,高先生,医患关系)。

4)采访关系,指媒体机构对某个人物实体进行采访时,两者之间的关系;或者当人物实体是记者时,是对某个机构实体进行采访所产生的关系。采访关系特征词有:回应、采访、从……获悉、回复……称、从……了解到、接受……采访等。比如:

北辰公司回复记者称传言都是假的。

记者从中铁建获悉暂时没有新的情况。

张智霖接受了娱乐报的采访。

上述三个例子的实体关系分别表示为:(北辰公司,记者,采访关系),(中铁建,记者,采访关系),(娱乐报,张智霖,采访关系)。

5)证据关系,指人物实体能够为机构实体所发生的事情进行证明时所产生的关系。证据关系的特征词有:爆料、证明、证实、举报等。比如:

据王先生爆料,滴滴北京总部遭出租车司机围堵。

杨女士举报了泛海国际公司偷税的情况。

上述两个例子的实体关系分别表示为:(滴滴,王先生,证据关系),(泛海国际公司,杨女士,证据关系)。

6)评论关系,指某一实体对另一个实体进行评价时所产生的关系,它属于动态关系。评论关系的特征词有:质疑、评论、评价、议论、批评、表示、认为、觉得等。与人物关系中的评论关系类似,当网民ID的评论中出现了某个机构的名称时,也认为两者之间建立起了评论关系,人物名称以“@+网民ID”表示,可以直接根据抓取字段识别,机构名称则从评论文本中抽取。如果评论者是一个机构,则提取为“@+机构ID”表示,可以直接根据抓取字段识别,人物名称则从评论文本中抽取。比如:

新华社对桑兰的言论提出质疑。

蔡先生评价优步说十分方便实用。

对于星巴克的说法,黄先生表示非常不赞同。

上述四个例子的实体关系分别表示为:(新华社,桑兰,评论关系),(优步,蔡先生,评论关系),(星巴克,黄先生,评论关系)。

7)询问关系,指由某人发出对某个机构实体的询问,希望从该机构得到所需信息,属于动态关系。特征词有:请问,究竟,告知等。同评论关系相似,如果网民ID发出询问,则人物名称以“@+网民ID”表示,可以直接根据抓取字段识别。被询问机构的名称则从评论文本中抽取。如果评论者是一个机构,则提取为“@+机构ID”表示,可以直接根据抓取字段识别,被询问人物的名称则从评论文本中抽取。

8)请求关系,指由某人发出对某个机构实体的请求,希望该机构能发布相关信息。属于动态关系。特征词有:希望+发布,希望+查清等。同评论关系相似,如果网民ID发出请求,则人物名称以“@+网民ID”表示,可以直接根据抓取字段识别。被请求机构的名称则从评论文本中抽取。如果评论者是一个机构,则提取为“@+机构ID”表示,可以直接根据抓取字段识别,被请求人物的名称则从评论文本中抽取。

9)纠纷关系,指两个实体之间因为某个事件争执不下所产生的关系。纠纷关系的特征词有:争执、纠缠、投诉等,有时候句子中也可能不会出现明显的特征词,需要根据语义进行分析判断是否存在纠纷关系。比如:

王先生与旋风电子公司发生了一点小争执。

王先生投诉了旋风电子公司。

王先生将旋风电子公司告上了法庭。

上述三个例子的实体关系都是(旋风电子公司,王先生,纠纷关系),例句3中并没有出现明显的特征词可以表明实体“王先生”和“旋风电子公司”之间的关系,但从“告上了法庭”中我们可知道两个实体存在着“纠纷关系”。

10)犯罪关系,指当某一实体对另一实体做出了某些违法的行为时,两者之间所产生的关系就是犯罪关系。犯罪关系的特征词有:诈骗、骗取、盗走、窃取等。比如:

梁某骗取了韩信传媒公司现金5万多元。

王某盗走了天灵珠宝公司的大量金银首饰和部分现金。

飞车驾校骗取了陈先生上万元的报名费。

上述三个例子的实体关系分别表示为:(韩信传媒公司,梁某,犯罪关系),(天灵珠宝公司,王某,犯罪关系),(飞车驾校,陈先生,犯罪关系)。

11)委托关系,指某一实体将某件事情托付给另一个实体时产生的关系。委托关系的特征词有:委托、托付、代理、交付等。比如:

李律师代理了王朝公司的案件。

王朝公司委托李律师帮其打官司。

上述两个例子的实体关系都是(王朝公司,李律师,委托关系)。

12)内外事活动关系,因为外交活动而建立起来的人物实体与机构实体之间的关系,一般情况下,内外事活动关系的人物与机构之间常用“抵达、到达、前往”等动词连接。比如:

李克强昨天访问了英国。

奥巴马昨天抵达中国。

上述两个例子的实体关系分别表示为:(英国,李克强,内外事活动关系),(中国,奥巴马,内外事活动关系)。例子中出现的特征词分别为范文、抵达,从语义中可判断出实体之间的关系为内外事活动关系。

6.3.4.3 机构关系定义及其特征词

1)总部分部关系,指某个机构实体是另一个机构实体的分公司或子公司时,两者之间所产生的关系。总部分部关系的特征词有:总公司、子公司、总部、分部、分公司等。比如:

金城公司是黄城有限公司旗下子公司。

黄城有限公司是金城公司的总公司。

上述两个例子的实体关系都是(金城公司,黄城有限公司,总部分部关系)。

2)敌对关系,指两个机构实体因为某种利益冲突不能相容,相互对抗时产生的关系。敌对关系的特征词有:交锋、入侵、打击、交恶、开战、博弈等,也有些句子中并没有包含这些特征词,需要通过语义判断是都存在敌对关系。比如:

俄罗斯与土耳其持续交锋。

俄罗斯和土耳其交恶。

俄罗斯空袭炸毁土耳其救援军队。

上述三个例子的实体关系都是(俄罗斯,土耳其,敌对关系)。例句3中虽然没有出现明显的特征词,但是从“空袭”“炸毁”两个词语可看出“俄罗斯”和“土耳其”之间的关系是“敌对关系”。

3)合作关系,指两个机构实体为了某个特定的目标或效益时,两者之间所产生的关系。合作关系的特征词有:合作、联手、合流、共同、联盟、盟友等,也有些句子中并没有包含这些特征词,需要通过语义判断是都存在敌对关系。比如:

金城公司和苏佳国际达成全面战略合作。

联想谷歌联手推出新的智能设备。

美国和土耳其是盟友。

印尼与韩国签署协议共同研发新项目。

上述四个例子的实体关系分别表示为:(金城公司,苏佳国际,合作关系),(联想,谷歌,合作关系),(美国,土耳其,合作关系),(印尼,韩国,合作关系)。例句4中虽然没有出现明显的特征词,但是从“签署协议”和“共同”两个词语可以看出,实体“印尼”和“韩国”两者之间是“合作关系”。

4)竞争关系,指某一机构实体为了自己的利益与另一机构实体进行斗争而产生的关系。竞争关系的特征词有:挑衅、对手、抗衡、挑战、决斗、迎战、不敌、对阵等。比如:

朝鲜队首战的对手是美国队

朝鲜队迎战美国队。

朝鲜队对阵美国队。

上述三个例子的实体关系都是(朝鲜队,美国队,竞争关系)。

5)委托关系,指某一机构实体将事情托付给另一机构实体时所产生的关系。委托关系是动态关系,它的特征词有:委托,托付、交付等。比如:

洪都公司委托世纪综合事务所管理法律合同。

天灵珠宝公司托付信阳会计公司管理财务

上述两个例子的实体关系分别表示为:(洪都公司,世纪综合事务所,委托关系),(天灵珠宝公司,信阳会计公司,委托关系)。

6)契约关系,指两个机构实体签订了在法律上具有约束力的协议后,两者之间的关系。契约关系的特征词有:合同、合约、契约、协议、签订等,大部分时候,句子中并没有出现明显的特征词,需要通过语义分析,甚至靠平时的常识来分析,所以契约关系在机构关系中算是比较难判断的一种。比如:

通灵珠宝昨天与车子公司签订了协议。

恒大淘宝足球队成功夺冠。

上述两个例子的实体关系分别表示为:(通灵珠宝,车子公司,契约关系),(恒大,淘宝,契约关系)。例句2中并没有出现明显的特征词,而且根据语义,也分辨不出实体“恒大”和“淘宝”之间的关系,但我们都知道,两者是有签订协议的,所以两者的关系是“契约关系”。

7)流向关系,指某些事物或信息在机构实体之间的流动。流向关系的特征词有:流向、去了哪里、卖到哪里、流入等。比如:

山东该批次疫苗主要流入广东地区。

据了解,洗白后的猪肉主要从佛山销往广州番禺区。

上述两个例子的实体关系分别表示为(山东,广东,流向关系),(佛山,广州,流向关系)。例句中都出现了“流入”“销往”等表示流向关系的特征词,所以将其归为“共现关系”。需要注意的是,流向关系是具有方向性的。

【注释】

[1]Belkin N J,Croft W B.Information filtering and information retrieval:Two sides of the same coin?[J].Communications of the Acm,1992,35(12):29-38.

[2]Kim W,Seo J.Classifying Schematic and data heterogeneity in multidatabase systems[J].Computer,1991,24(24):12-18.

[3]Goh C H.Representing and Reasoning about Semantic Conflicts in Heterogeneous Information Systems[M].Massachusetts Institute of Technology,1997:54-63.

[4]Gruninger M U M.Ontologies:Principles,methods and applications[J].Knowledge Engineering Review,1996,11(2):93-136.

[5]王绍光.中国公共政策议程设置的模式[J].中国社会科学,2006(5):42-56.

[6]Stuckenschmidt H,Van Harmelen F.Ontology-based metadata generation from semistructured information[C].International Conference on Knowledge Capture.ACM,2001:163-170.

[7]Arens Y,Knoblock C A,Shen W M.Query Reformulation for Dynamic Information Integration[M]//Intelligent Integration of Information.Springer US,1996:11-42.

[8]Chawathe S S,Garcia-Molina H,Widom J.Flexible Constraint Management for Autonomous Distributed Databases[C].IEEE Data Engineering Bulletin,1970:23-27.

[9]Wache H,Visser U,Stuckenschmidt H,et al.Ontology-based integration of information—A survey of existing approaches[J].Ijcai'2001 Workshop on Ontologies&Information Sharing,2002:108-117.

[10]张鹏翼,周妍,袁兴福.公众议题知识库的多层本体设计[J].图书情报工作,2013,57(13):132-139.

[11]Gruninger M U.Ontologies:principles,methods and applications[J].Knowledge Engineering Review,1996,11(2):93-136.

[12]Lagoze C,Hunter J.The ABC ontology and model[J].Journal of Digital Information,2001,2(2):1-18.

[13]EventsML-G2,Version 2.9[EB/OL].[2015-08-29].http://www.iptc.org/site/News_Exchange_Formats/EventsML-G2/Specification/.

[14]Jeong S,Kim H G.SEDE:An ontology for scholarly event description[J].Journal of Information Science,2010,36(2):209-227.

[15]Han Y J,Park S Y,Park S B,et al.Reconstruction of People Information based on an Event Ontology[C].International Conference on Natural Language Processing and Knowledge Engineering,2007:446-451.

[16]Teymourian K,Paschke A.Towards semantic event processing[C].ACM International Conference on Distributed Event-Based Systems,Debs,2009:1-2.

[17]王伟,赵东岩.中文新闻事件本体建模与自动扩充[J].计算机工程与科学,2012,34(4):171-176.

[18]Mate J.et al.,Ontology-based data integration between clinical and research systems[J].Plos One,10(1),E0122172.

[19]王伟,赵东岩.中文新闻事件本体建模与自动扩充[J].计算机工程与科学,2012,34(4):171-176.

[20]江颖红.微博事件的卷入度研究——以上海地区用户分层为例[D].上海师范大学,2013:12-13.

[21]Brickley D,Miller L.The friend of a friend(FOAF)vocabulary specification[J].Apple Computer,2007:189-211.

[22]曹树金,马翠嫦.信息聚合概念的构成与聚合模式研究[J].中国图书馆学报,2016(3):4-19.

[23]王涛.基于关联数据的馆藏信息资源聚合研究[J].图书馆学刊,2012(8):44-46.

[24]王泽贤.基于CNMARC的FRBR化OPAC系统开发初探[J].现代图书情报技术,2008(07):81-85.

[25]Sala A.Data and service integration-architectures and applications to real domains[D].Italy:University of Modena and Reggio Emilia,2010.

[26]张鹏翼,周妍,袁兴福.公众议题知识库的多层本体设计[J].图书情报工作,2013,57(13):132-139.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈