在所产生的数据中,我们以简·奥斯汀(Jane Austen)的《理智与情感》(Sense and Sensibility)和《傲慢与偏见》(Pride and Prejudice)为例。(在这两部作品中)相同的高频词汇有以下25个:“day”“first”“give”“good”“great”“know”“lady”“little”“made”“make”“man”“miss”“mother”“mr”“mrs”“one”“room”“said”“say”“see”“sister”“soon”“think”“time”and“two”。《理智与情感》中,还有以下五个不是(两部小说中的)共同的高频词汇:“heart”“house”“sir”“sure”“thing”。《傲慢与偏见》中不是(两部小说中)共同的高频词汇的词有以下五个:“dear”“family”“father”“hope”“young”。伯尼的作品《塞西莉亚》(Cecilia)(被有争议性地)认为与奥斯汀的小说是相似体裁。(我们)将伯尼的这部作品和简·奥斯汀的《理智与情感》进行对比,(发现两部作品中)有21个共同的高频词汇。但是,我们把另一部体裁非常不同的马克·吐温的作品《哈克贝利·费恩历险记》(Huckleberry Finn)和理智与情感进行对比,(发现两部作品中)仅有12个共同的高频词汇。
如上所述,每个文本的高频词汇都被用来检测对比的文本之间共同的高频词有哪些。如果两个文本之间一共有30个共同的高频词,那么他们之间的变化差异为零(没有不同)。在实际操作中,这种情况没有发生。如果两个文本没有共同的高频词的话,那么它们的变化是100%或1这种情况也没有发生,至少在这里测试的小说体裁中没有。(www.daowen.com)
应该强调的是,高频词汇测试不是在任何意义上(任何条件下都)被认为是一种“理想”的测试作者身份和体裁的方式。许多其他测试,一些被设计成具有统计学的高度复杂的(测试),将得出同等或更有效的(测试)结果。这里使用这种方法是因为它操作的简单性,并且因为它并不需要读者事先具备技术知识。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。