百科知识 跨学科视野下的人造语言与机器翻译

跨学科视野下的人造语言与机器翻译

时间:2023-12-06 百科知识 版权反馈
【摘要】:人造语言与机器翻译当今人类的语言有几千种,由于语言分歧,严重阻碍了不同国家、不同民族之间的相互理解和交往。机器翻译系统一般包括词典、语法分析、语义分析和转换与综合等4个子系统。机器翻译似乎是一个遥不可及的目标。在美国举行的一次机器翻译比赛中,Google技压群芳,其机器翻译软件超过了IBM和学术机构的相关产品,在机器翻译测试中名列榜首。

跨学科视野下的人造语言与机器翻译

人造语言与机器翻译

当今人类的语言有几千种,由于语言分歧,严重阻碍了不同国家、不同民族之间的相互理解和交往。随着全球化进程的加快,语言障碍的问题就显得越来越突出,似乎采用一种国际语是克服语言障碍的最好办法。所谓“人造语言”(Artificial Language),是指人为地创造语言,并希望它变成通用的语言。自2002年7月开始,一批中国的国际语爱好者创立了中国的世界语言方案——大同语,这种语言在世界语的基础上,综合了英语和汉语的一些特点,放弃了名词的宾格,以句子中词语的顺序确定其地位,并以一批来自英语的词汇替换了世界语的部分基本词。此外,大同语取消了世界语加帽特殊字母,更适用于在电脑中输入。

这让我想起了在人类历史上,先后出现过的一些其他的人工语言方案,从最早的沃拉普克语(Volapuk),到二十世纪的“西方人语”(Occidental)[1]和“交际语”(Interlingua)[2],都因为没有本民族的使用者而失去威信,成为试验品而“昙花一现”。德国人创造的沃拉普克语遭到失败带有点戏剧色彩,在1889年召开的一次沃拉普克语使用者国际会议上,当那些充满热情的支持者试图用这种语言来进行演讲时,却发现使用起来是那样的别扭和不顺当,连他们自己也彻底丧失了信心。不过,最早的人造语言尝试却鼓舞了人们去设计创造更好的方案,至今影响最大的还是世界语,它得到了国际上某种程度的承认。虽然世界语并不被认为是国际辅助语言的理想解决方案,然而没有别的辅助语言的使用人数达到世界语的使用人数。这是因为世界语是在印欧语系的基础上,按照一定的语言规律,经过研究整理而成,它的语音、词汇和语法的优点使得它比较容易推广,而且发明者柴门霍夫在公布世界语方案后多次声明,世界语不是他个人的,而是属于全人类的,易为大家所接受的“中立性”的语言,它不排斥、也不企图取代任何一种民族语,只是为人类在进行国际交往时提供一种国际性的辅助语。因此,在很多国家有许多世界语的热心者在积极宣传、推广并使用世界语,在国际上也建立了各种专业性的组织。

至于说其他的辅助语言,有的是基于世界语而发展起来的,在因特网上也有关于其他的辅助语言的信息。例如诺维亚语(Novial),又称诺维阿尔语。Novial即nov新+international国际+auxilary辅助+language语言,所以其学名应为“新国际辅助语”。[3]在结构上,诺维亚语处于比较自然的西方语和比较规则的世界语和伊多语之间的中间位置。此外,还有伊多语(Ido),成型中立语(Idiom Neutral),奥克西登塔语(即上文提到的Occidental)等,有的则与世界语相距甚远,这些语言在二十世纪初时都曾流行过一段时间。因为世界语是最广为人知的人工辅助语言,很多人都忽略了其他的人工辅助语。特别是近年来一般人对它们的兴趣已经越来越减弱。自从第二次世界大战以来,对英语的研究和使用与日俱增,这一事实表明:目前,是英语而不是人造语言,最有希望成为通用语言。

中国古代有关于仓颉造字的传说,泰国语言的创立和成形,和一位国王的创造关系密切,也有人认为,印度尼西亚语在某种程度上就是一种“人造语言”,因为它是在二十世纪二十年代,由荷兰一位传教士综合了马来语、爪哇语等“造”出来的。现在已成为印尼的国语,使用人口超过一亿。因此,乐观主义者认为,随着全球化的加速发展,地球村迟早会实现世界大同。回到刚才所说的大同语,大同语主义认为,互联网和大同语,将成为推动世界大同的两个重要工具。问题是,泰语、印尼语等都是在一国之内推广,这很好办,要推广到全球,谈何容易?互联网解决了世界大同的技术障碍,而大同语将解决世界大同的语言障碍。听起来似乎很有道理,因为电脑互联网的出现,似乎曾经为世界语言的大同提供了一个契机,但语言的创造很显然跟不上文字输入法的创造。也有批评者认为大同语不仅并未解决世界语中的大部分问题,反而更加依赖英语了。我想,作为一种理想,固然很美好,但作为现实,我们不妨假设,如果世界大同是一个遥遥无期的奋斗目标,那用人造语言来达到一种“语言的大同”也就同样遥不可及。

既然如此,那似乎只有在翻译方面做文章了。在这里,我也想说一说很多人同样很热衷的机器翻译(M T,Machine Translation),即自动翻译,用计算机把一种自然语言翻译为另一种自然语言。被翻译的语言称为源语,译出的语言称为目标语。机器翻译不仅和人工智能研究关系密切,而且还涉及语言学研究(特别是应用语言学研究),是一种有一定代表性的计算机非数值应用研究。作为一项技术,它允许您用某种语言输入文本然后由计算机将其翻译为(从其自身的字典资源)另外一种语言。机器翻译过程和人翻译有某些类似之处,也要通过查词典、源语分析和目标语综合等几个阶段。机器翻译系统一般包括词典、语法分析、语义分析和转换与综合等4个子系统。机器翻译的特点是速度快,计算机能在较短的时间内“不知疲倦地”完成大量的文字翻译工作。

然而,机器翻译质量尚不理想,译文比较生硬呆板,许多译句让人不知所云,差错层出不穷。机器翻译只适用于翻译语法结构比较严谨、词汇含义比较明确的文献,例如科技文献。为保证机器翻译具有一定的质量,往往还需要人从旁协助,进行所谓的“译前加工”(源语句子输入计算机时,对机器难于处理的某些语言现象先由人提供一定的注释和解法)或“译后编辑”(对计算机翻译出来的译文由人再去校对和润色),甚至要求建立人机合作式的机器翻译系统,对计算机翻译过程中出现的疑难问题,随时由人提供解答。机器翻译似乎是一个遥不可及的目标。前苏联、美国都投入了巨大的力量,做了多年的研究,但他们都在上世纪70年代遇到了瓶颈——机器翻译的质量非常糟糕,甚至很多人把它当成一个笑话

在互联网时代,一些搜索公司凭借其掌握的海量信息可以将机器翻译的准确度提升,因此搜索公司对发展多年成果不佳的机器翻译带来了一定程度的突破。在美国举行的一次机器翻译比赛中,Google技压群芳,其机器翻译软件超过了IBM和学术机构的相关产品,在机器翻译测试中名列榜首。也许在Google的机器翻译中我们还可以看到了一些希望的端倪,但接着“雅虎中国”也推出了其机器翻译,类似的盲目跟风者还有百度的百度词典。当翻译工具被Google发挥到感觉是一个搜索引擎所必备时,浮躁的模仿者就出现了,他们当然没有静下心来好好研发自己的产品,尽快弄出一个和Google差不多能够蒙骗初级用户就行了,因此用起来总体感觉都不太好,效果也大打折扣,机器翻译的前景并不乐观。当然,与其单责备在互联网和教育科研等领域所弥漫着的浮躁之风,倒不如说机器翻译是一个无法逾越的瓶颈。

幸好机器翻译的目标不是完美的翻译,事实上没有计算机能够做到这一点,而是尽可能地向用户提供其阅读内容的大意。机器翻译的目标不是像人一样准确地翻译文本,而是向那些不会讲英语的计算机用户提供一个解决办法,将那些没有译文的软件翻译为他们自己的语言。尽管它并不能创造完美的翻译,机器翻译至少向那些不讲英语的用户提供了一些要点,让他们了解到底那上面写了些什么,这比没有任何翻译要强多了。应该说,机器翻译也是一种很好的探索,然而实践却证明机器翻译同样是一个“理想”成分很大的idea,在我指导过的学生论文里,曾经见过非英语专业的学生用英语做论文,一般都是用汉语写好再翻译成英语,变成了一种很奇特的文章。方舟子在一个文章中举了个有趣的例子,近年来经常看到有人在网上贴出据称是在某地的超市、餐馆拍到的中英对照的招牌或菜单照片,“干货”、“干果”、“鱿鱼干”、“虾干炒白菜”等等名称,被翻译成英文时其中的“干”字都被译成了骂人的话“Fuck”,其真实性荒谬得令人怀疑。但有网友发现,许多刊登在国内学术期刊上的中文论文,其中的“真抓实干”、“干化学尿液分析”、“包干制”、“干密度”、“主干课程”等等名词中的“干”也都被翻译成了英语粗口。学过英文的人都知道,这个禁忌词是登不了大雅之堂的,主流媒体也避用,万不得已要提到它时也得用“Four-letter Word”或打叉来代替,而中国学术期刊之所以需要有英文标题、摘要和关键词,就是为了国际交流的,现在好了,论文上竟然出现这样的词。这个滑稽的现象甚至引起了国外语言学家、汉学家的注意,成了国际笑话。后来终于有汉学家找到了其原因:原来国内一款流行的中英文翻译软件一概把“干”翻译成了这个英语粗口词。显然,那些翻译超市招牌、菜单、论文的人,对英语是一点都不懂,所以才全盘相信、采用了蹩脚的机器翻译。[4](www.daowen.com)

在招牌、菜单中出现这种荒谬可笑的翻译,只不过是个莫名其妙的笑话,但是在论文中也这么“干”,就不仅仅是个笑话了。能写学术论文的人,都应该是受过高等教育,有一定英语水平的,考研、评职称英语也是必考的,英语水平何以如此低下,连本专业的术语也要借助于机器翻译,而且被机器翻译捉弄了也看不出来?说实话,我也害怕人家拿这样的一种东西来让我指正:就是某些翻译的材料,大概是用电脑软件翻译了一下,然后拿来请我纠正一下。这样的东西往往让我头大,不看还好,越看越糊涂,尤其是那些所谓的做得比较“好”的翻译,更是让人精神恍惚。实在需要的时候,我往往是把他所谓的需要修改的东西扔在一边,直接帮他翻译了。我有个朋友学的是社会学,最近和我一同翻译一本哲学著作,他也用机器翻译,不过都是为了获得可以省去打字的麻烦,关键词出来了就省得再打,但对我而言,这样的“译后编辑”所带来的混乱,比起打字来是得不偿失。

语言学上有个问题就是,为什么人可以无限地生成创意不同的句子?这个主宰人类语言的内在秘密要被识破,恐怕也和电脑统治人类时代来临的那天一样遥不可及。此外,人际交流是件非常不容易的事情,虽然很多工作都可以在互联网上完成,但是,机器和网络永远不能替代的就是人与人之间在情感、信任、关怀等方面的交流。我们可以用互联网来辅助人际间的交往,但不要让互联网成为一个虚拟的“牢笼”。因此,人造语言也好,机器翻译也好,还是让它们前景有限好了,要是真的很棒的话,我还有点担心呢,因为那样我们这些语言工作者岂不是要丢了饭碗了?呵呵。

【注释】

[1]指Edgar de Wahl.于1922年创造的人造语言。

[2]指国际辅助语协会创制的人造语,也指1908年,G.Peano创造的人造语言。

[3]它是由丹麦语言学家奥托·叶斯泊森(耶斯佩森)(O.Jespersen)于1927年创造的。

[4]参阅方舟子:怎能这么“干”论文http://view.news.qq.com/a/20071221/000052.htm.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈