理论教育 实现自然语言翻译:从语言到句子的完美转换

实现自然语言翻译:从语言到句子的完美转换

时间:2023-06-28 理论教育 版权反馈
【摘要】:深度学习快速改变格局的一个例子是它对语言翻译的影响。语言翻译是人工智能的一只圣杯,因为它依赖于理解句子的能力。谷歌最近推出了基于深度学习的最新版谷歌翻译,代表了自然语言翻译质量的重大飞跃。几乎一夜之间,语言翻译就从零散杂乱的拼凑短语,升级到了语意完整的句子。之前的计算机方法搜索的是可以被一并翻译的词汇组合,但深度学习会在整个句子中寻找词汇之间的依赖关系。

实现自然语言翻译:从语言到句子的完美转换

如今,谷歌在超过100 种服务中使用了深度学习,包括街景视图(Street View)、收件箱智能回复(Inbox Smart Reply)和语音搜索。几年前,谷歌的工程师意识到他们需要将这些计算密集型应用扩展到云端。他们开始着手设计一种用于深度学习的专用芯片,并巧妙地设计了可以插入数据中心机架中的硬盘插槽的电路板。谷歌的张量处理单元(TPU)现在已配置在遍布全球的服务器上,让深度学习应用程序的性能得到了大幅改进。

深度学习快速改变格局的一个例子是它对语言翻译的影响。语言翻译是人工智能的一只圣杯,因为它依赖于理解句子的能力。谷歌最近推出了基于深度学习的最新版谷歌翻译(Google Translate),代表了自然语言翻译质量的重大飞跃。几乎一夜之间,语言翻译就从零散杂乱的拼凑短语,升级到了语意完整的句子(见图1-3)。之前的计算机方法搜索的是可以被一并翻译的词汇组合,但深度学习会在整个句子中寻找词汇之间的依赖关系。

图1-3 手机上的谷歌翻译应用可以将日语文字和菜单即时译成英文。这一功能对于在日本如何按照指示牌乘车尤为重要。

得知谷歌翻译获得了巨大进步的消息后,2016 年11 月18 日,东京大学的暦本纯一(Jun Rekimoto)测试了这个新系统。他把欧内斯特·海明威小说《乞力马扎罗的雪》开头的一段话翻译成了日文,然后再把这段日文翻译成英文,结果如下(猜猜哪个是海明威的原作):(www.daowen.com)

1.Kilimanjaro is a snow-covered mountain 19,710 feet high,and is said to be the highest mountain in Africa.Its western summit is called the Masai“Ngaje Ngai,”the House of God.Close to the western summit there is the dried and frozen carcass of a leopard.No one has explained what the leopard was seeking at that altitude.[1]

2.Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa.The summit of the west is called“Ngaje Ngai”in Masai,the house of God.Near the top of the west there is a dry and frozen dead body of leopard.No one has ever explained what leopard wanted at that altitude.[2]10

海明威的原作是第一段。

下一步工作是训练更大规模的深度学习网络,针对段落来提高句子间的连贯性。文字背后都有悠久的文化历史。俄裔作家和英文小说家,《洛丽塔》一书的作者弗拉基米尔·纳博科夫(Vladimir Nabokov)曾经得出结论,在不同语言之间翻译诗歌是不可能的。他将亚历山大·普希金(Aleksandr Pushkin)的诗体小说《叶甫盖尼·奥涅金》(Eugene Onegin)直译成了英文,并对这些诗文的文化背景做了解释性脚注,以此论证他的观点。11 或许谷歌翻译终有一天能够通过整合莎士比亚的所有诗歌来翻译他的作品。12

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈