据 fastcompany 报道,最新出现的两个机器翻译系统完成了崭新的突破——可以在无需人类翻译文本的学习资料的情况下,自主学习翻译地球上的任何语言。

据 fastcompany 报导,***呈现的两个机器翻译体系完成了簇新的打破——可以在无需人类翻译文本的学习材料的情况下,自主学习翻译地球上的任何打量。机器翻译开展惊人,可是地球上仍是有数以亿计的人无法享用它的优点——因为他们的打量在翻译器的下拉菜单中底子找不到。

现在,两个新的人工智能体系——一个来自西班牙的 delPaísVasco 大学(UPV),另一个来自卡内基梅隆大学(CMU)——许诺会改动这一切,为像《星际迷航》(Star Trek)中那样的真实的国际通用译者(universal translator)的到来翻开大门。

 AI可以自学翻译地球上的任何打量了 AI 翻译 人工智能 第1张

要了解这些新体系的潜力,首先要了解当时的机器翻译是怎么作业的。 现在机器翻译的现实标杆是谷歌翻译,这个体系涵盖了从南非语到祖鲁语的 103 种打量,包含国际上前 10 种打量——次序为汉语,西班牙语,英语,印度语,孟加拉语,葡萄牙语,俄语,日语,德语, 和爪哇语。

Google 的体系运用人类监督的神经网络,比较平行文本——曾经由人类翻译过的书本和文章。 经过比较这些平行文本中的许多数据,Google 翻译可以学习恣意两种指定打量之间的对等关系,然后取得在它们之间快速转化的才能。有时分翻译成果会很风趣,或许并不能真实反映原文的意思,但总的来说,这些翻译是功能性的,跟着时刻的推移,他们会越来越好。

Google 的做法很好,并且很有用。但不幸的是,它并不是全球通用。

这是因为有监督的训练需求很长的时刻以及许多监督人员——因为太多了,谷歌运用了众包——也因为并非国际避实就虚打量之间都有足够多的并行翻译文本。想想看:依据国际打量民族学目录,地球上有6,909 种日子打量。其间 414 种的运用人数占人类总数的 94%。因为 Google 翻译涵盖了 103 个,因此会留下6,806 种打量没有机器翻译——其间有 311 种打量的运用人数超越百万。总的来说,至少有八亿人不能享用机器主动翻译的优点。

这两个新的体系——可以在任何打量之间翻译单词和语句——无需经过比较许多由人类翻译的平行文原本学习。他们也不需求监督。相反,他们运用未监督的机器学习,并比较不同打量的随机文本。这是怎么运作的?因为打量的词语分类是类似的,所以体系猜想这些词是否持平,用这些信息构建翻译词典。他们从中找出语句结构,经过在不同的打量之间来回翻译来评价他们猜想的成果。

正如 UPV 的研讨员 Mikel Artetxe 所描绘的那样:“幻想一下,你给了一个人许多的中文书本和阿拉伯语书本——这些书都不堆叠——然后这个人有必要学会把中文翻译成阿拉伯语。 这似乎是不或许的,对吧?“现实上,这看起来实在太不或许了,以至于微软人工智能专家 Di He(这两个研讨项目的启发者)告知科学界,他得知”即便没有人工监控,电脑也可以学习翻译”的时分,整个人都震动了。

一个正告便是,这个体系并不像现在的平行文本深度学习体系那么准确——可是正如 Di He 指出的那样,电脑可以在没有任何人类辅导的情况下猜想避实就虚这些现实,这一现实自身几乎难以想象。 咱们仅仅触摸到了这种新的学习方法的外表。看起来,或许很快就有一个真实的通用翻译,让咱们可以与任何人用对方的母语交谈了,这不再仅仅是科幻的东西。

转载请说明出处
知优网 » AI可以自学翻译地球上的任何打量了

发表评论

您需要后才能发表评论