昨天,Facebook刚刚宣布其机器翻译取得里程碑式进展,可在100种语言之间实现互译,并且不依赖英语这个「中介」,今天reddit网友就来掀车了。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第1张

Facebook又翻车了?

昨日,Facebook刚刚宣告其机器翻译获得里程碑式开展,可在100种言语之间完成互译,并且不依靠英语这个「中介」,今日reddit网友就来掀车了。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第2张

该网友称,Facebook此前也有过夸张宣扬,但这次有点过了。

Facebook 的100种言语互译并非里程碑?

Facebook声称,最新的模型可直接进行多达100种言语的机器翻译,比方从汉语到法语,且练习的时分的无需英语作为中介。在评价机器翻译广泛运用的 BLEU 指标上,它比以英语为中心的翻译体系功能高出10个百分点。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第3张

而Facebook AI实验室的博客中并未提及,谷歌早在4年前就做了这件事。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第4张

谷歌在16年发布的这一研讨成果,也是一个端到端的学习结构,从数以百万计的比方中学习,并明显提高了翻译质量。

这个翻译体系不只提高了测试数据上的翻译质量,并且能够支撑103种言语的互译,每天翻译超越1400亿个单词。尽管还面对一些问题,可是谷歌确实做到了100种言语。

那咱们来看看,谷歌的这套体系是怎么运作的。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第5张

谷歌的这一算法是零样本学习的,假定咱们用日语、英语和韩语的比方来完成一个多言语翻译体系,与单个 GNMT 体系的巨细相同,它经过同享参数来在这几个不同的言语对之间进行翻译。这种同享使体系能够将「翻译经历」从一种言语对转移到另一种言语对。

「Facebook声称的不依靠英语数据,也是不精确的」。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第6张

Facebook的论文图表显现,运用的数据会集有一部分是包括英语的,要说彻底没有依靠英语,有点扼杀英语起到的效果了。

到现在为止,谷歌有论文评论关于103种言语的练习,以及一篇不「依靠英语数据」的独自论文。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第7张

谷歌2019年宣布的大规模多言语机器翻译,支撑103种言语,可是源言语或许目标言语是英语。

从技能精确性的视点来看,确实很难找到一篇能徘徊满意两个要求的论文: 不依靠英语数据和超越100种言语。

网友以为,一个非误导性的说法应该是,「Facebook 发明了一个巨大的NMT 数据集,并在上面练习一个Transformer。」

不论Facebook的说法准不精确,它的模型必定确实比曾经更好了,也开源了相关的数据集和代码,有核算资源的同学能够去验证一下。

那么,人类翻译会被机器翻译所代替吗?

机器翻译将全面代替人类翻译?想多了!

跟着机器翻译技能的不断进步,这也成为越来越多的人尤其是翻译职业的人,最关怀的问题。

这并非「杞人忧天」。

无论是Facebook最近开源的M2M-100模型,仍是谷歌之前发布的支撑103种言语的AI翻译,都显现出机器翻译在代替人类翻译上的巨大或许性。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第8张

不过,就机器翻译现在的开展状况来看,想要彻底代替人类翻译仍是不太实践的。

从技能上来看,现在机器翻译还存有许多技能难点亟待霸占,比方语序紊乱、词义不精确、孤登时进行句法分析等。

从实践运用上来看,在一些偏口语化的翻译场景、对专业知识布景要求比较高的场景以及大段对话的场景,机器翻译都无法做到精确而敏捷的翻译。

此前就有媒体爆料出许多机器翻译的「翻车」事情,例如大型会议的机器同传翻译呈现大段句子不通的内容,一些人名无法辨认,一些日常对话也被翻译得啼笑皆非…

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第9张

尽管从体现上来看不那么尽善尽美,但机器翻译的快速开展无疑会筛选掉一批低水平的人类翻译者,那些只能进行「低端」翻译的人类翻译者无疑会被机器翻译所代替。

而真实的高水平翻译者则彻底不需求忧虑这个问题。即便是现在最先进的机器翻译,间隔「信、达、雅」的翻译要求也还有很大距离。

相反,机器翻译能够把高水平的翻译者们从一些机械、单调的简略翻译作业中解放出来,让机器翻译成为东西,抽出精力去从事更赋有发明性的作业。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第10张

实践上,未来的译者或许更挨近修正和质量把关专家,更多的是对机器翻译的初稿进行修正润饰和文学创作。

总而言之,机器翻译全面代替人类翻译现在来看是个没谱的事。

AI公司喜爱夸张宣扬,人工智能依据「ifelse」?

Facebook这个看似要代替人类翻译的模型,引起了不少评论。

有网友乃至以为机器学习范畴总是被言论误导。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第11张

一些大公司的研讨或许发声更简略被听到,乃至在论文承受上,也享有必定的优势。

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第12张

尽管现在大多数顶会的论文审阅都是双盲的,可是审稿人很简略判别作者的布景状况,比方说论文中的模型运用了几千个TPU,那来自大厂无疑了。

谷歌、Facebook这样的大型科技公司确实占有了许多有利位置。

一些AI公司喜爱运用这些论文,夸张AI在实践中的效果。

并且新闻稿有时是由非研讨人员依据有限的描绘或论文摘要编撰的,或许没有进行任何现实核对,导致必定的误差。

之前,推特上有一条点Uber的音讯招引了不少重视,这则推文引用了一份新闻稿,其间指出:「Uber 将运用人工智能来辨认醉酒的乘客,AI体系运用当时时刻、上车地址以及用户的犹疑时刻等参数来判别。」

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第13张

下面写了一句:「那不是AI。那只是if句子罢了」,还给出了完成这一智能辨认体系的代码,总共需求两行:

 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑 Facebook 翻译 语言 第14张

现实上或许并不这么简略。

Uber 或许会运用机器学习,并依据以往的数据来微调模型的权重,还能够把过错的判别用来更新猜测模型,可是有些AI运用确实没有论文中那么好。

那么,你写过依据ifelse的人工智能运用吗?

转载请说明出处
知优网 » 并非里程碑! Facebook的100种言语互译模型夸张宣扬遭质疑

发表评论

您需要后才能发表评论