济南福之音带你看史上款可自学的翻译AI,交流无障碍

2017-12-06  来自: 济南福之音新型材料有限公司 浏览次数:806

淋浴凳生产厂家据悉11月31日,西班牙巴斯克大学的计算机博士Mikel Artetxe开发了一个翻译AI,不需要大量数据进行训练即可进行实时翻译。

据悉,该AI目前翻译的英法双语文章取得32.8分的评估分,谷歌目前的翻译AI取得了40分,高的是人工翻译取得的50分。虽然该AI目前得分较低,但是它证明了不用数据训练即可实现翻译的可能性。

我们知道,不管是谷歌还是微软的翻译AI,都需要大量词语训练其深度神经网络,而且这些词语大多来自联合国、欧盟提供的庞大的双语数据库。但是,对于那些语言使用人数比较少,例如孟加拉语、海地语、阿拉伯语,就很难办了,因为很难找到大量数据库进行训练。

针对这种情况,Mikel Artetxe博士的解决办法是反向翻译和去噪两种技术。简单来说,反向翻译就是给AI一段英语,让他先翻译成法语,然后它再将这句法语翻译回英语,对比初始句子和翻译回的句子有什么不同,再进行修改。

史上款可自学的翻译AI,交流无障碍

而去噪则是在反向翻译中会不断使用的一种方法,如果翻译回原始语言的文本和给出的句子有不同,该AI会通过删除几个词或者重新排列几个句子来进行修正工作,并重复这个过程直到得到与原句子相似的结果。

整个过程也是所谓的无监督式学习,即研究者并未告诉AI***要把一个句子翻译成什么样,在这个过程中谁也不知道该AI终会翻译成什么样,不过语义当然是跟原句子意思相近的。而像谷歌、微软等使用的都是监督学习,他们会给定一个确定的目标,比方说“i *** you”的标准答案是“我爱你”,并以进行训练,使AI的答案无限接近于标准答案。

史上款可自学的翻译AI,交流无障碍

这项研究的主要作者Mikel Artetxe于2016年获得巴斯克大学的自然语言处理的硕士学位,随后进入谷歌实习,参加了谷歌的多语言方案研究项目。目前Artetxe正在巴斯克大学攻读自然语言处理的博士学位。

谷歌的AI翻译目前涵盖了104种比较常见的语言,而全世界总共有6900多种语言,因此还剩下6800多种语言不能使用谷歌的自动翻译,而这部分人口至少有8亿人。总的来说,虽然目前该AI的准确率不及谷歌,但却能够普及到使用少数语言的人口,成为一款普适的翻译AI。目前Mikel Artetxe正在优化其算法,让翻译结果能够更加准确。


关键词: 老年人专用扶手   淋浴凳生产厂家