Facebook Inc.拥有超过20亿用户,必须在其社交网络上处理数十种不同的语言,这对公司 “将世界更贴近” 的新任务构成了一个障碍。“Facebook希望人造智能将作为这个问题的答案,今天公司宣布其翻译现在完全依赖于尖端的神经机器学习。Facebook翻译现在完全依靠神经网络-ZAERA

“为20亿使用Facebook的人创造无缝,高精度的翻译体验是困难的,”他们说。“我们需要同时考虑上下文,俚语,打字错误,缩写和意图。”

据团队介绍,Facebook最近将其后端翻译系统完全转换为神经网络,每天处理2000多个翻译方向和45亿翻译。他们说这些翻译比Facebook以前的系统更准确,它使用了基于短语的机器翻译模型。

Facebook不是唯一使用基于短语的翻译公司,也不是第一个开始从它转移的公司。谷歌翻译也使用了短语翻译,像Facebook一样,去年谷歌翻译转向神经机器翻译。

基于短语的翻译将句子分解成单独翻译,并将它们拼接在一起以获得最终产品。这个系统是相当快的,但它也是不准确的,导致翻译可能是技术上正确的短语,但总体不准确。

同时,神经机器翻译将消息的整个内容整合在一起,这是更多的资源密集型,但通常会导致更流畅的翻译。在今天的公告中,Facebook还表示,神经机器翻译更好地处理未知或拼写错误的单词,因为它能够查看上下文的线索来找出该词的意图。

虽然Facebook和Google都在转向神经网络,但两家公司正在采取不同的过渡方式。Google的系统使用经常性神经网络或RNN,这些网络在序列中读取数据时往往更好,例如从左到右读取单词。同时,Facebook一直致力于实现卷积神经网络或CNN,通常用于视觉任务,如图像识别。

传统上RNN在翻译方面传统上更好,但Facebook认为CNN可以以更高的速度实现相同的准确性。5月份,该公司表示,其基于CNN的翻译系统是现有网络的九倍,Facebook研究人员团队解释说,CNN更适合最新的机器学习硬件。

Facebook的团队当时表示:“RNN在一个严格的从左到右或从右到左的顺序上运行,一次一个字。“这对于高度并行的GPU硬件来说,这对于现代机器学习来说是不太自然的。”

虽然Facebook似乎相信CNN的翻译未来,但公司的大多数系统仍然依赖于RNN。目前,Facebook仅使用CNN进行英文到法文和英文到德文的翻译,但研究小组表示,CNN是一个令人兴奋的新发展道路,我们将继续努力利用CNN进行更多翻译系统“。