技术编辑:鸣飞 发自北京
SegmentFault 思否报道丨公众号:SegmentFaulthtml
科技巨头谷歌、微软和Facebook都在将机器学习的经验教训应用到翻译领域,但一家名为DeepL的小公司却超越了他们,提升了这个领域的标准。它的翻译工具的速度不亚于那些规模庞大的竞争对手,但比咱们尝试过的任何一款翻译工具都要准确和细致。web
通过几回试验,咱们都认为DeepL的翻译广泛优于Google Translate和Bing的翻译。Google Translate常常会去找一个很是直白的翻译,错过了一些细微的差异和成语(或者是把这些成语翻译成错了),而DeepL常常提供一个更天然的翻译,更接近于一个训练有素的翻译者的翻译。数据库
DeepL从Linguee演化而来segmentfault
DeepL诞生于一样优秀的Linguee,这是一款已经存在多年的翻译工具,虽然很受欢迎,但一直没有达到谷歌翻译的水平--毕竟后者在品牌和地位上有很大的优点。Linguee的联合创始人Gereon Frahling曾在Google Research工做过,但在2007年离开Google并开始了本身的新的事业Linguee。微信
这支团队多年来一直致力于机器学习,从事与核心翻译相邻的任务,但直到去年,他们才开始认真地研究一个全新的系统和公司,而这两个系统和公司的名字都将是DeepL。网络
Frahling提到如今时机已经成熟:"咱们已经创建了一个神经翻译网络,其中包含了大部分最新的发展,咱们在其中加入了本身的想法。"机器学习
一个由超过10亿个翻译和查询组成的庞大数据库,再加上经过在网络上搜索相似的片断进行落地翻译的方法,为新模型的训练打下了坚实的基础。他们还把他们声称的世界上第23台最强大的超级计算机放在了一块儿,位于冰岛境内。工具
DeepL的翻译服务使用了搭建在Linguee数据库之上的卷积神经网络及另外一种并未公布的专有方法涉及注意力机制。DeepL GmbH拥有一台浮点性能为5 Petaflops的机器,用于其翻译服务的训练和生产。性能
由大学、研究机构以及Linguee公司的竞争对手所公布的发展状况代表,卷积神经网络才是发展的方向,而不是该公司以前一直使用的递归神经网络。如今真的不是深刻研究CNNs和RNNNs之间的区别的地方,因此必需要说的是,对于长的、复杂的相关词串的准确翻译,只要你能控制好它的弱点,前者是一个更好的选择。学习
例如,CNN大体能够说是能够一次解决一个单词的句子。但当好比常常发生的状况,句尾的一个词决定了句子开头的一个词应该如何组成时,这就成了问题。通读整个句子,只是发现网络选取的第一个词是错误的,而后再根据这个知识从新开始,这是很浪费的,因此DeepL和机器学习领域的其余人应用了 "注意力机制",监控这种潜在的绊脚石,并在CNN转移到下一个词或短语以前解决它们。
关于隐私政策
不管是DeepL Pro仍是免费的DeepL Translator都不容许被用于翻译“包含任何种类我的资料的文本” 与免费版不一样,DeepL Pro宣称并不会储存翻译文本。更多能够查看他们的privacy。
感兴趣的同窗们能够试一试,相信Deepl会成为你新的助力你翻译的生产力工具。咱们也很是欢迎对Deepl背后技术的同窗们分享更多他们更多技术相关的细节。