[论文阅读笔记] Massive Exploration of Neural Machine Translation Architectures

时间 2021-01-02

原文原文链接

最近想要看看Attention的机制，然后被网上博客引到这个论文，想要了解一下NMT（Neural Machine Translation）的架构。这篇paper没有发表在会议上，出自Google Brain，并公开了seq2seq的NMT框架代码。个人觉得文中的结论不太可信，但是对于NMT的介绍还是足够清晰。这里记录一些文中有意思的点，以及一些笔者自己的思考，欢迎指教。 NMT框架详见文中Se

>>阅读原文<<