更轻量的 pQRNN：基于投影，实现快速并行的 NLP 处理

时间 2021-03-02

原文原文链接

文 / Prabhu Kaliamoorthi，Google Research 软件工程师深度神经网络在过去十年中从根本上改变了自然语言处理 (NLP)，主要途径是其在使用专用硬件的数据中心上的应用。然而，保护用户隐私、消除网络延迟、实现离线功能以及降低运营成本等需求激发了 NLP 模型在设备端而非数据中心上部署的研究的飞速发展。不过，移动设备的内存和处理能力有限，这就要求在它上面运行的模型必

>>阅读原文<<