更轻量的 pQRNN:基于投影,实现快速并行的 NLP 处理

文 / Prabhu Kaliamoorthi,Google Research 软件工程师  深度神经网络在过去十年中从根本上改变了自然语言处理 (NLP),主要途径是其在使用专用硬件的数据中心上的应用。然而,保护用户隐私、消除网络延迟、实现离线功能以及降低运营成本等需求激发了 NLP 模型在设备端而非数据中心上部署的研究的飞速发展。不过,移动设备的内存和处理能力有限,这就要求在它上面运行的模型必
相关文章
相关标签/搜索