FastFormers 论文解读：可以使Transformer 在CPU上的推理速度提高233倍

时间 2021-06-25

原文原文链接

自Transformers诞生以来，紧随其后的是BERT，在几乎所有与语言相关的任务中，无论是问题回答，情感分析，文本分类还是文本生成，都占据着NLP的主导地位。与RNN和LSTM消失的梯度问题（不影响长数据序列的学习）不同，Transformers在所有这些任务上的准确性更高。 RNN和LSTM不可扩展，因为它们必须考虑先前神经元的输出。现在，《Transformers》的主要问题是它们在训

>>阅读原文<<