微软分享史上最大基于Transformer架构的语言生成模型

导语:英伟达的“威震天”如今只能屈居第二了。网络 微软AI&Research今天分享了有史以来最大的基于Transformer架构的语言生成模型Turing NLG(下文简称为T-NLG),并开源了一个名为DeepSpeed的深度学习库,以简化对大型模型的分布式培训。架构 基于Transformer的架构,意味着该模型能够生成单词来完成开放式文本任务。除了完成未完成的句子外,它还能够生成对输入文档
相关文章
相关标签/搜索