无监督学习︱GAN 在 NLP 中遇到瓶颈+稀疏编码自学习+对偶学习

深度学习训练一个模型须要不少的人工标注的数据。例如在图象识别里面,常常咱们可能须要上百万的人工标注的数据,在语音识别里面,咱们可能须要成千上万小时的人工标注的数据,机器翻译更是须要数千万的双语句对作训练。 看看标注数据的代价有多高。好比说对机器翻译而言,如今若是咱们请人工来翻译,一个单词的费用差很少是5—10美分之间,一个句子平均长度差很少是30个单词,若是咱们须要标注一千万个双语句对,也就是咱们
相关文章
相关标签/搜索