pytorch_Task2(文本预处理、语言模型、循环神经网络)

---------- 文本预处理 读入文本 分词 创建字典,将每一个词映射到一个惟一的索引(index) 其余分词工具 语言模型 n元语法 时序数据采样 随机采样 相邻采样 RNN 循环神经网络 裁剪梯度 困惑度 定义模型训练函数 代码实现 文本预处理 文本是一类序列数据,一篇文章能够看做是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理一般包括四个步骤:web 读入文本 strip移
相关文章
相关标签/搜索