小结2:文本预处理、语言模型、循环神经网络基础

文章目录 1 文本预处理 2 语言模型 采样 3 循环神经网络基础 1 文本预处理 文本预处理常见步骤: 1 读入文本 2 分词 3 建立字典,将每个词映射到一个唯一的索引(index) 4 将文本从词的序列转换为索引的序列,方便输入模型 为了方便模型处理,我们需要将字符串转换为数字。因此我们需要先构建一个字典(vocabulary),将每个词映射到一个唯一的索引编号。 语料库,分词等。 将词进行
相关文章
相关标签/搜索