语言模型的随机采样和相邻采样

天然语言数据能够当作一种特殊的时间序列数据。对于这种时序数据的采样主要有有随机采样和相邻采样两种方式。二者都须要肯定一个batch的样本数量batch_size和每一个样本的时间步长num_steps。html 随机采样 步骤:语料库corpus_indices的长度为 n n n,首先按照时间步长肯定可能的样本的起始索引,可能的样本起始索引最后被随机打散。这里注意:采样的单个样本的最后一个单词不
相关文章
相关标签/搜索