自注意力的秘密.

跟着别人学转换器 参考地址 1,超参数文件 2,源汇词汇文件,预处理,就是词汇+次数的统计文件 3,加载数据,批量化数据文件,词与id创建一一对应关系.(一批一批的处理数据) 4,(实现编码器和解码器的)模型文件(重点) 5,训练代码(模型,损失函数) 6,评估.web 1,超参数:批大小,学习速率,最大词长度,最小词数,隐藏节点数(或许就是神经单元数吧),块数(加解码块数)svg 4,模型. 1
相关文章
相关标签/搜索