bert代码解读2之完整模型解读

bert代码模型部分的解读 bert_config.josn 模型中参数的配置html { "attention_probs_dropout_prob": 0.1, #乘法attention时,softmax后dropout几率 "hidden_act": "gelu", #激活函数 "hidden_dropout_prob": 0.1, #隐藏层dropout几率 "hidden_size
相关文章
相关标签/搜索