李宏毅:Activation Function

1、relu (1)relu (2)relu的变形 (3)selu   下图中的iid表示独立同分布,输入a1...ak的mean是0,variance是 1,Selu希望得到输出的mean也是0,variance也是1。我们假设w1...wk的mean也等于0。 我们假设weight的variance也是1。 SNN就是用selu (3)swish
相关文章
相关标签/搜索