CNN不要关心模板/filter的参数怎么来,attention不要关心权重怎么来的。神经网络不要关心参数怎么来的。

一些我的想法。机器学习 在刚开始学习CNN的时候,很好奇filter的参数是怎么来的。看视频过程当中也有人问。实际上咱们并不须要关心filter中的参数,只要能作梯度降低,那么咱们的目标就是使得loss降低。而filter中的参数天然会变得更有利于loss降低。至于filter卷积后是在提取什么特征,这彻底须要咱们本身下定义。最近复习attention机制,讲attention的例子时会给人一种权
相关文章
相关标签/搜索