bert细节理解

bert中的升维3072,能更好的分离特征。 bert中最后对一维卷积进行池化,好处在于增加了模型的泛化能力,不同的池化方式(平均值、最大值)会带来不同的结果。 一维数据进行池化,利用padding=“SAME”,不会改变尺寸。 https://blog.csdn.net/Tourior/article/details/79544326
相关文章
相关标签/搜索