关于注意力机制的理解

文章目录 图像捕捉 memory network muti-hop分析 图像捕捉 将input image切成不同的region,再用cnn去encoder成不同的vector,然后再六个不同的vectior计算不同的attention 得到这个时间点的六个hidden layer的weigtht,算出下个时间点 distribution,然后求和放入enconder当中得到下一个预测的单词。 m
相关文章
相关标签/搜索