Attention (学习笔记)

Seq-Seq 模型的困难: p ( y 1 , . . . y T ) ∣ x 1 , . . . x T = ∏ t = 1 T ′ p ( y t ∣ c , y 1 , . . . , y t − 1 ) = ∏ t = 1 T ′ g ( c , s t − 2 , y t − 1 ) p(y_1,...y_T)|x_1,...x_T=\prod _{t=1}^{T^{'}}p(y_t|
相关文章
相关标签/搜索