DialoGPT12-10 issue记录

有趣,作者强调了Padding方式是通过 “context [SEP] response [SEP] [PAD]” 但是在inference的时候,有时候会没有标准答案的response 所以我只能将context放入并且padding进行实验。作者仍然强调了在训练过程中与这个的区别。有意思,但是区别是 response是一个decoding过程,在作为标准的过程中,当然是可以作为decoder的
相关文章
相关标签/搜索