BERT解读(论文 + TensorFlow源码)

N个月前BERT就频繁出如今笔者的视野中,只知道是Google出品的神奇好用的pretrain模型,但一听到要用TPU去训练,就有种“拜拜了您嘞”了感受。不过看到近期你们在谈论的,在研究的,无一不是围绕BERT等一系列的pretrain模型,不由感叹大势所趋!近期终于有时间静下心来好好研读这篇论文和它的源码,并记录以下,但毕竟BERT已经出了好久了,各路大神都把它研究得很透彻了,因此若有不周详之处
相关文章
相关标签/搜索