深度学习预训练模型可解释性概览

时间 2020-12-30

原文原文链接

©PaperWeekly 原创 · 作者｜蔡杰学校｜北京大学硕士生研究方向｜问答系统近年来预训练模型（ELMo, GPT, BERT, XLNet, ALBERT 等）给许多 NLP 任务带来了显著的改进，但是有一个问题一直困扰着大家：被当做黑盒的神经网络到底是如何做的以及为什么会这样做？最近，人们对解决这个谜团越来越感兴趣，就此，我将最近看的一些相关论文进行总结，希望可以和大家一起探讨学