A Dataset for Research on Short-Text Conversation

论文原文:http://staff.ustc.edu.cn/~cheneh/paper_pdf/2013/HaoWang.pdf 这是2013年中科大和华为诺亚方舟实验室的论文,主要是一种基于检索式的问答模型,并且本文对实验数据获取和处理做了详细的介绍。 语料来源: 语料的数据来自于新浪微博,将新浪微博中的信息及其评论看作是一个单轮对话。大概的收集过程如下图: 首先选择10个NLP领域比较活跃的用
相关文章
相关标签/搜索