人机文本分类特征构造——困惑度计算

最近在2018smp的一个比赛中锻炼了一下,该任务为文本分类,重点在于辨别人类做者和机器所写文章的不一样,在一番仔细斟酌以后发现二者之间的区别有如下3点: (1)语序 机器所写的可能想表达的是同样的说法,是基于文本规则对抽取词汇的排列,可是结果呈如今词序的排序上却会出现一些误差,举个栗子:javascript 正确的句子: 这将是最好的将来 。 错误的句子: 这是将最好的将来 。 (2)语义 机器
相关文章
相关标签/搜索