渣排版预警!code
出发点
新闻用户为何会点:
主观:用户兴趣/热点事件
客观:新闻标题(新闻入口)/新闻内容(更简单,更有趣)事件
标题分类:
surprise,好奇,负例,数字,你,客观的描述,问题的形式 。。。。io
咱们这个目标就是创建问题的形式。test
ABtest:
question形式点击基本为15%,非question为13%(虽然abtest感受不太标准。效率
用户的好奇心。方法
任务 Task
1.原文中直接抽取标题
2.摘要式抽取标题,理解完文本以后,本身生成word
1.句法树
2.seq2seqco
给输入的新闻文本,经过seq2seq产生headline数字
解决方法
seq2seq,rnn处理。每一个单元替换成为lstm,GRU(核心都是经过gate来保留信息)
gru效率比lstm高,并且更简单,故选择gru生成
用attention mechanism去作的标题生成
word encoder是BI-Gru处理:正向信息和反向信息
sentence encoder也是一个bi-gru
实验评价结果 很牛逼