【资源聚合平台】5/30日工作日志

梁惠欣 成功使用wiki的语料库训练了word2vec方法。但是,由于语料库所含文本与我们的技术专栏,提取摘要效果很差。 不太适用于我们的情况。 正在爬取技术博客文章作为语料库训练集。 改ui,明天继续改 邵长旭 现在能发图片了,实际是现在的内容存的html代码,所以能解析img图片,但是这样在生成摘要时直接截取前几个就不行了,做摘要提取的时候要先把各种html标签去掉,再生成摘要: 现在详情页面
相关文章
相关标签/搜索