Java爬取公众号文章并生成HTML

1. 需求 用户上传一个微信连接,可以从连接中解析HTML并保存在本身服务器中。要求HTML包含标题、做者和来源,而且保留文章的排版格式。css 2. 实现方案       经过Jsoup访问URL,得到DOM,而后解析出标题、正文等。因为公众号文章的css样式都相同,因此将style保存在服务器中,经过 <link href="…">的方式引入css文件。      文章中的图片先下载到服务器当
相关文章
相关标签/搜索