java爬取360doc中的pdf文档

文章目录 前言 网站分析 图片获取 合成pdf 前言 辛辛苦苦地找到了自己需要的答案,但却无法下载,便打算分析一下网站将内容爬取出来,自己简单实现了自己的需求,现在把代码拿出来分享分享。 网站分析 好不容易在360doc中找到了完整版的答案,更值得高兴的是,它的结构很简单,图片没有百度文库那样反爬措施;这也是为什么我用java来爬取的原因之一。 从上图不难看出,src指向的就是需要的图片,而文件名
相关文章
相关标签/搜索