前端就有了对 headless 浏览器的需求,最多的应用场景有两个javascript
也就有了不少杰出的实现,前端常用的莫过于 PhantomJS 和 selenium-webdriver,但两个库有一个共性——难用!环境安装复杂,API 调用不友好,1027 年 Chrome 团队连续放了两个大招 Headless Chrome 和对应的 NodeJS API Puppeteer,直接让 PhantomJS 和 Selenium IDE for Firefox 做者宣布不必继续维护其产品.html
如同其 github 项目介绍:Puppeteer 是一个经过 DevTools Protocol 控制 headless chrome 的 high-level Node 库,也能够经过设置使用 非 headless Chrome前端
咱们手工能够在浏览器上作的事情 Puppeteer 都能胜任java
PuppeteerSharpgit
Puppeteer Sharp是官方Node.JS Puppeteer API的.NET 移植github
这个项目很活跃,你们能够经过做者博客上获取更新记录 http://www.hardkoded.com/web
博客园里有一篇文章 PuppeteerSharp+AngleSharp的爬虫实战之汽车之家数据抓取:https://www.cnblogs.com/VAllen/p/PuppeteerSharp-AngleSharp-CrawlerSamples.html 更详细的介绍了如何使用PuppeterSharp。在github上还有一个PuppeterSharp的扩展项目:https://github.com/hlaueriksson/puppeteer-sharp-contrib chrome
相关文章:docker