Puppeteer
翻译是操纵木偶的人,利用这个工具,咱们能作一个操纵页面的人。Puppeteer
是一个Nodejs
的库,支持调用Chrome的API来操纵Web
,相比较Selenium
或是PhantomJs
,它最大的特色就是它的操做Dom
能够彻底在内存中进行模拟既在V8
引擎中处理而不打开浏览器,并且关键是这个是Chrome团队在维护,会拥有更好的兼容性和前景。node
2、Puppeteer
用处1.一、Puppeteer要求node版本不低于v6.4.0,可是async/await只在Node v7.6.0或更高的版本支持。chrome
1.二、须要最近版本的Chromium浏览器shell
1.Node.js 安装配置npm
2.Puppeteer安装api
经过npm安装:npm install puppeteer --save浏览器
因为封网,直接下载 Chromium
会失败,能够先阻止下载 Chromium
而后再手动下载它app
手动下载 Chromium,下载完后将压缩包解压,会有个 ,将其放在你喜欢的目录下,例如 。正常安装包后 会在 中
# 安装命令 npm i puppeteer --save # 错误信息 ERROR: Failed to download Chromium r515411! Set "PUPPETEER_SKIP_CHROMIUM_DOWNLOAD" env variable to skip download. # 设置环境变量跳过下载 Chromium set PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=1 # 或者能够这样干,只下载模块而不build npm i --save puppeteer --ignore-scripts # 成功安装模块 + puppeteer@0.13.0 added 1 package in 1.77s
Chromium.app/Users/huqiyang/Documents/project/z/chromium/Chromium.appChromium.app.local-chromium
Tip:下载 Chromium
失败解决办法less
Chromium
源PUPPETEER_DOWNLOAD_HOST=https://storage.googleapis.com.cnpmjs.org npm i puppeteer
cnpm
安装npm install -g cnpm --registry=https://registry.npm.taobao.org cnpm i puppeteer
安装 Jest:npm install --save-dev jestasync
Puppeteer
,截个图吧知识点工具
puppeteer.launch
启动浏览器实例browser.newPage()
建立一个新页面page.goto
进入指定网页page.screenshot
截图const puppeteer = require('puppeteer'); (async () => { const browser = await (puppeteer.launch({ // 如果手动下载的chromium须要指定chromium地址, 默认引用地址为 /项目目录/node_modules/puppeteer/.local-chromium/ executablePath: '/Users/huqiyang/Documents/project/z/chromium/Chromium.app/Contents/MacOS/Chromium', //设置超时时间 timeout: 15000, //若是是访问https页面 此属性会忽略https错误 ignoreHTTPSErrors: true, // 打开开发者工具, 当此值为true时, headless总为false devtools: false, // 关闭headless模式, 不会打开浏览器 headless: false })); const page = await browser.newPage(); await page.goto('https://www.jianshu.com/u/40909ea33e50'); await page.screenshot({ path: 'jianshu.png', type: 'png', // quality: 100, 只对jpg有效 fullPage: true, // 指定区域截图,clip和fullPage二者只能设置一个 // clip: { // x: 0, // y: 0, // width: 1000, // height: 40 // } }); browser.close(); })();