Rendertron:谷歌 Chrome 新的 headless 模式又贡献了一个新的技巧

摘自:https://zhuanlan.zhihu.com/p/31670033服务器

Rendertron:JavaScript Web 富应用的一个老问题是如何使这些页面的动态渲染部分可供搜索引擎检索。为此开发人员采用了各类各样的技巧,包括使用 React.js 的服务端渲染,外部服务或预渲染内容。如今谷歌 Chrome 新的 headless 模式又贡献了一个新的技巧—— Rendertron,即 Chrome的headless 渲染解决方案。它在一个 Docker 容器中封装了一个 headless 的 Chrome 实例,能够做为独立的HTTP服务器来部署。没法渲染JavaScript的爬虫机器人能够被路由到此服务器来进行渲染。 虽然开发人员也能够部署本身的 headless Chrome代理并配置相关的路由机制,但 Rendertron 简化了配置和部署过程,并提供了令爬虫机器人进行检测和路由的中间件示例代码。并发

谷歌 Chrome 新的 headless 模式:less

有一个业务,就是服务器端抓图(把一件事简单作出来容易,把一件事作到极致真不容易):搜索引擎

有两种思路:阿里云

用Selenium启动FireFox(Chrome),要想处理多用户并发问题,解决办法就是用Selenium Grid,阿里云端加机器,就会增长成本。如今能够考虑启动多个无头模式的Chrome,来提升一些效率了。代理

也能够改造F2Test这个方案,可是须要熟悉NodeJs,而且须要作大量的改造工做,时间成本较高。中间件

相关文章
相关标签/搜索