摘要 : XPath Helper能够支持在网页点击元素生成xpath,整个抓取使用了xpath、正则表达式、消息中间件、多线程调度框架的chrome插件。正则表达式
xpath:是一门XML和HTML文档中查找信息的语言,可用来在XML和HTML 文档中对元素和属性进行遍历chrome
下载地址:https://pan.baidu.com/s/18iF5xI19AC7mvAXA8ZWqMw浏览器
1、安装多线程
下载后打开chrome浏览器中的扩展程序,把文件拖入便可安装框架
2、使用spa
1.打开网页后,快捷键:ctrl + shift + x 使用插件插件
2.按住ctrl + shift ,而后移动鼠标就能够选择页面上的元素,仍是很是方便的被选中的元素会显示不一样的颜色,query窗口中显示的就是xpath的值,选完之后放开ctrl 和shift键就能够了线程
打开以后如图所示:是一个黑色的窗体,左边显示query,右边显示result中间件
3.xpath helper除了能够获取页面元素的xpath地址,也能够验证用户本身写的xpath地址是否正确。query窗口能够手动输入和修改xpath地址。blog
如何判断输入的地址是正确的呢:
一、result窗口有显示对应的内容,而不是null
二、页面中对应的元素会变成黄色
复合以上两点,说明xpath写对了