爬虫、网页分析解析辅助工具 Xpath-helper

参考:http://blog.csdn.net/su_tianbiao/article/details/52735399html

 

内容:chrome

每个写爬虫、或者是作网页分析的人,相信都会由于在定位、获取xpath路径上花费大量的时间,甚至有时候当爬虫框架成熟以后,基本上主要的时间都花费在了页面的解析上。在没有这些辅助工具的日子里,咱们只能经过搜索html源代码,定位一些id去找到对应的位置,很是的麻烦,并且常常出错。这里介绍一个chrome的xpath辅助插件给你们。浏览器

先给到下载连接:xpath-helper框架

 

安装好以后,咱们从新打开浏览器,按ctrl+shift+x就能调出xpath-helper框了。界面以下:工具

爬虫、网页分析解析辅助工具 Xpath-helper-xge技术博客

若是咱们要查找某一个、或者某一块元素的xpath路径,能够按住shift,并移动到这一块中,上面的框就会显示这个元素的xpath路径,右边则会显示解析出的文本内容,而且咱们能够本身改动xpath路径,程序也会自动的显示对应的位置,能够很方便的帮助咱们判断咱们的xpath语句是否书写正确。.net

虽然这个小插件使用很是方便,但它也不是万能的,有两个问题:插件

  1.XPath Helper 自动提取的 XPath 都是从根路径开始的,这几乎必然致使 XPath 过长,不利于维护;htm

  2.当提取循环的列表数据时,XPath Helper 是使用的下标来分别提取的列表中的每一条数据,这样并不适合程序批量处理,仍是须要人为修改一些相似于*标记等。blog

不过,合理的使用Xpath,仍是能帮咱们省下不少时间的!get

相关文章
相关标签/搜索