今天在工做中遇到一个问题,table下有不少tr, tr下有不少td, td下有的有div,有的没有,可是每一个tr下的文本得拿出来放在一块,而后我使用html
l = doc.xpath('/html/body/div[3]/div[1]/div[1]/table')[0]htm
个人想法是将table下全部的标签拿出来,既将全部的tr单独拿出来放到一个列表当中再在每一个tr中取值blog
我以前一直不理解为何这里要加【0】,后来我查看Xpath语法,再将获取的值打印出来,发现这里取的level值其实就是一个列表,只不过当中只有一个值,这个值就是全部tr标签组成的一个列表,使用[0]只不过是拿到这个列表而已,而后再遍历整个列表就拿到每一个标签的html,而后对每一个标签的html取值,这样每一个tr下的值就拿出来了ip