python自带的用于解析HTML的库HtmlParser

HtmlParser,顾名思义,是解析Html的一个工具。python自带的。 一、常用属性和方法介绍 HtmlParser是一个类,在使用时一般继承它然后重载它的方法,来达到解析出需要的数据的目的。 1.常用属性: lasttag,保存上一个解析的标签名,是字符串。 2.常用方法: handle_starttag(tag, attrs) ,处理开始标签,比如< div>;这里的attrs获取到的
相关文章
相关标签/搜索