python爬虫(五):实战 【3. 使用正则来爬创客实验室】

依然爬取创科实验室网站中讲座的信息(只爬标题,其它同) 但技术上采用requests+正则表达式   思想: #通过正则表达式,获取讲座标题 规则:<h3>中文字符出现4次 任意字符</h3> m = str(re.findall('<h3>[\u4e00-\u9fff]{4}.+</h3>',html)) # str转换为字符,分割两次得到讲座标题 n = m.split(':')[1].spl
相关文章
相关标签/搜索