csdn 首页 博文 繁體版
原文   原文链接
刚学爬虫时,爬取了csdn博文,遇到了一个问题,就是正则表达式 须要的是h2标签里面那个url 因而就让pat = '<a href=(.*?)\s+target="_blank"',可是会匹配到多余的东西,便让h2做为惟一标识,^\s*$匹配空行(也尝试\s+?匹配空格),因而pat = '<h2>^\s*$<a href=(.*?)\s+target="_blank",但什么也没有匹配到,便直
>>阅读原文<<
相关文章
相关标签/搜索
每日一句
    每一个你不满意的现在,都有一个你没有努力的曾经。
本站公众号
   欢迎关注本站公众号,获取更多信息