python网络爬虫及正则表达式

最简单的爬取网页内容html #coding=utf-8 import re import urllib # 读取url内容 def getHtml(url): page = urllib.urlopen(url) html = page.read() return html html = getHtml("http://www.baidu.com/") print ht
相关文章
相关标签/搜索