【Web crawler】爬虫之百度首页

时间 2019-11-17

原文原文链接

刚开始学习爬虫，照着教程手打了一遍，仍是蛮有成就感的。使用版本：python2.7python

*注意：python2的默认编码是ASCII编码而python3默认编码是utf-8python2.7

import urllib2

url = "http://www.baidu.com"
response = urllib2.urlopen(url)
print response.read().decode('utf-8')

不过建议你们不要像上面那样写，这样写最好：学习

#定义须要用到的库urllib2
 import urllib2

#定义URL，构建请求
url = "http://www.baidu.com"
request = urllib2.Request(url)

#返回
 response = urllib2.urlopen(request)

#打印返回的数据
 print response.read().decode('utf-8')

1. Java爬虫百度首页
2. Web-Crawler（爬虫基础）
3. web前端之百度首页仿写
4. 百度文库爬虫之ppt爬虫
5. 爬虫:php实现百度首页书签的获取,以及百度首页书签的迁移
6. python爬虫之爬取百度音乐
7. php爬虫框架crawler
8. java简易爬虫Crawler
9. python简单爬虫爬取百度百科python词条网页
10. python爬虫之百度贴吧
更多相关文章...
• Web 网页验证 - 网站建设指南
• ASP.NET Web Pages - 全局页面 - ASP.NET 教程
• 算法总结-广度优先算法
• 算法总结-深度优先算法