Python_爬虫

1.什么是爬虫? 就是在互联网上一直爬行的蜘蛛,如果遇到需要的资源,那么它就会抓取下来(html内容); 模拟浏览器快速访问页面的内容。 2.浏览网页的过程中发生了什么? 浏览器输入 http://www.baidu.com/bbs 1). 根据配置的DNS获取www.baidu.com对应的主机IP; 2). 根据端口号知道跟服务器的那个软件进行交互; 3). 百度的服务器接收客户端请求; 4)
相关文章
相关标签/搜索