Python_爬虫

时间 2021-01-08

原文原文链接

1.什么是爬虫? 就是在互联网上一直爬行的蜘蛛，如果遇到需要的资源，那么它就会抓取下来(html内容)；模拟浏览器快速访问页面的内容。 2.浏览网页的过程中发生了什么? 浏览器输入 http://www.baidu.com/bbs 1). 根据配置的DNS获取www.baidu.com对应的主机IP； 2). 根据端口号知道跟服务器的那个软件进行交互； 3). 百度的服务器接收客户端请求； 4)