【python写爬虫】HTML网页学习和Xpath网络元素定位

计划自行写一个python爬虫程序,需要了解以下两个方面的内容: 1.HTML,了解网页结构、内容,帮助后续数据读取 2.HTTP协议,TCP/IP协议。了解网络请求和网络传输原理,帮助理解爬虫的逻辑。 一、首先学习了HTML 1.分享链接:http://www.runoob.com/html/html-tutorial.html 这上面内容很全 2.着重看了HTML的元素和属性,因为读取网页内容
相关文章
相关标签/搜索