python爬虫之html界面的信息表达形式(内容丰富,包含信息标记的组织形式,绝对是你听得懂的)

python爬虫之网页信息表达形式 爬到的html页面中信息那么多,你又不是那么专业,怎么获取到你想要的信息? 先普及一些关于html页面中信息的组成,下面是我截取的百度的网页源码组成部分,除了url是蓝色的,明显的有三种颜色不同,形式各异的标签语言,分别是XML,JSON,YAML XML 看单词就知道跟HTML很像,确实是从HTML语言发展过来的 XML成为扩展标签语言,主要以标签为主,组织信
相关文章
相关标签/搜索