python网络爬虫笔记之信息提取

信息组织与提取 一、信息标记 HTML:           通过预定义的<>..</>标签形式来组织不同类型的信息 信息标记的种类有三种 Xml,JSON,YAML Xml: 扩展标记语言,与html格式很像          通过 标签形式来构造所有的信息,如果标签中有内容时我们用一对标签来表达: <name>...</name>           如果标签中没有内容时,我们用一对尖括号来表
相关文章
相关标签/搜索