10/27python学习

第13、14章没学 1、屏幕抓取是通过程序下载网页并从中提取信息的过程。从概念上讲,这项技术需要下载数据并对其进行分析。例如,可使用urllib来获取网页的HTML代码,再使用正则表达式或其他技术从中提取信息 2、Tidy是用于对格式不正确且不严谨的HTML进行修复的工具。 有多个用于python的Tidy库包装器,可从Tidy网站(http://html-tidy.org)获取可执行的二进制版本
相关文章
相关标签/搜索