url中有空格等特殊字符及中文字符处理

在做爬虫时,爬下来的书籍的URL地址各式各样,什么情况都有。 有的url地址既有中文,又有%20 空格等特殊字符。如 http://www.ishareread.com/book/2018/不成问题的问题%20-%20老舍.mobi 如果是在url中有中文需要转码,但转码后会将%号替换成%25,导致url不能访问了。 解决的办法,先判断url中是否有中文,如果有中文,则替换特殊字符,再进行转码。
相关文章
相关标签/搜索