python爬虫坑

错误提示以下:

'latin-1' codec can't encode character '\u014d' mysql

问题缘由:

爬取到的数据中含有特殊字符,存入数据库时出错。sql

解决办法:

connection = pymysql.connect(
            host = '1.1.1.1',#主机名
            user = 'xxx',#用户名
            password = 'xxx',#密码
            db = 'test',#数据库
            use_unicode = True,
            charset = 'utf8'#数据库字符集
        )

在使用pymysql链接数据库的过程当中,connection配置中须要加入charset=utf8属性,不然爬取到的数据存入数据库时有字符集编码问题。

相关文章
相关标签/搜索