【中文编码】使用Python处理中文时的文字编码问题

0x00 正文 最近,在处理中文编码的数据的时候,遇到了一些仍是使人头疼的问题。 乱码! 乱码!! 乱码!!! 稍微整理一下处理过程,顺带着记录一下解决方案啥的……html 0x01 文本转码 最初,拿到不少GB2312(Simplify)编码的HTML文件,稍微有点头疼,由于在Shell里打开一看,都是下面这样奇怪的东西python <p><span style="font-family: ;
相关文章
相关标签/搜索