爬虫中常见的字符串编码问题

先来说一说编码问题的历史(不感兴趣的童鞋可以直接跳过,直接看重点部分) 由于计算机是美国人发明的,所以一开始的编码格式采用美国人制定的ASCII码,用一个字节(Byte)存储常用的英文字母和字符,前期用了128个字符,后来加入了一些欧洲国家的符号,使用的就是128-255这一段的字符,所以这时使用了256个字符。 再到后来随着计算机的普及,越来越多的国家在使用的过程中发现现有的这一套编码系统不能满
相关文章
相关标签/搜索