字符集及其存储方式(解决乱码问题)

在我们进行文本挖掘或处理文档时,都要面临一个最最基本的问题->就是解决乱码问题。在此,介绍最本质的字符编码。 我们熟悉的有三种:ASCII字符集,中文字符集(GBK),Unicode字符集   ASCII字符集 故事:        美国信息交换标准代码,这是计算机上最早使用的通用的编码方案。那个时候计算机还只是拉丁文字的专利,根本没有想到现在计算机的发展势头,如果想到了,可能一开始就会使用uni
相关文章
相关标签/搜索