由文件导出乱码引起对字符编码的思考

之前在工做中遇到导出中文乱码时,就google一下,看见把utf-8编码换成GBK之类的编码,导出在Excel中打开就不会乱码了。只是解决了当前问题。对字符编码没有很好的认识。此次又遇到了,遂记录之。html

参考的资料:
https://my.oschina.net/leejun...
http://www.ruanyifeng.com/blo...mysql

前辈们已经对字符编码讲的很好了,通俗易懂。我就简单的整理下用本身的话复述一遍。
一、咱们为何须要字符集和字符编码?
计算机只认识0和1,不认识其余任何字符。而计算机是为人服务的,是人就有沟通语言,有语言就有语言符号,要实现普通人与计算机沟通,字符编码就必然出现了,同理,各类语言就会有不一样编码方式的字符编码。字符编码的诞生是人类对科学技术妥协的结果。
二、是谁主导字符编码?
老美,计算机是老美发明的,尽管如今全世界开放双赢,做为先驱者在必定程度上具备话语权(不服?有本事你也搞个革命性的发明来)。后来者也只能依据他来制定,这是历史包袱,任什么时候代都没法改变。他根据他们的语言特点,美国国家标准学会(American National Standard Institute , ANSI )制定了 ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)编码。我建议:不只记住缩写,要记住全称。
三、字符编码为何有不少方式。
全世界都知道计算机好,都要用了。咱们知道,语言成为不一样国家、民族最鲜明的特征之一。怎么办,每一个国家本身都制定一套相似ASCII码的编码,就是咱们常说的 GBK、GB23十二、BIG五、Unicode等等。原理同样,只是对应规则不一样而已。
四、Unicode 万国码(是一种字符集)
顾名思义:就算你有一万个国家,有一万种语言字符。我也能装得下。你们只要生活在地球上,只要使用计算机,突破语言限制,使用此种字符集。
五、在当前实际运用过程当中,最广泛用到的是UTF-8方式的编码。sql

以上作个简单的总结。这是从计算机层面整体上对字符编码的认识。
有时间我会总结一篇关于mysql中一些字符相关知识。google

二、mysql中的一些字符集、字符编码知识编码

相关文章
相关标签/搜索