记录一些特殊字符

名称 unicode编码 描述
全角空格 u{3000} 输出为整数 12288 trim时不会过滤
LF: 换行(Line Feed) \n \u{a} 输出为整数 10
CR: 回车(Carriage Return) \r \u{d} 输出为整数 13

苹果系统下换行符是 \r,其content.trimmingCharacters(in: CharacterSet.whitespacesAndNewlines) 方法不会过滤\n。html

3F 字符编码时,若是该编码方式的字符集中没有该字符,当把编码后的字节数据16位输出时, 就会显示为一排排的3F,参见 文本的编码方式整理java

FEFF UTF-8+BOM 中的BOM,用于标识bigEndian仍是littleEndian,文本编码时若是带bom,能够轻松识别它是否是utf-8,utf-16,utf-32。
vs 新建的文件默认不带bom的,由于+BOM有时会引发平台间数据解析的问题。json

assii码表中0~31及127(共33个)是控制字符或通讯专用字符,是非可打印字符,向网页传输时,若是不对它们进行转义会致使浏览器json解析失败,通常采用unicode编码,则页面显示时不须要解码。正常表单编辑通常碰不到这类字符,但若是内容是从word文件中导入或其余相似操做,则可能碰到这钟问题。浏览器

相关文章
相关标签/搜索