原由:从一段代码提及html
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; namespace Test { class Program { static void Main(string[] args) { string temp = "1610MM001A衫片"; foreach (Char item in temp) { if (char.IsLetter(item)) { Console.WriteLine(item); } } Console.ReadKey(); } } }
这段代码的输出 spa
本来觉得是“MMA”,为何汉子“衫片”也是?code
F12,看一下orm
那么什么是Unicode(参见http://www.cnblogs.com/John-Marnoon/p/5825906.html),htm
那么,Unicode Letter都包括什么呢?blog
首先,查一下微软的Char.IsLetter 方法 (String, Int32)unicode
https://msdn.microsoft.com/zh-cn/library/zff1at55(v=vs.110).aspxstring
其次,看一下IsLetter的源代码it
进一步看看CheckLetter方法io
大写字母、小写字母、标题字母(首字母大写)、修饰语字母、其余字母。
由于各个国家的语言都不同,例若有的语言是带声调的。因此仅从我的理解以及涉及到的应用范围,这个unicode letter应该是全部汉字+英文字母,数字和符号大多不包括在内。
可是也有例外。。。。
例以下面就会让你蒙圈了。。。 哈哈哈
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; namespace Test { class Program { static void Main(string[] args) { bool a1 = char.IsLetter('!'); bool a2 = char.IsLetter('ǃ'); bool b1 = char.IsLetter('|'); bool b2 = char.IsLetter('ǀ'); Console.WriteLine(a1); Console.WriteLine(a2); Console.WriteLine(b1); Console.WriteLine(b2); Console.ReadKey(); } } }
若有错误,还请不吝指教。
附录
这五类具体包括什么,请查询 http://www.fileformat.info/info/unicode/category/index.htm