C#汉字转拼音(支持多音字)

  以前因为项目须要,中间须要一个汉字转拼音和首拼的功能来作查询,感受这种功能基本已经成熟化了,因而查找了相关的代码,首先引入眼帘的是下面两篇文章html

     1.C# 汉字转拼音(支持GB2312字符集中全部汉字)git

     2.【干货】JS版汉字与拼音互转终极方案,附简单的JS拼音输入法github

  感谢两位博主,写的比较全也很详细,都有提供源码,你们能够参考下。api

  因为考虑到接口的须要,因而参考了 第一篇,文章中做者的源码基本能知足汉字转拼音的须要,对于其余特殊的字符,也能够在进行添加补充,不足之处就是不支持多音字,因为须要支持多音字的查询,因此后面有查了下其余的文章,发现尚未现成的文章(也可能本人的搜索水平比较水)。后来查找发现对于汉字转拼音,原来微软已经提供了 Microsoft Visual Studio International Pack ,并且很强大。因而试了一下学习

首先在nuget引用对应的包

 查找 PinYinConverterspa

简单的demo

小试一下,使用也很是简单,只要直接使用ChineseChar类进行装换就好code

1             string ch = Console.ReadLine();
2             ChineseChar cc = new ChineseChar(ch[0]);
3             var pinyins = cc.Pinyins.ToList();
4             pinyins.ForEach(Console.WriteLine);

结果以下:htm

  咱们能够看到, 行 的多音字有 hang,heng,xing 三个,这里连音标也出来了,确实很方便。而我须要的功能是输入 银行 ,而后转换为拼音是 yinhang,yinheng,yinxing,  首拼是 yh,yx。有ChineseChar 这个类的话作起来思路就简单了。blog

 汉字转拼音类封装

  1.首先对输入的汉字进行拆分接口

  2.接着每一个汉字用ChineseChar 获取多个拼音

  3.而后除去数字,去重,提取首字符,再在进行组合就行了

  因而写了个帮助类进行装换,代码以下:

 

 public class PinYinConverterHelp
    {
        public static PingYinModel GetTotalPingYin(string str)
        {
            var chs = str.ToCharArray();
            //记录每一个汉字的全拼
            Dictionary<int, List<string>> totalPingYins = new Dictionary<int, List<string>>();
            for (int i = 0; i < chs.Length; i++)
            {
                var pinyins = new List<string>();
                var ch = chs[i];
                //是不是有效的汉字
                if (ChineseChar.IsValidChar(ch))
                {
                    ChineseChar cc = new ChineseChar(ch);
                    pinyins = cc.Pinyins.Where(p => !string.IsNullOrWhiteSpace(p)).ToList();
                }
                else
                {
                    pinyins.Add(ch.ToString());
                }

                //去除声调,转小写
                pinyins = pinyins.ConvertAll(p => Regex.Replace(p, @"\d", "").ToLower());
                //去重
                pinyins = pinyins.Where(p => !string.IsNullOrWhiteSpace(p)).Distinct().ToList();
                if (pinyins.Any())
                {
                    totalPingYins[i] = pinyins;
                }
            }
            PingYinModel result = new PingYinModel();
            foreach (var pinyins in totalPingYins)
            {
                var items = pinyins.Value;
                if (result.TotalPingYin.Count <= 0)
                {
                    result.TotalPingYin = items;
                    result.FirstPingYin = items.ConvertAll(p => p.Substring(0, 1)).Distinct().ToList();
                }
                else
                {
                    //全拼循环匹配
                    var newTotalPingYins = new List<string>();
                    foreach (var totalPingYin in result.TotalPingYin)
                    {
                        newTotalPingYins.AddRange(items.Select(item => totalPingYin + item));
                    }
                    newTotalPingYins = newTotalPingYins.Distinct().ToList();
                    result.TotalPingYin = newTotalPingYins;

                    //首字母循环匹配
                    var newFirstPingYins = new List<string>();
                    foreach (var firstPingYin in result.FirstPingYin)
                    {
                        newFirstPingYins.AddRange(items.Select(item => firstPingYin + item.Substring(0, 1)));
                    }
                    newFirstPingYins = newFirstPingYins.Distinct().ToList();
                    result.FirstPingYin = newFirstPingYins;
                }
            }
            return result;
        }
    }

 

调用方式:

                Console.WriteLine("请输入中文:");
                string str = Console.ReadLine();
                var pingyins = PinYinConverterHelp.GetTotalPingYin(str);
                Console.WriteLine("全拼音:" + String.Join(",", pingyins.TotalPingYin));
                Console.WriteLine("首音:" + String.Join(",", pingyins.FirstPingYin));
                Console.WriteLine();

结果:

目前试过一些生僻字都是能支持,对于一些太偏的还没试过,不过对于通常汉字转拼音的,多音字支持这里就已经足够了。

这里仅仅是使用了 Microsoft Visual Studio International Pack 这个扩展包里面的汉字转拼音功能,其实里面还有中文、日文、韩文、英语等各国语言包,并提供方法实现互转、获、获取字数、甚至获取笔画数等等强大的功能,有兴趣的朋友能够自行查询下它的api

源码分享

  分享是一种美德,有时候牛逼的文章能够提升咱们的技术层面,但有时候更多的需求是业务层面,不少小知识应用的分享却能够帮咱们提升业务层面的问题。只要分享的知识点有用,不误人子弟,哪怕大小都是一种学习,因此也但愿你们能敢于分享。

  最后,源码分享出来给你们,若是有错误和不足的地方,也但愿指正

  地址:https://github.com/qq1206676756/PinYinParse

相关文章
相关标签/搜索