最近项目中用到了简单的简繁转换,若是用OpenCC
过重了,因而搜到了 zhconv 这个库。python
zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。git
支持如下地区词转换:
程序员
zh-tw
台灣正體zh-hk
香港繁體zh-sg
马新简体zh-hans
简体zh-hant
繁體正好适合我不求转换质量的轻量需求,因此介绍给更多须要的人。github
并且虽然该项目stars不多,但中途发现做者还参与过维护jieba分词。编程
调用也很是简单微信
>>> from zhconv import convert
>>> convert('Python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'
复制代码
支持对地区化词语的转换学习
>>> convert('计算机软件', 'zh-tw')
'計算機軟體'
>>> convert('計算機軟體', 'zh-hans') # zh-hans只是逐字转换
'计算机软体'
>>> convert('計算機軟體', 'zh-cn')
'计算机软件'
复制代码
支持 MediaWiki 人工转换语法spa
>>> from zhconv import convert_for_mw
>>> s = '張國榮曾在英國-{zh:利兹;zh-hans:利兹;zh-hk:列斯;zh-tw:里茲}-大学學習。'
>>> convert_for_mw(s, 'zh-hans')
'张国荣曾在英国利兹大学学习。'
>>> convert_for_mw(s, 'zh-hk')
'張國榮曾在英國列斯大學學習。'
>>> convert_for_mw(s, 'zh-tw')
'張國榮曾在英國里茲大學學習。'
复制代码
固然对于复杂高精度的转换需求,仍是建议用专业的OpenCC
开源库:code
微信公众号:面向人生编程cdn
编程思惟不该只存留在代码之中,更应伴随于整我的生旅途,这个公众号不仅聊技术,还会聊产品/互联网/经济学等普遍话题,因此也欢迎非程序员关注。