Python 轻量化简繁转换

最近项目中用到了简单的简繁转换,若是用OpenCC过重了,因而搜到了 zhconv 这个库。python


zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。git

支持如下地区词转换:
程序员

  • zh-tw 台灣正體
  • zh-hk 香港繁體
  • zh-sg 马新简体
  • zh-hans 简体
  • zh-hant 繁體


正好适合我不求转换质量的轻量需求,因此介绍给更多须要的人。github

并且虽然该项目stars不多,但中途发现做者还参与过维护jieba分词。编程


调用也很是简单微信

>>> from zhconv import convert
>>> convert('Python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'
复制代码


支持对地区化词语的转换学习

>>> convert('计算机软件', 'zh-tw')
'計算機軟體'
>>> convert('計算機軟體', 'zh-hans') # zh-hans只是逐字转换
'计算机软体'
>>> convert('計算機軟體', 'zh-cn')
'计算机软件'
复制代码


支持 MediaWiki 人工转换语法spa

>>> from zhconv import convert_for_mw
>>> s = '張國榮曾在英國-{zh:利兹;zh-hans:利兹;zh-hk:列斯;zh-tw:里茲}-大学學習。'
>>> convert_for_mw(s, 'zh-hans')
'张国荣曾在英国利兹大学学习。'
>>> convert_for_mw(s, 'zh-hk')
'張國榮曾在英國列斯大學學習。'
>>> convert_for_mw(s, 'zh-tw')
'張國榮曾在英國里茲大學學習。'
复制代码


固然对于复杂高精度的转换需求,仍是建议用专业的OpenCC 开源库:code

https://github.com/BYVoid/OpenCC


欢迎关注


微信公众号:面向人生编程cdn

编程思惟不该只存留在代码之中,更应伴随于整我的生旅途,这个公众号不仅聊技术,还会聊产品/互联网/经济学等普遍话题,因此也欢迎非程序员关注。

相关文章
相关标签/搜索