HanLP 1.7.3 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及天然语言处理在生产环境中的应用。HanLP 具有功能完善、性能高效、架构清晰、语料时新、可自定义的特色。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用很是方便,同时自带一些语料处理工具,帮助用户训练本身的模型。算法
新版更新内容:架构
1.感知机词法分析器默认使用98年人民日报6个月的大模型工具
2.优化DoubleArrayTrie fix #1136性能
3.防止ViterbiSegment.dat没必要要的初始化优化
4.修复词法分析器对动态插入的词条的处理 fix #271 (comment)spa
5.词法分析器seg接口支持自定义词性覆盖统计词性 fix #1156blog
6.修订拼音接口
7.新数据包data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949ip
8.Portable版同步升级到v1.7.3md5
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.3</version>
</dependency>