天然语言处理工具hanlp 1.7.3版本更新内容一览

HanLP 1.7.3 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及天然语言处理在生产环境中的应用。HanLP 具有功能完善、性能高效、架构清晰、语料时新、可自定义的特色。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用很是方便,同时自带一些语料处理工具,帮助用户训练本身的模型。算法

 

新版更新内容:架构

 

1.感知机词法分析器默认使用98年人民日报6个月的大模型工具

2.优化DoubleArrayTrie fix #1136性能

3.防止ViterbiSegment.dat没必要要的初始化优化

4.修复词法分析器对动态插入的词条的处理 fix #271 (comment)spa

5.词法分析器seg接口支持自定义词性覆盖统计词性 fix #1156blog

6.修订拼音接口

7.新数据包data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949ip

8.Portable版同步升级到v1.7.3md5

        <dependency>

            <groupId>com.hankcs</groupId>

            <artifactId>hanlp</artifactId>

            <version>portable-1.7.3</version>

        </dependency>

相关文章
相关标签/搜索