如何编译运行HanLP天然语言处理包

master分支java

对于master分支,编译方法以下:git

git clone  https://github.com/hankcs/HanLP.gitgithub

mvn install -DskipTests单元测试

 

·因为目前一些test不够规范,使用了硬编码路径下的资源,因此暂时跳过单元测试。测试

·该方法不会将src/main/resources目录下的任何资源(包括hanlp.properties)打包进jar,若是须要打包资源文件,请切换到portable分支。编码

portable分支spa

git checkout portable命令行

而后将须要的data放入src/main/resources,最后执行:blog

 

mvn install -DskipTestsip

运行jar

目前jar包中有一些模块能够命令行执行,以感知机词法分析器为例。因为这些模块通常须要加载外部data,因此须要在运行时指定hanlp.properties。运行时,一个典型的目录结构以下:

·此处只列出了重要的目录。

·一个良好的实践是把hanlp.properties放到resources目录下。

 

命令行须要指定jar包和hanlp.properties所在的目录:

 

$ java -cp target/hanlp-1.6.0.jar:src/main/resources  com.hankcs.hanlp.model.perceptron.Main -test \

<<< '华安集团胡花蕊来到纽约艺术博物馆参观'

[华安/nz 集团/n]/nt 胡花蕊/nr 来到/v [纽约/ns 艺术/n 博物馆/n]/ns 参观/v

 

·Windows用户请使用分号java -cp target/hanlp-1.6.0.jar;src/main/resources

相关文章
相关标签/搜索