最近作毕设要用到ICTCLAS分词系统,记录一下这个过程当中碰到的问题,但愿能有些同窗带来帮助。 java
一、准备工做 git
下载下面两个包 github
分词系统包:http://ictclas.nlpir.org/newsdownloads?DocId=352 web
补丁包:http://ictclas.nlpir.org/newsdownloads?DocId=353 编码
二、环境搭建 code
基本的java运行环境就不说了,主要说一下搭建一个基本的ICTCLAS分词环境 get
2.1 新建java工程ICTCLAS(是java工程,不是java web 工程,貌似路径上有些差异) it
2.2 将将分词系统包解压,将Data、test两个文件夹拷进工程的根目录 class
2.3 将补丁包解压,将NLPIR_JNI.dll拷进工程根目录,将kevin文件夹和TestNLPIR.java文件拷进工程个src 目录下 test
目录结构以下:
2.4对TestJLPIR.java内容做以下修改:
(1)将31行改为这样:
String argu = ".";
//初始化分词组件 String argu1 = "./test/test.TXT"; String argu2 = "./test/test_result1.TXT";
出现过的问题:
1)运行结果输出Init Fail!,这个通常是有Data包跟其它的几个文件不匹配所致,建议分词包和补丁包都用最新的包
2)程序报平台错误,这是因为使用的dll文件与平台不一致致使的。要下载相应平台的文件创建工程。
PS:附件是搭建好的源代码
https://github.com/liangxiao0315/ICTCLAS--win7-64-java-----.git