ICTCLAS分词系统在win7 64 java平台下环境搭建

最近作毕设要用到ICTCLAS分词系统,记录一下这个过程当中碰到的问题,但愿能有些同窗带来帮助。 java

一、准备工做 git

      下载下面两个包 github


      分词系统包:http://ictclas.nlpir.org/newsdownloads?DocId=352 web

       补丁包:http://ictclas.nlpir.org/newsdownloads?DocId=353 编码

二、环境搭建 code

     基本的java运行环境就不说了,主要说一下搭建一个基本的ICTCLAS分词环境 get

    2.1 新建java工程ICTCLAS(是java工程,不是java web 工程,貌似路径上有些差异) it

    2.2 将将分词系统包解压,将Data、test两个文件夹拷进工程的根目录 class

    2.3  将补丁包解压,将NLPIR_JNI.dll拷进工程根目录,将kevin文件夹和TestNLPIR.java文件拷进工程个src            目录下 test

     目录结构以下:

   

          2.4对TestJLPIR.java内容做以下修改:

              (1)将31行改为这样:

String argu = ".";



              (2)将48-49两行改为这样:
//初始化分词组件
			String argu1 = "./test/test.TXT";
			String argu2 = "./test/test_result1.TXT";



        如今,应该就能够运行程序了。可能会出现乱码的问题,这个只须要将java编码改一下就行了。


       出现过的问题:

       1)运行结果输出Init Fail!,这个通常是有Data包跟其它的几个文件不匹配所致,建议分词包和补丁包都用最新的包

      2)程序报平台错误,这是因为使用的dll文件与平台不一致致使的。要下载相应平台的文件创建工程。


      PS:附件是搭建好的源代码

https://github.com/liangxiao0315/ICTCLAS--win7-64-java-----.git

相关文章
相关标签/搜索