r与java整合(转)

http://jliblog.com/archives/10java

R是统计计算的强大工具,而JAVA是作应用系统的主流语言,二者自然具备整合的须要。关于整合,一方面,R中能够建立JAVA对象调用JAVA方法,另外一方面,JAVA中能够转换R的数据类型调用R的函数,互相取长补短。如今也有一个项目JGR,用JAVA作R的图形界面,能够实现高亮显示自动补全等,还能让JAVA和R互相调用。服务器

  关于R中调用JAVA,我想主要是为了利用其面向对象的特性,毕竟R语言近来很致力于向面向对象发展,有个很好的项目rJava能够实现,在www.rforge.net/rJava上。R中调JAVA对我彷佛意义不大,本文主要介绍JAVA中调用R。全部测试都在Windows XP、R2.10.1和JDK1.6下完成。eclipse

  JAVA很适合开发应用系统,可是数学建模和计算能力非其所长,若是该系统须要进行大量的统计或者优化的计算,调用R是一种很好的方式。JAVA负责系统的构建,R用来作运算引擎,从而实现应用型和分析性相结合的系统。函数

  首先要介绍的是Rserve的方式,这是一个基于TCP/IP的服务器,经过二进制协议传输数据,能够提供远程链接,使得客户端语言可以调用R。目前Rserve做为一个package发布在CRAN上,能够直接使用install.packages("Rserve")进行安装。须要使用时在R控制台下加载该包,而后输入命令Rserve(),开启服务器,就能够供客户端调用。工具

  其客户端能够有多种,这里只介绍JAVA客户端。最先的客户端包是JRclient,在www.rosuda.org/Rserve上还能够下载到,可是如今该项目所有移到了www.rforge.net/Rserve,使用REngine做客户端(和JRI一致),在该网站下能够下载到REngine.jar和RserveEngine.jar两个文件。若是用eclipse开发的话,在工程属性中导入这两个外部的jar包,就能够正常使用了。oop

  一个简单的例子:性能

public class rtest {
  public static void main(String[] args) throws REXPMismatchException, REngineException {
    RConnection c = new RConnection();
    REXP x = c.eval("R.version.string");
    System.out.println(x.asString());
  }
}

 首先创建一个新的链接,而后就可使用eval之类的方法将R中的表达式传到服务器端,经过R求值后传回JAVA中REXP类型的变量,而后打印出来,整个过程很是简单。因为不须要对R进行初始化,所以速度会比较快。在其余系统下能够同时创建多个链接,可是在Windows下只容许同时打开一个链接,后续的链接都会共有相同的命名空间。官网上不建议在Windows下使用Rserve,由于会丧失不少性能,他们推荐能够考虑DCOM的方式。不过DCOM那个工程没有现成的jar包可用,其实若是是拿R作分析系统中的运算引擎,单链接够用了。测试

  另外一种方式是JRI,全名是Java/R Interface,这是一种彻底不一样的方式,经过调用R的动态连接库从而利用R中的函数等。目前该项目已经成了rJava的子项目,再也不提供单独的JRI的版本。所以使用时简单地经过install.packages("rJava")安装rJava就行,在安装文件夹中,能够看到一个jri的子文件夹,里面有自带的例子能够用来测试。优化

  装好后要修改系统的环境变量,在PATH中添加%R_HOME%bin和%R_HOME%libraryrJavajri,注意R_HOME的路径要正确,重启系统使之生效。使用时一样在eclipse里导入外部的jar包(在www.rforge.net/rJava下载JRI.jar、REngine.jar和JRIEngine.jar这三个文件),在rJava包安装目录下的jriexamples里有现成的例子(rtest.java和rtest2.java),能够测试是否成功。网站

  以前个人电脑上一直存在一个很奇怪的问题,测试第一个例子时在“Creating Rengine (with arguments)”的时候就停住了,第二个例子中一个JAVA框很快闪一下就消失了,控制台中没有任何提示。打开JGR也是一闪即逝。在网上查了好久,只有一个印度哥们也遇到过相似的问题,并且没有找到解决办法。估计应该是实现RMainLoopCallbacks时出了问题,可是找不到缘由,后来卸载了R2.9.0重装了R2.10.1,而且经过install.packages安装,终于没问题了,多是主程序和Package之间的版本冲突,之后记住所有用install.packages来安装package了。

  关于客户端服务器的方式和动态连接库的方式,各有所长,按照须要选用。我的经验,无论使用哪一种方式,设计时尽可能少进行频繁的数据的交互,在逻辑上把系统和计算分开,使得R成为一个纯粹的运算引擎。

相关文章
相关标签/搜索