第二步 在D2RQ平台上配置jena环境

第二步 在D2RQ平台上配置jena环境
2013年10月16日 9:48:53
搞了这么长时间语义,只用过protege这样的工具,一直没有落实到实际代码上。jena也看过很久了,总认为是hp公司的东西算不上标准,如今看来,jena已是语义应用开发中最主流的工具了,我就此选择jena进行语义应用的开发了。
 
 
Getting started with Apache Jena

Apache Jena (or Jena in short) 是免费开源的java框架用于构建语义网应用和关联数据应用。这个框架包括不一样的处理RDF数据的API接口。若是你是菜鸟,你能够选择从下面的教程中开始,你也能够浏览感兴趣的主题文档。
 
Tutorials
居然发现有大牛已经作过翻译了,好吧,我转载在这里,我郑重声明转载了“april 1019”这位大牛的工做,

Jena文档《An Introduction to RDF and the Jena RDF API》的译文html

文档里包含的内容不少,仍是回到具体的配置上来。前端

 
Using the D2RQ Engine with Jena

 1. Jena Versions
    因为D2RQ内部嵌入了jena和SPARQL查询引擎,因此对jena和ARQ是敏感的。D2RQ只在相应的jena版本下工做。检索/lib/arq-X.Y目录下各包的版本,如下载合适的jena包。
    我下载的D2RQ是0.8.1,其/lib里面的jena的jar是2.7.0,因此从http://archive.apache.org/dist/jena/binaries/这里下载了apache-jena-2.7.0-incubating.tar.gz。仍是解压到/opt文件夹下。
 
2. 配置路径
    新建一个eclipse工程jena_test,而后右键-Build Path-Add Library-User Library,再把/opt/D2RServer/d2rq-0.8.1/lib下的d2rq-0.8.1.jar,添加入项目中。相似再添加commons-logging-1.1.jar和slf4j-api-1.6.4.jar到项目中,而后把/lib/db-drivers下的JDBC也加进来。
    D2RQ下载时会忽略一些Jena/ARQ jar,但这些jar也有能够会用到。能够把下载的放到这个lib中去。
 
3. Logging
    D2RQ经过Apache Commons Logging的API记录日志信息。D2RQ搭载了Apache log4j(见注1),但你也可使用不一样的前端日志。
为了获取D2RQ的调试信息,设置日志记录器的级别从de.fuberlin.wiwiss.d2rq改成ALL.简单的方法便是把/lib/logging的目录添加到构建路径中,新建一个文件log4j.properties,包括如下内容:
log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{HH:mm:ss} %-5p %-20c{1} :: %m%n
log4j.logger.de.fuberlin.wiwiss.d2rq=ALL
我在/lib/logging下新建了log4j.properties文件,复制了上面的内容,并把它也加到了项目中。
 
4. 经过jena模型的API使用D2RQ
ModelD2RQ类为D2RQ映射数据库中的数据提供了一个Jena的模型视图。
下面的例子经过使用一个预先建立的映射文件介绍ModelD2RQ是如何建立的,也介绍了如何用Jena API从模型中提取论文及做者信息。
// Set up the ModelD2RQ using a mapping file
Model m = new ModelD2RQ("file:doc/example/mapping-iswc.ttl");
 
// Find anything with an rdf:type of iswc:InProceedings
StmtIterator paperIt = m.listStatements(null, RDF.type, ISWC.InProceedings);
 
// List found papers and print their titles
while (paperIt.hasNext()) {
    Resource paper = paperIt.nextStatement().getSubject();
    System.out.println("Paper: " + paper.getProperty(DC.title).getString());
 
    // List authors of the paper and print their names
    StmtIterator authorIt = paper.listProperties(DC.creator);
    while (authorIt.hasNext()) {
        Resource author = authorIt.nextStatement().getResource();
        System.out.println("Author: " + author.getProperty(FOAF.name).getString());
    }
    System.out.println();
}
m.close();
其中ISWC和FOAF类在Jena的schemagen工具中建立了, DC and RDF类也是Jena的一部分。
 
5. 经过jena图的API使用D2RQ
    在一些状况中,最好用低水平的Jena图的API,而不是模型API,D2RQ提供图的接口的实现,即GraphD2RQ.
下面的例子是介绍图API来查找2003年发表的全部论文。
// Load mapping file
Model mapModel = FileManager.get().loadModel("doc/example/mapping-iswc.ttl");
 
// Parse mapping file
MapParser parser = new MapParser(mapModel, "http://localhost:2020/");
Mapping mapping = parser.parse();
 
// Set up the GraphD2RQ
GraphD2RQ g = new GraphD2RQ(mapping);
 
// Create a find(spo) pattern
Node subject = Node.ANY;
Node predicate = DC.date.asNode();
Node object = Node.createLiteral("2003", null, XSDDatatype.XSDgYear);
Triple pattern = new Triple(subject, predicate, object);
 
// Query the graph
Iterator<Triple> it = g.find(pattern);
 
// Output query results
while (it.hasNext()) {
    Triple t = (Triple) it.next();
    System.out.println("Published in 2003: " + t.getSubject());
};
g.close();
 
5.1 还有一个CachingGraphD2RQ
除了CachingGraphD2RQ,还有一个CachingGraphD2RQ可以提供相同的API,使用LRU(最近最少使用算法)
缓存记忆最近几个查询的结果。这会改进重复查询的效果,若是数据库在CachingGraphD2RQ类的使用期间发生改变的话,会报出数据的不一致性。
 
6. Executing SPARQL queries against a ModelD2RQ
D2RQ能够经过D2RQ模型响应SPARQL查询,下面的例子介绍D2RQ模型是如何建立的,以及SPARQL查询是如何执行的、结果是如何写入控制台的。
ModelD2RQ m = new ModelD2RQ("file:doc/example/mapping-iswc.ttl");
String sparql =
    "PREFIX dc: <http://purl.org/dc/elements/1.1/>" +
    "PREFIX foaf: <http://xmlns.com/foaf/0.1/>" +
    "SELECT ?paperTitle ?authorName WHERE {" +
    "    ?paper dc:title ?paperTitle . " +
    "    ?paper dc:creator ?author ." +
    "    ?author foaf:name ?authorName ." +
    "}";
Query q = QueryFactory.create(sparql);
ResultSet rs = QueryExecutionFactory.create(q, m).execSelect();
while (rs.hasNext()) {
    QuerySolution row = rs.nextSolution();
    System.out.println("Title: " + row.getLiteral("paperTitle").getString());
    System.out.println("Author: " + row.getLiteral("authorName").getString());
};
m.close();
 
7. The D2RQ Assembler
D2RQ自带Jena编译器,Jena编译器的规格是RDF的配置文件,文件描述了如何构建一个Jena模型。更多的Jena编译器的信息,请看 Jena Assembler quickstart page.
下面的例子介绍了D2RQ模型的编译规格
@prefix : <#> .
@prefix ja: <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix d2rq: <http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#> .
 
<> ja:imports d2rq: .
 
:myModel
    a d2rq:D2RQModel;
    d2rq:mappingFile <mapping-iswc.ttl>;
    d2rq:resourceBaseURI <http://localhost:2020/>;
    .
D2RQ模型规格支持下面两种特性:
d2rq:mappingFile:必要的,使用D2RQ的映射文件的URI来构建模型。
d2rq:resourceBaseURI:设置基础URI来代替相对URI模型,转变为全URI。若是不特指的话,D2RQ会特选择一个适当的基础URI。
下面的这种惯例用法,将从一个模型规范中建立一个D2RQ模型,并把它写入控制台。
// Load assembler specification from file
Model assemblerSpec = FileManager.get().loadModel("doc/example/assembler.ttl");
 
// Get the model resource
Resource modelSpec = assemblerSpec.createResource(assemblerSpec.expandPrefix(":myModel"));
 
// Assemble a model
Model m = Assembler.general.openModel(modelSpec);
 
// Write it to System.out
m.write(System.out);
 
m.close();
 
8. Javadoc API documentation
    Javadoc API documentation for the latest release is available.
 

 

 
注1:Log4j是Apache的一个开放源代码项目,经过使用Log4j,咱们能够控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务器、NT的事件记录器、UNIX Syslog守护进程等;咱们也能够控制每一条日志的输出格式;经过定义每一条日志信息的级别,咱们可以更加细致地控制日志的生成过程。最使人感兴趣的就是,这些能够经过一个配置文件来灵活地进行配置,而不须要修改应用的代码。
 
 
第二步就写到这里,供你们参考。有须要交流的能够加QQ: 1q7q1q5q3q6q0q1q8(去掉中间的q)。
 
 
 



相关文章
相关标签/搜索