1、获取html
http://dumps.wikimedia.org/ git
enwiki(英文)zhwiki(中文)github
指导文档:数据库
https://www.cs.bgu.ac.il/~elhadad/nlp12/jwpl/wikification.html数据结构
2、处理eclipse
参考:https://dkpro.github.io/dkpro-jwpl/HowToGetJWPL/编码
Cmd问题不太好解决(主要是看不懂改不了) 选择了eclipsespa
配置问题包括:.net
Jdk 环境设置(系统及eclipse)3d
Vm环境设置(eclips.ini)https://dkpro.github.io/dkpro-jwpl/DeveloperSetup/
数据结构设置(文件位置)
仔细阅读官方文档 各文件位置也很重要
他在运行。。。。。
等待ing(3小时吧)
结束
3、建立相应的数据库
1建立数据库命令(数据库名DB_NAME能够自行设定):注意要保证建立的数据库的编码是utf-8
CREATE DATABASE WIKI2019 DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
后面按你们的来,没什么问题不写了
参考(感谢):