利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱python
python3.6.5
windows10
具体包依赖能够参考文件requirements.txtgit
pip install -r requirements.txt
Excel数据结构以下github
经过函数data_extraction和函数relation_extrantion分别抽取构建知识图谱所须要的节点数据以及联系数据,构建三元组。
数据提取主要采用pandas将excel数据转换成dataframe类型
invoice_neo4j.py
数据库
DataToNeo4jClass.py
windows
详细内容请到github上下载 项目地址数据结构
数据驱动变革-云将 我的博客地址函数