咱们用Python列了一份十年漫威角色清单,请查收!

网站是基于Graph技术开发的。数据库

其实以前小F也利用了有关Graph的库实现了一波人物的关系分析。json

只不过度析结果比较粗糙而已~app

下面是网站的概况,你们能够一览。学习


在这里仍是要推荐下我本身建的Python开发学习群:[304][050][799],群里都是学Python开发的,若是你正在学习Python ,小编欢迎你加入,你们都是软件开发党,不按期分享干货(只有Python软件开发相关的),包括我本身整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深刻Python的小伙伴!网站

那么人家能作出这么酷炫的关系图,咱们本身能不能实现呢?url

这一期就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。教程

/ 01 / 获取分析接口

人物及人物关联信息从网站上获取,具体接口以下。ip

数据为json格式,分别在「characters」和「relationship」中。ci

这里的信息是分别指托尼·斯达克,关系「0」为朋友斯蒂文·罗杰斯

/ 02 / 数据获取

具体代码以下。

import json

import requests

headers = {

'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

}

url = 'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'

response = requests.get(url=url, headers=headers)

result = json.loads(response.text)

num = 0

names =

item = {0: 'friend', 1: 'enemy', 2: 'creation', 3: 'family', 4: 'work', 5: 'love'}

for i in result['relationship']:

subject = result['relationship'][i]['id']

object = result['relationship'][i]['target_id']

if subject not in names:

names.append(subject)

if object not in names:

names.append(object)

relation = int(result['relationship'][i]['relationship'])

with open('relation_message.csv', 'a+') as f:

f.write(subject + ',' + object + ',' + item[relation] + '

')

for j in names:

num += 1

with open('names_message.csv', 'a+') as f:

f.write(j + ',' + str(num) + '

')

for k in result['characters']:

id = result['characters'][k]['id']

name = result['characters'][k]['name']

status = result['characters'][k]['status']

species = result['characters'][k]['species']

with open('message.csv', 'a+') as f:

f.write(id + ',' + name + ',' + status + ',' + species + '

')

最后成功获取数据。

人物名为简称,共计182我的物。

1144条人物关系数据,4大类型。

下面是182我的物的一些详情信息。

包含了人物的名字及简称,存活状态,人物属性。

/ 03 / 数据可视化

下面经过Neo4j对人物关系进行可视化。

Neo4j的安装这里就不细说了,你们能够自行百度。

开启Neo4j服务后,登录Neo4j网站,初始化界面以下。

先加载第一个文件。

具体代码以下。

LOAD CSV WITH HEADERS FROM 'file:///names_message.csv' AS data CREATE (:people{name:data.name, id:data.id});

下面加载第二个文件。

具体代码以下。

LOAD CSV WITH HEADERS FROM "file:///relation_message.csv" AS relations

MATCH (entity1:people{name:relations.subject}) , (entity2:people{name:relations.object})

CREATE (entity1)-[:rel{relation: relations.relation}]->(entity2)

点击1144按钮处,取消限制数,再点击全屏。

这里大体能看出来漫威的人物汇集状况。

第一大反派灭霸(thanos),原来这么孤立的。

这里因为人物太多,形成观察不便,因此对结果进行一些筛选。

好比筛选托尼·斯达克的朋友,运行下面的代码。

match p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]-> return p;

获得下图结果。

其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。

下面再来看一下美队的女朋友吧。

佩吉·卡特和她的侄女莎朗·卡特,听说两人样貌极为相像。

/ 04 / 总结

本次只是对Neo4j的一些简单操做,后期或许会去深刻了解。

此外漫威的这些人物信息,还能够玩出不少花样的。

也但愿你们能去动手尝试尝试,作一枚硬核铁粉~

-The End-

将门是一家以专一于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年末,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务专一于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群专一于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门创投基金专一于投资经过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、天然人机交互、企业计算。在三年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具备高成长潜力的技术型创业公司。

相关文章
相关标签/搜索