Pandas/networkx图分析简单入门

 对于图论而言,你们或多或少有些了解,数学专业或计算机相关专业的读者可能对其更加清楚。图论中的图像是由若干给定的点及链接两点的线所构成的图形,这样的图像一般用来描述某些事物之间的某种特定关系,用点表明事物,用两点之间的链接线表示两者具备的某种关系,在互联网与通讯行业中应用普遍。图论分析(Graph analysis)并非数据科学领域中的新分支,也不是数据科学家目前应用的经常使用首选方法。然而,图论能够作一些疯狂的事情,一些经典用例包括欺诈检测、推荐或社交网络分析等,下图是 NLP中的非经典用例——处理主题提取。数据库

1

欺诈检测用例

       假设如今你有一个客户数据库,并想知道它们是如何相互链接的。特别是,你知道有些客户涉及复杂的欺诈结构,可是在我的层面上可视化数据并不会带来欺诈证据,欺诈者看起来像其余普通客户同样。
       只需查看原始数据,处理用户之间的链接就能够显示更多信息。具体而言,对于一般的基于机器学习的评分模型而言,这些特征不会被视为风险,但这些不会被认为存在风险的特征可能成为基于图表分析评分模型中的风险特征。网络

示例:三个具备相同电话号码的人,链接到具备相同电子邮件地址的其余人,这是不正常的,且可能存在风险。电话号码自己没有什么价值,并不会提供任何信息(所以,即便最好的深度学习模型也不能从中获取任何价值信息),但我的经过相同的电话号码或电子邮件地址链接这一问题,多是一种风险。机器学习

下面在Python中进行一些处理:学习

相关文章
相关标签/搜索