基于GIScript和GeoIP进行访问网址的地理定位分析

    经过网页访问日志分析使用者的地址,而后将其放到地图上,分析访问来源的热区从而获得用户的地图分布,是否是颇有用、也很酷?这里介绍个使用GIScript和GeoIP来进行访问网址的地理定位的例子。数据库

    这个功能虽然看起来简单,但其实要分为不少个环节的。下面详述:服务器

  •     一、首先是获取IP地址,这个很少说了。在Web服务器的RequestHeaders中都有,也能够经过日志进行提取。从文件中提取能够批量处理,而从访问信息中提取而后直接发送到消息总线或NoSQL之类的高效率存储系统能够实现实时的处理。网络

  •     二、使用GeoIP讲域名或IP地址解析为地名。GeoIP是MaxMind开发的用于IP到地址的解析工具,包括软件和IP数据库。免费版的定位较粗,而付费版的能够实现较高精度的定位。并发

  •     三、将地名经过地理编码(Geocoding)功能转换为空间坐标或空间几何对象,须要软件和地图数据的共同支持。这个之前是专业GIS才有的功能,如今google/百度都提供在线服务接口。可是由于在线的有不少限制(网络带宽、并发控制、帐号等等),这里使用GIScript这个工具来作。由于与GeoIP都有Python库,很容易集成到一块儿。若是须要大批量的处理,再假设一个Celery进行并行处理就OK了。工具

  •     四、统计空间数据库中的数据样本的频度和其它属性,生成专题图或中间结果,能够输出图件或者将数据传送到R中继续进行高级分析,产生统计图表。google

  •     五、R分析的结果可使用GIScript反向保存回空间数据库,进一步进行高级专题图的制做。编码

    这个流程能够用到不少应用场景中,好比用户分析、反欺诈、搜索分析、市场分析等等。日志

    后面进行具体的攻略研究,未完待续。
对象

相关文章
相关标签/搜索