(数据科学学习手札93)利用geopandas与PostGIS进行交互

本文完整代码及数据已上传至个人Github仓库https://github.com/CNFeffery/DataScienceStudyNotesgit

1 简介

  PostGIS做为postgresql针对地理空间数据的拓展功能,能够帮助咱们有效管理和固化空间矢量数据,以及开展空间数据分析,而geopandas做为Python生态中优秀的空间数据分析处理工具,天然在与PostGIS进行交互方面开发了相应的功能。github

  本文就将针对如何利用geopandasPostGIS空间数据库写入及读取矢量数据进行介绍。sql

图1

2 geopandas与PostGIS进行交互

  为了能在geopandas中与postgresqlPostGIS创建链接,请确保如下3个库已经安装:数据库

pip install sqlalchemy, psycopg2, geoalchemy2

  接下来咱们须要保证postgresql中存在能够链接的空间数据库,在pgAdmin界面内新建数据库,譬如这里咱们新建数据库demojson

图2
图3

  点击保存成功建立数据库以后,要注意这时咱们的demo数据库只是个普通的postgresql数据库,是不支持空间相关功能的,在对应数据库上右键打开查询工具:bash

图4

  在弹出的界面中输入CREATE EXTENSION postgis;并执行,成功以后咱们的数据库就变成了空间数据库,支持空间相关的各类功能:app

图5

  至此咱们的准备工做就已结束,接下来咱们就能够直接在geopandas中读写PostGIS数据表。工具

2.1 利用geopandas向PostGIS写入数据

  为方便演示,这里咱们以简化版的重庆市区县矢量面数据为例,首先咱们导入所需的geopandas(注意geopandas版本必须大于等于0.8.0)与sqlalchemy(后者用于建立数据库链接),并读入重庆市.geojson文件,你能够在开头的Github仓库找到它:post

图6

  接着咱们来演示如何经过geopandasPostGIS推送矢量信息表,使用到的API为to_postgis(),其主要参数以下:3d

name:字符型,用于指定推送到PostGIS后的表名称

consqlalchemy.engine.Engine对象,用于创建与数据库的链接

if_exists:字符型,用于指定当数据库中已存在同名表时的相应策略,'fail'表示抛出错误,'replace'指替换,'append'指向原表追加,默认为fail

schema:字符型,用于指定schema,默认为'public'

index:bool型,用于指定是否保留index信息

index_label:字符型或序列,当index被设置为True时为index信息指定字段名称

  首先须要利用sqlalchemy中的create_engine来建立数据库链接,传入字符串包含了数据库类型用户名密码主机IP端口以及数据库名称,格式为:

数据库类型://用户名:密码@主机IP:端口/数据库名称

  对应本例:

图7

  在pgAdmin中随即就能查看到刚才写入的数据表:

图8
图9

2.2 利用geopandas从PostGIS读取数据

  从PostGIS中读取数据要用到另外一个API,对应geopandasread_postgis(),其主要参数以下:

sql:字符型,对应从空间数据库中提取数据的SQL语句

con:同to_postgis()

geom_col:字符型,用于指定将哪一列做为GeoDataFrame的矢量列

crs:用于指定坐标参考系,同GeoDataFrame的坐标参考系设定方式

index_col:字符型或列表,用于指定将哪些列做为索引

parse_dates:列表,用于预解析时间类型数据

  接着咱们从PostGIS中读取刚才写入的表:

图10

  简简单单,咱们就实现了与PostGIS的交互。


  以上就是本文的所有内容,若有疑问欢迎在评论区与我讨论~

相关文章
相关标签/搜索