GIScript2016-Docker 数据导入教程

GIScript2016是支持Python3的地理空间数据处理和分析工具包,支持Jupyter和Spark,能够运行在单机以及大规模集群之上。这里介绍基于Docker的GIScript+Jupyter这一技术栈,使用其进行空间数据导入的具体过程,稍加修改后便可直接用于大量空间数据的批量处理。点击查看【完整数据导入源码】。docker

1. 准备工做-建立容器实例

在博文【GIScript2016-Docker上的Jupyter Notebook部署】和【GIScript2016-Docker 快速入门】中,分别介绍了将GIScript部署到Docker中,以及将这个容器镜像推送到DockerHub上,而后在联网的其它计算机中使用的方法。json

1.1 如今,咱们拉取所建立的GIScript2016容器:

docker pull openthings/gispark

1.2 建立GIScript的本地目录:

mkdir GISpark
cd GISpark

1.3 建立容器的运行实例:

docker run -it --name GISpark \
    -p 9000:8888 \
    --user root -e GRANT_SUDO=yes \
    -v /home/supermap/GISpark:/home/jovyan/work/GISpark \
    openthings/gispark

打开浏览器,输入:http://localhost:9000 ,便可看到Notebook的Web界面。浏览器

2. 建立一个新的Notebook

点取“New”按钮,选取“Python3”,建立一个新的Notebook。 建立新的Notebook服务器

2.1 导入GIScript库。

# coding: utf-8
import sys
from GIScript import GISCore, Data, Conversion

查看库的帮助,输入:工具

help(GISCore)

2.2 保存Notebook。

直接Ctrl+S(Mac OS为Command+S)便可保存当前的Notebook。 或者点击“保存”图标,或选择“File”->"Save",都可保存当前Notebook。测试

2.3 下载Notebook到本地。

选择“File”->“Download as”能够将当前的Notebook保存为多种格式,如:ipynb、HTML、reST、Markdown等等。spa

2.4 上传Notebook到服务器。

在主界面“Files”选项页点击“Upload”便可上传文件。能够在本地进行模型的开发和测试,而后上传到服务器上执行。.net

3. 建立UDB数据源

打开UDB数据源,若是不存在,将自动建立。code

def OpenDatasource(strType, strServer, strUser="", strPassword=""):
    dscn = Data.DsConnection()
    dscn.m_strType     = strType
    dscn.m_strServer   = strServer
    dscn.m_strUser     = strUser
    dscn.m_strPassword = strPassword

    ds = Data.DataSource()
    ds.SetDsConnection(dscn)

    bOpen = ds.Open()
    if bOpen:
        print("打开数据源成功!!")
        return ds
    else:
        print("打开数据源失败,请检查数据源连接信息!")
        return None

4. 导入空间数据

strUDB       = "DB/ConversionTest.udb"
ds = OpenDatasource("UDB", strUDB)       
bImport = ImportVector(ds, strShapePath, "fileSHP", "ModeGIS")
# 若是bImport == 1,导入成功,不然失败。

4.1 导入shape矢量文件

def ImportVector(ds, strFileName,strFileType, strImportMode):
    importParams = Conversion.ParamsManager.MakeImportParams(strFileType)
    importParams.m_strFilePath   = strFileName
    importParams.m_strImportMode = strImportMode
    
    dtImport = Conversion.DataImport()
    dtImport.SetParams(importParams)
    bImport = dtImport.ImportVector(ds)
    return bImport

4.2 导入tif影像文件

def ImportRaster(ds, strFileName,strFileType, strImportMode):
    importParams = Conversion.ImportParamsRaster()
    importParams.m_strFilePath   = strFileName
    importParams.m_strFileType   = strFileType
    importParams.m_strImportMode = strImportMode
    
    dtImport = Conversion.DataImport()
    dtImport.SetParams(importParams)
    bImport = dtImport.ImportRaster(ds)
    return bImport

4.3 导入csv格式文件

def ImportCSV(ds, strFileName, strImportMode, nIndexs = [], bHasFirst = False):
    importParams = Conversion.ImportParamsCSV()
    importParams.m_strFilePath   = strFileName
    importParams.m_strImportMode = strImportMode
    importParams.m_Indexs        = nIndexs
    importParams.m_bHasFirstRow  = bHasFirst
    
    dtImport = Conversion.DataImport()
    dtImport.SetParams(importParams)
    bImport = dtImport.ImportVector(ds)
    return bImport

4.4 导入json格式文件

ds = OpenDatasource("UDB", strUDB)
try:
    if ds != None:
        # 导入矢量(GeoJson)
        bImport = ImportVector(ds, strJsonPath, "fileGeoJson", "ModeGIS")
        if bImport == 1:
            print("数据导入GeoJson成功!!")
        else:
            print("数据导入GeoJson失败!!")
        ds.Close()
    else:
        print("打开数据源失败!")

except SystemExit:
    raise
except:
    sys.stderr.write("""An internal error occured.""")
    raise

点击查看【完整数据导入源码】。blog

相关文章
相关标签/搜索