PySpark算子处理空间数据全解析(12)外篇: 在PySpark使用geoPandas及空间索引

上一篇我们用最简单粗暴的方法进行遍历,短短的几千个点对几十面的计算,居然用了40多秒,可见暴力遍历实际上是一种效率非常低的方法。   空间数据的快速查询,主要是通过索引来实现的,而空间分析发展了几十年,空间索引技术已经很成熟了,正如我一直强调的,我们没必要去自己造轮子,直接拿来主义就行。 有同学问,空间索引怎么用?这个问题问得好: GeoPandas可以快速的构建一个支持空间数据运算的DataFr
相关文章
相关标签/搜索