决战大数据之巅:Spark、Dask、Vaex、Pandas的正面交锋

全文共3924字,预计学习时长15分钟 图源:unsplash   新的数据科学问题席卷而来时,首要问题是使用何种技术。广告宣传、标准工具、尖端技术、整个平台和现成的解决方案,都是备选项。 过去的几年里,笔者尝试使用各项技术来构建概念证明和解决方案。笔者注册试用新平台、试用任何大型云平台发布的新功能。当一项新技术出现时,笔者必然会浏览一些教程并在个人数据集上试用。 笔者决定比较各项数据整理技术,以
相关文章
相关标签/搜索