pyspark使用-dataframe操做

时间 2019-11-11

标签 pyspark 使用 dataframe 栏目 Spark 繁體版

原文原文链接

1、读取csv文件sql

1.用pandas读取app

import pandas as pd
from pyspark.sql import SparkSession
spark=SparkSession.builder.appName("test").getOrCreate()
f=pd.read_csv("filePath")
df=spark.createDataFrame(f)

可是pandas和spark数据转换的时候速度很慢，因此不建议这么作ui

2.直接读取spa

spark.read.format("csv").options(header="True",sep=",",encoding="utf-8",inferschema='true').load("path")

相关文章

相关标签/搜索

dataset&dataframe

Update误操做

Hibernate教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<