Spark Sql 分布式SQL引擎&&Pandas PySpark使用

Spark Sql 分布式SQL引擎 Spark SQL可使用其JDBC / ODBC或命令行界面充当分布式查询引擎。在这个模式下,用户或应用程序能够直接与Spark SQL交互以运行SQL查询,而无需编写任何代码。python 运行Thrift JDBC / ODBC服务器 对应HiveServer2 于Hive 1.2.1中的。可使用Spark或Hive附带的beeline脚本测试JDBC服务
相关文章
相关标签/搜索