若是要使用Python来链接Presto,就须要相关的驱动包。
目前发现有两个驱动包,分别是:
pyhive : https://github.com/dropbox/PyHive
presto-python-client : https://github.com/prestodb/presto-python-client
其中第二个是Presto官方本身弄的,不过使用率没有pyhive高。在Superset中也是用pyhive来链接的,并且pyhive能够集成到sqlalchemy里,从而无缝地衔接pandas。python
下面就简单介绍一下怎么用pyhive来链接presto。
sqlalchemy提供了一个统一的链接方式,很是
pyhive实质是安装了一个驱动,因此任何python里能建立通常化的数据库链接的模块均可以用来建立Presto链接。
安装pyhive后,就能够执行下面的代码。git
from sqlalchemy import * from sqlalchemy.engine import create_engine from sqlalchemy.schema import * import pandas as pd # Presto engine = create_engine('presto://host:port/hive/my_schema') # host是服务器ip,port是端口,hive指的是Presto的catalog,my_schema是hive的schema。 df = pd.read_sql("select * from test",engine) # 和通常pandas从数据库中读取数据无任何区别,分析师们应该很是熟悉了。 print(df)