apache drill的rest api的python包装器
drillp的Python项目详细描述
drillpy是apache drill的rest api的python包装器,它允许您直接从一个工作的drill集群/drillbit实例查询数据并将数据导入python。它是建立在请求、努比和熊猫之上的。
安装
pip install drillpy
用法
drillpy遵循python数据库api规范v2.0,因此它的用法与cpython标准库中内置的sqlite3模块中的用法非常相似。
与sqlite3一样,应该从创建连接对象开始,使用drillpy.connect():
从钻取导入连接
con=connect(host=“some_drillbit_host”,db=“some_database_managed_by_drill”,port=8047)
创建后,必须创建光标:
cur=con.cursor()
现在,您可以使用这个游标来编写针对钻取集群的sql查询。参数替换由问号处理?(与sqlite3一样):
query=cur.execute(“从mytable where somecolumn>;”中选择*?还有别的专栏?限值10“,(值,其他值))
结果将在pandas数据框中返回,而nans将丢失值。列类型将自动推断。可以使用fetchone()、fetchmany(size)和fetchall()检索结果。使用fetchone()返回熊猫系列,而不是数据帧:
返回_df=query.fetchall()
请记住,drillpy不能在表/数据库中插入新数据,因为drill本身是一个查询引擎,用于探索性数据分析和bi/可视化工具。
完成后,应调用connection.close():
con.close()