apache drill的rest api的python包装器

drillp的Python项目详细描述


drillpy是apache drill的rest api的python包装器,它允许您直接从一个工作的drill集群/drillbit实例查询数据并将数据导入python。它是建立在请求、努比和熊猫之上的。

安装

pip install drillpy

用法

drillpy遵循python数据库api规范v2.0,因此它的用法与cpython标准库中内置的sqlite3模块中的用法非常相似。

与sqlite3一样,应该从创建连接对象开始,使用drillpy.connect():

从钻取导入连接

con=connect(host=“some_drillbit_host”,db=“some_database_managed_by_drill”,port=8047)

创建后,必须创建光标:

cur=con.cursor()

现在,您可以使用这个游标来编写针对钻取集群的sql查询。参数替换由问号处理?(与sqlite3一样):

query=cur.execute(“从mytable where somecolumn>;”中选择*?还有别的专栏?限值10“,(值,其他值))

结果将在pandas数据框中返回,而nans将丢失值。列类型将自动推断。可以使用fetchone()、fetchmany(size)和fetchall()检索结果。使用fetchone()返回熊猫系列,而不是数据帧:

返回_df=query.fetchall()

请记住,drillpy不能在表/数据库中插入新数据,因为drill本身是一个查询引擎,用于探索性数据分析和bi/可视化工具。

完成后,应调用connection.close():

con.close()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java 401在API URL上带有声明性Http客户端,并带有@Secured(SecurityRule.IS_ANONYMOUS)注释   java如何在Android中创建计时器?   Java8WebStart安全弹出窗口   java会通过以下两种方式导致堆空间耗尽吗?   java项目调度GA:染色体的高效数据结构   java Apache POI:如何在Excel文件中插入列   java在JRE系统库中每个jar扮演什么角色   java如何在抽象类中执行@mock(不是注入mock)   java如何使用opensearch和Lucene发送搜索查询?   java在ApachePOI中处理空列   java广播接收器未接收到目标   java错误ELF类:ELF类64(可能原因:体系结构字宽不匹配)   java调用Web服务(SSL)时出错   用于iot集线器设备固件更新的java Rest API   通过xslt将xml转换为文本文件时引发java异常   Java linux打印问题   Java XML转换器重复行   java从另一个类的方法将数组导入mainActivity类   多线程选择与Java交互的线程   我想在java程序中打印以下格式的文件: