有没有好的库可以从Python访问HBase?

14 投票
4 回答
10286 浏览
提问于 2025-04-15 21:45

我花了一些时间四处查找,结果只找到Jython。这个选项可以,但有没有更简单、更像Python的方式呢?

4 个回答

3

顺便说一下,我正在尝试在 http://github.com/hammer/pyhbase 上启动一个项目。现在这个项目还很粗糙,但我会在接下来的几周里慢慢完善它。我这里还链接了我最初使用的Mozilla客户端。

8

Stargate 目前还在 Hbase 项目的贡献部分,而 ThriftServer 则是在核心部分维护的(org.apache.hadoop.hbase.thrift)。你可以从代码库中获取 HBase.thrift 文件,然后运行

thrift --gen py HBase.thrift,把生成的内容放到你想放的地方,然后启动一个 thrift 服务器。

不过,Stargate 的速度非常慢。HBase 的 thrift 还有一些需要改进的地方,但它仍在积极开发中。

如果你想入门,可以看看以下几个地方:

http://wiki.apache.org/hadoop/Hbase/ThriftApi

4

你可以试试thrift的Python绑定,不过这个项目看起来已经不再更新了。我的建议是先启动HBase的REST服务器,然后用Python的标准库来访问这个RESTful网络服务。

撰写回答