我已经创建了一个hdf存储。
HDFStore包含一个组df
,它是一个有2列的表。
第一列是string
,第二列是DateTime
(将按排序顺序排列)。
已使用以下方法创建存储:
创建HDF5文件后,我将使用以下方法查询表:
^{pr2}$基本上这需要13.2秒,然后我使用
In [2]: store.create_table_index('df', columns=['ts'], kind='full')
然后我又做了同样的查询,这次我得到了以下内容:在
In [3]: %timeit store.select('df', ['ts>Timestamp("2016-07-12 10:00:00")'])
1 loops, best of 3: 12 s per loop
综上所述,在我看来,性能没有明显改善。所以,我的问题是,我还能做些什么来加快我的查询速度,还是我做错了什么?在
我想当您指定
data_columns=True
时,您的列已经被索引了。。。在请看这个演示:
未指定
^{pr2}$data_columns
,因此只索引索引:data_columns=True
-所有数据列都已编制索引:data_columns=True, index=False
-我们有数据列信息,但没有它们的索引:colindexes
-显示以上示例中的索引列列表相关问题 更多 >
编程相关推荐