所以我用一个简单的数据集创建了hdf5文件,如下所示
>>> pd.read_hdf('STORAGE2.h5', 'table')
A B
0 0 0
1 1 1
2 2 2
3 3 3
4 4 4
使用此脚本
import pandas as pd
import scipy as sp
from pandas.io.pytables import Term
store = pd.HDFStore('STORAGE2.h5')
df_tl = pd.DataFrame(dict(A=list(range(5)), B=list(range(5))))
df_tl.to_hdf('STORAGE2.h5','table',append=True)
我知道我可以用
x = pd.read_hdf('STORAGE2.h5', 'table', columns=['A'])
或者
x = store.select('table', where = 'columns=A')
如何选择“A”列中等于3的所有值,或“A”列中带字符串的特定值或指示符,如“foo”?在pandas数据帧中,我将使用df[df["A"]==3]
或df[df["A"]=='foo']
如果我使用read_hdf()
或store.select()
,效率是否也会有所不同?
目前没有回答
相关问题 更多 >
编程相关推荐