Pandas在大环境下阅读

1条回答

网友

1楼 · 发布于 2024-05-29 05:10:25

您可以使用以下技术：

pd.read_hdf(filename, 'key', where='index = vals')

其中vals是pd.Series或Python list变量

也可以使用属于其他DF的列进行筛选：

^{pr2}$

或其他DF的索引：

In [203]: pd.read_hdf(fn, 'test', where='index = another_df.index').shape
Out[203]: (100, 3)

演示：

设置

fn = r'D:\temp\.data\hdf\test.h5'

store = pd.HDFStore(fn)

df = pd.DataFrame(np.random.randint(0, 10**4, size=(10**5, 3)), columns=list('abc'))

store.append('test', df, data_columns=True, complib='blosc', complevel=5)

store.close()

试验

vals = pd.Series(np.random.randint(0, 100, 500))

In [196]: pd.read_hdf(fn, 'test', where='index = vals').shape
Out[196]: (98, 3)

与Python列表相同：

idx_list = vals.tolist()

In [197]: pd.read_hdf(fn, 'test', where='index = idx_list').shape
Out[197]: (98, 3)

编程相关推荐

windows请帮助获取java。运行程序时发生lang.nullpointerexception
JPA标准中的错误：java。lang.IllegalArgumentException:此JPQLquery中没有名为“：inputMsgId_1_”的参数
java调度一个小程序，从ScheduledExecutorService开始
java点击AVD“创建设备”按钮抛出NullPointerException
缓存Java9WebStart会多次加载jar文件
使用java计算最小二乘
当代理关闭时，java kafka生产者不会抛出异常
我们什么时候以及为什么要在java中进行自定义序列化？
java使用GSON解析包含包含所需字符串的对象的对象数组
java如何使用BOBJ REST API实现分页？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas在大环境下阅读

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >