我有多个csv文件,其名称以数字顺序相似(nba\u 1、nba\u 2等)。就列名和数据类型而言,它们的格式都是相同的。有没有一种方法可以编写一个for
循环或类似的东西来将它们拉入并命名,而不是将每个循环分别拉入一个数据帧(nba_1 = pd.read_csv('/nba_1.csv'))
?我认为基本框架应该是这样的:
for i in range(1, 6):
nba_i = pd.read_csv('../nba_i.csv')
除此之外,我不知道细节。一旦我把它们拉进来,我将对它们中的每一个执行相同的操作(删除和格式化相同的列),所以我也想在那里遍历它们。你知道吗
事先谢谢你的帮助。你知道吗
在Pandas上构建的Dask库具有将多个csv一次加载到单个数据帧的方法。你知道吗
csv
文件是相同的,如您在问题中所述,将它们全部组合到一个数据帧中,然后一次清除所有数据会更有效。得到一个单一的,组合的数据帧
[pd.read_csv(file) for file in files]
是一个列表理解,它为每个文件创建一个数据帧。你知道吗pd.concat
组合列表中的所有文件要获取单独的数据帧:
dict
key
的dict
将是一个文件名使用
df_dict
:相关问题 更多 >
编程相关推荐