如何检索类似命名的csv文件并使用它们创建数据帧

2条回答

网友

1楼 · 编辑于 2024-05-26 16:28:02

在Pandas上构建的Dask库具有将多个csv一次加载到单个数据帧的方法。你知道吗

网友

2楼 · 编辑于 2024-05-26 16:28:02

我认为你真正的问题是如何把所有的文件放到一个数据框中
使用标准库的pathlib处理文件。
- Python 3's pathlib Module: Taming the File System
由于您的csv文件是相同的，如您在问题中所述，将它们全部组合到一个数据帧中，然后一次清除所有数据会更有效。
- 单独清理每个数据帧，然后将它们合并，效率较低

得到一个单一的，组合的数据帧

from pathlib import Path
import pandas as pd

p = Path(r'c:\some_path_to_files')  # set your path
files = p.glob('nba*.csv')  # find your files

# It was stated, all the files are the same format, so create one dataframe
df = pd.concat([pd.read_csv(file) for file in files])

[pd.read_csv(file) for file in files]是一个列表理解，它为每个文件创建一个数据帧。你知道吗
pd.concat组合列表中的所有文件

要获取单独的数据帧：

创建数据帧的dict
每个key的dict将是一个文件名

p = Path(r'c:\some_path_to_files')  # set your path
files = p.glob('nba*.csv')  # find your files

df_dict = dict()
for file in files:
    df_dict[file.stem] = pd.read_csv(file)

使用`df_dict`:

df_dict.keys()  # to show you all the keys

df_dict[filename]  # to access a specific dataframe

# after cleaning the individual dataframes in df_dict, they can be combined
df_final = pd.concat([value for value in df_dict.values()])

得到一个单一的，组合的数据帧

要获取单独的数据帧：

使用`df_dict`:

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何检索类似命名的csv文件并使用它们创建数据帧

得到一个单一的，组合的数据帧

要获取单独的数据帧：

使用df_dict:

相关问题 更多 >

编程相关推荐

热门问题

热门文章

使用`df_dict`:

相关问题更多 >