python/pandas复制文件名

2024-04-16 22:56:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试用pandas自动清理一些数据。在

我在一个文件夹中有几个单独的.csv文件。我想将所有这些csv文件读入一个dataframe,然后在df中创建一个ID列,其中的值将是每个csv文件的名称。在

假设使用glob读取以下文件:
1.csv
2.csv
3.csv

rawfiles = glob.glob(path + "/*.csv")
tempframe = []
for file_ in rawfiles: 
    df = pd.read_csv(file_, header=0)
    tempframe.append(df)

但是在将它们连接到一个数据帧之前,我想添加一个ID列,并将每个文件的名称作为其值(即,123等)

我该怎么做呢?在


Tags: 文件csv数据path文件夹名称iddataframe
1条回答
网友
1楼 · 发布于 2024-04-16 22:56:22

编辑:误读了你的问题。我将ID设置为每个文件的名称减去最后4个字符(.csv)

rawfiles = glob.glob(path + "/*.csv")
tempframe = []
for file_ in rawfiles:  
    df = pd.read_csv(file_, header=0)
    df["ID"] = file_[:-4] 
    tempframe.append(df)

相关问题 更多 >