读取多个csv文件，并将文件名作为新列添加到文件中

2条回答

网友

1楼 · 编辑于 2024-04-26 22:31:52

首先，您没有定义csv变量

但无论如何，这种行为是有意义的，因为您在最后使用csv，所以它将被设置为最后一个文件。理想情况下，您可以再次使用glob获取所有文件名，然后将其设置为新列

#this is a Python list containing filenames
csvs = glob.glob(os.path.join('path/*.csv'))

#now set the csv into a pd series
csv_paths = pd.Series(csvs)

df['file_name'] = csv_paths.values

网友

2楼 · 编辑于 2024-04-26 22:31:52

我认为您需要^{}在loop中添加新列，还需要将参数ignore_index=True添加到^{}以删除index中的重复项：

测试文件为a.csv、b.csv、c.csv

import pandas as pd
import glob, os


files = glob.glob('samples_for_so/*.csv')
print (files)
#['samples_for_so\\a.csv', 'samples_for_so\\b.csv', 'samples_for_so\\c.csv']


df = pd.concat([pd.read_csv(fp).assign(New=os.path.basename(fp)) for fp in files])
print (df)
   a  b  c  d    New
0  0  1  2  5  a.csv
1  1  5  8  3  a.csv
0  0  9  6  5  b.csv
1  1  6  4  2  b.csv
0  0  7  1  7  c.csv
1  1  3  2  6  c.csv

files = glob.glob('samples_for_so/*.csv')
df = pd.concat([pd.read_csv(fp).assign(New=os.path.basename(fp).split('.')[0]) 
       for fp in files])
print (df)
   a  b  c  d New
0  0  1  2  5   a
1  1  5  8  3   a
2  0  9  6  5   b
3  1  6  4  2   b
4  0  7  1  7   c
5  1  3  2  6   c

相关问题更多 >

编程相关推荐

热门问题

热门文章

读取多个csv文件，并将文件名作为新列添加到文件中

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >