我在一个文件夹中有几个csv文件,我想在一个数据框中打开它们,并插入一个带有相关文件名的新列。到目前为止,我已经编写了以下代码:
import pandas as pd
import glob, os
df = pd.concat(map(pd.read_csv, glob.glob(os.path.join('path/*.csv'))))
df['filename']= os.path.basename(csv)
df
这给了我想要的数据帧,但在新列“filename”中,它只列出了文件夹中每一行的最后一个文件名。我正在寻找每一行都要填充它的相关csv文件。不仅仅是文件夹中的最后一个文件
非常感谢对这位新手的任何帮助
首先,您没有定义csv变量
但无论如何,这种行为是有意义的,因为您在最后使用csv,所以它将被设置为最后一个文件。 理想情况下,您可以再次使用glob获取所有文件名,然后将其设置为新列
我认为您需要^{} 在} 以删除
loop
中添加新列,还需要将参数ignore_index=True
添加到^{index
中的重复项:测试文件为a.csv、b.csv、c.csv
相关问题 更多 >
编程相关推荐