使用datafram合并CSV

2024-03-28 10:54:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用下面的代码。我所有的CSV文件都有统一的结构。形成数据帧时,它包含两列my CSV中的日期。你知道吗

在结果数据框中,对于少数行,日期值位于第一个日期列中,而对于其余数据,日期值位于第二个日期列中。你知道吗

你知道为什么要为源CSV文件中的一列生成两列(日期列)吗。你知道吗

all_data = pd.DataFrame()
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"):
    df = pd.read_csv(f)
    all_data = all_data.append(df,ignore_index=True)

In [76]: all_data.columns
Out[76]: Index(['0', '0.1', 'Channel_ID', 'Date', 'Date ', 'Duration (HH:MM)','Episode #', 'Image', 'Language', 'Master House ID', 'Parental Rating','Program Category', 'Program Title', 'StartTime_ET', 'StartTime_ET2','Synopsis'],
 dtype='object')

Tags: 文件csv数据代码iddfdatadate
1条回答
网友
1楼 · 发布于 2024-03-28 10:54:21

因为第二列有空格:

'Date', 'Date '
             ^

所以在追加之前需要对列进行标准化

all_data = pd.DataFrame()
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"):
    df = pd.read_csv(f)
    df.columns = df.columns.str.strip()
    all_data = all_data.append(df,ignore_index=True)

这里我使用^{}删除任何前导和尾随空格

相关问题 更多 >